-
Làm Thế Nào Để Đánh Giá Mô Hình Thế Giới?
How Should World Models Be Evaluated? A Decision-Making-Centric Position
-
Trích Dẫn Matteo Wong, The Atlantic
Quoting Matteo Wong, The Atlantic
-
[AINews] Satya trên Loopcraft: Xây dựng Hệ sinh thái Frontier
[AINews] Satya on Loopcraft: Building Frontier Ecosystems
-
Cloudflare CAPTCHA Trên Ít Nhất Một Ký Tự Ampersand
Cloudflare CAPTCHA on at least one ampersand
-
Dự đoán hành vi mô hình trước khi phát hành bằng cách mô phỏng triển khai
Predicting model behavior before release by simulating deployment
-
Tự động hóa dựa trên dữ liệu
Data-Driven Automation -- by Maryam Farboodi, Andrew J. Koh, Anchi Xia
-
Trách nhiệm pháp lý y tế tối ưu cho trí tuệ nhân tạo
Optimal Medical Liability for AI -- by Alex Chan
-
pytest-dev/pytest
-
meshery/meshery
-
GorvGoyl/Clone-Wars
-
Giới thiệu về Robot Tự động
Introduction-to-Autonomous-Robots/Introduction-to-Autonomous-Robots
-
skypilot-org/skypilot
-
home-assistant/core
-
Ar9av/obsidian-wiki
-
hydralauncher/hydra
-
sindresorhus/type-fest
-
nrwl/nx
-
prisma/prisma
-
datasette-agent 0.3a0
-
"Họ đã lừa chúng tôi": Cái cớ về các xung đột cá nhân khiến mô hình của Anthropic bị tắt
"They screwed us": Personality clashes sent Anthropic's models offline
-
Mô hình Ngôn ngữ Lớn Mục đích Tổng quát Vượt trội so với Công cụ AI Lâm sàng Chuyên dụng trên Các Benchmark Y tế
General-purpose large language models outperform specialized clinical AI tools on medical benchmarks
-
Mạng lưới thần kinh có điều kiện thuộc tính dọc theo thời gian để mô hình hóa xác suất chuyển trạng thái sức khỏe
A Longitudinal Attribute-Conditioned Neural Network for Modeling Health-State Transition Probabilities in Temporally Irregular Data: The LANTERN Framework
-
Phương pháp Transformer dựa trên Học tăng cường sâu (DRL) để giải quyết vấn đề lịch trình mở
A Deep Reinforcement Learning (DRL)-Based Transformer Method for Solving the Open Shop Scheduling Problem
-
UP-NRPA: Phương pháp thích nghi chính sách cuộn lồng dựa trên chân dung người dùng cho hệ thống đối thoại định hướng mục tiêu
UP-NRPA: User Portrait based Nested Rollout Policy Adaptation for Planning with Large Language Models in Goal-oriented Dialogue Systems
-
Lịch Sử Của Đồ Họa Trẻ Em Bẩn
History of the Muddy Children Puzzle
-
Orchestra-o1: Điều Hành Đại Diện Omnimodal
Orchestra-o1: Omnimodal Agent Orchestration
-
Sự Tiến Hóa Triplet Mở Mở Ra Nghiên Cứu Sâu
Hybrid Open-Ended Tri-Evolution Makes Better Deep Researcher
-
WorkBench Được Xem Xét Lại: Các Đại Diện Nơi Làm Việc Hai Năm Sau
WorkBench Revisited: Workplace Agents Two Years On
-
Từ Chối Ngoài Một Hướng: So Sánh Preliminary Của Diff-in-Means và INLP
Refusal Beyond a Single Direction: A Preliminary Comparison of Diff-in-Means and INLP
-
YeasierAgent: Khu Vực Tương Tác Xã Hội Đại Diện Là Canvas Cho Sự Tạo Ra Ứng Dụng Đa Nền Tảng
YeasierAgent: Agentic Social Sandbox as a Canvas for Intent-Driven Creation of Platform-Agnostic Symbiotic Agent-Native Applications
-
TwinBI: Một Bản Sao Số Đại Diện Cho Tương Tác Hiệu Quả Với Bảng Điều Khiển Trí Tuệ Kinh Doanh
TwinBI: An Agentic Digital Twin for Efficient Augmented Interactions with Business Intelligence Dashboards
-
Khi Lựa Chọn Mẫu Gây Ra Sụp Đổ Mô Hình
When Sample Selection Bias Precipitates Model Collapse
-
Sự Nhận Thức Trí Tuệ Nhân Tạo Hay Sự Ứng Dụng Trí Tuệ Nhân Tạo?
AI Receptivity or AI Adoption Breadth? A Tool-Specific Reanalysis of the Lower-Literacy/Higher-Usage Link
-
MA-ProofBench: Đánh Giá Hai Tầng Của LLMs Cho Chứng Minh Định Lý Trong Phân Tích Toán Học
MA-ProofBench: A Two-Tiered Evaluation of LLMs for Theorem Proving in Mathematical Analysis
-
Poker Arena: Phân tích đa trục về lý luận chiến lược và bộ nhớ trong LLMs
Poker Arena: Multi-Axis Profiling of Strategic Reasoning and Memory in LLMs
-
Tính toán siêu chiều cho truy vấn cấu trúc trên dữ liệu bảng
Hyperdimensional computing for structured querying on tabular data embeddings
-
Tối thiểu hóa khả năng như một nguyên tắc an toàn: Cổng causal rủi ro cho các tác nhân LLM tối thiểu đặc quyền
Capability Minimization as a Safety Primitive: Risk-Aware Causal Gating for Least-Privilege LLM Agents
-
Có thể chỉnh sửa 1 nơ-ron để sửa lỗi lặp trong LLMs?
Can Editing 1 Neuron Fix Repetition Loops in LLMs?
-
Tính toán khuếch tán LLM hiệu quả trên thiết bị di động với NPU di động
Efficient On-Device Diffusion LLM Inference with Mobile NPU
-
Giá cả tần suất cao cho thương mại điện tử
High-Frequency Pricing at Scale for E-Commerce
-
Quy trình làm việc hoàn toàn dựa trên GPU để xây dựng mô phỏng vật lý dòng chảy siêu âm
A fully GPU-based workflow for building physics emulators of hypersonic flows
-
FedSPC: Sửa lỗi tham số chung cho học tập liên bang cá nhân hóa
FedSPC: Shared Parameter Correction for Personalized Federated Learning
-
Norm trọng lượng đặt thời gian Grokking: Luật trì hoãn nguyên nhân
The Weight Norm Sets the Grokking Timescale: A Causal Delay Law
-
D2H-AD: Mô hình lai sử dụng tính toán siêu chiều cho phát hiện bất thường tiên tiến
D2H-AD: A Hybrid Model Utilizing Hyperdimensional Computing for Advanced Anomaly Detection
-
Vượt qua LoRA: Liệu thích nghi do độ 稀 có tốt hơn?
Beyond LoRA: Is Sparsity-Induced Adaptation Better?
-
Tối ưu hóa chính sách khuếch tán mà không bị phân tâm
Diffusion Policy Optimization without Drifting Apart
-
Biến động thần kinh tăng cường độ bền của mạng nhân tạo
Neural Variability Enhances Artificial Network Robustness
-
Biến số lỏng lẻo thần kinh cho các ràng buộc hình dạng
Neural Slack Variables for Shape Constraints
-
Ước tính không chắc chắn và ranh giới tổng quát hóa cho học sâu hiện đại
Uncertainty Estimation and Generalization Bounds for Modern Deep Learning
-
Ước tính dựa trên sự chú ý của xác suất lợi ích điều trị cá nhân dưới sự thay đổi liều lượng
Attention-Based Estimation of the Individual Treatment Benefit Probability under Dose Variation