-
Lấy mẫu song song: Khởi tạo truy vấn đa dạng cho tìm kiếm chủ động
Beyond Parallel Sampling: Diverse Query Initialization for Agentic Search
-
Khi quy tắc học: Một tác nhân tự tiến hóa cho việc tìm kiếm vụ án pháp lý
When Rules Learn: A Self-Evolving Agent for Legal Case Retrieval
-
SkillChain-Gym: Một điểm chuẩn cho kiểm soát sản xuất-hàng tồn kho với sự gián đoạn
SkillChain-Gym: A Benchmark for Reskilling-Aware Production-Inventory Control under Disruptions
-
Kiểm soát dự báo mô hình dựa trên kỹ năng cho chuỗi cung ứng sản xuất linh hoạt
Skill-Constrained Model Predictive Control for Resilient Manufacturing Supply Chains
-
Không có gì từ không có gì: Liệu một mô hình ngôn ngữ có thể khám phá ra 0?
Nothing from Something: Can a Language Model Discover 0?
-
Đo lường sự nhất quán trong推 lý logic của mô hình ngôn ngữ lớn thông qua不 chắc chắn cấu trúc
Quantifying Consistency in LLM Logical Reasoning via Structural Uncertainty
-
MemTrace: Khám phá những gì độ chính xác cuối cùng bỏ lỡ trong bộ nhớ dài hạn
MemTrace: Probing What Final Accuracy Misses in Long-Term Memory
-
SpeechDx: Một điểm chuẩn đa nhiệm cho trí tuệ nhân tạo ngôn ngữ lâm sàng
SpeechDx: A Multi-Task Benchmark for Clinical Speech AI
-
Mạng tác nhân tổng quát phân tán: Kiến trúc, cơ chế chính và nguyên mẫu
Distributed General-Purpose Agent Networks: Architecture, Key Mechanisms, and Prototypes
-
Hệ Thống Hỗ Trợ Ra Quyết Định Lâm Sàng Thông Minh Thông Qua Mô Phỏng Kép Số
Treatment Response Optimized Clinical Decision Support AI System via Digital Twin Simulation
-
Ưu Thế Của Nhà Cung Cấp Đã Thành Lập: Sự Thể Hiện Của Thiếu Hụt Nhãn Hiệu Và Sự Khai Thác Nhận Thức Trong Hệ Thống Khuyến Nghị LLM
Incumbent Advantage: Brand Bias and Cognitive Manipulation Dynamics in LLM Recommendation Systems
-
Chỉ Số Đồng Bệnh Học Được Học Máy
A Machine-Learned Comorbidity Index
-
MapSatisfyBench: Đánh Giá Các Đại Lý Bản Đồ Thông Qua Các Yếu Tố Quyết Định Ngầm Dựa Trên Hành Vi
MapSatisfyBench: Benchmarking Satisfaction-Aware Map Agents through Behavior-Grounded Implicit Decision Factors
-
Phân Tích Hành Vi Mô Hình Thông Qua Lộ Trình Của Đại Lý
Dissecting model behavior through agent trajectories
-
LLM Có Thể Là CEO? Đánh Giá Phân Bổ Nguồn Lực Chiến Lược Với Mô Phỏng Đại Lý Đa Vai Trò
Can LLMs Be CEOs? Benchmarking Strategic Resource Reallocation with Multi-Role Agent Simulation