-
Lại một lần nữa, định dạng bài viết nghiên cứu sẽ chết
Again, the research paper format will be dying out
-
[AINews] Loopcraft: Nghệ thuật xếp chồng các vòng lặp
[AINews] Loopcraft: The Art of Stacking Loops
-
(Con người) Chú ý vẫn là yếu tố quyết định: Giám sát con người làm cho khoa học xã hội hỗ trợ AI đáng tin cậy
(Human) Attention Is (Still) All You Need: Human oversight makes AI-assisted social science reliable
-
ToolSense: Khung Chẩn Đoán Để Kiểm Toán Kiến Thức Công Cụ Tham Số Trong LLM
ToolSense: A Diagnostic Framework for Auditing Parametric Tool Knowledge in LLMs
-
Arbor: Tìm Kiếm Cây Như Lớp Nhận Thức Cho Tác Nhân Tự Hành
Arbor: Tree Search as a Cognition Layer for Autonomous Agents
-
Hỗ Trợ Quyết Định Chiến Lược Cho Tác Nhân AI
Strategic Decision Support for AI Agents
-
Pythagoras-Prover: Nâng Cao Chứng Minh Hình Thức Hiệu Quả Thông Qua Chuẩn Hóa Lean Tăng Cường
Pythagoras-Prover: Advancing Efficient Formal Proving via Augmented Lean Formalisation
-
PersonaDrive: Các tác nhân VLA tăng cường truy xuất kiểu con người cho mô phỏng lái xe vòng khép kín
PersonaDrive: Human-Style Retrieval-Augmented VLA Agents for Closed-Loop Driving Simulation
-
"Bạn có nói dối?" Đánh giá bộ phát hiện lời nói dối qua quy mô mô hình và sinh vật mô hình xác thực niềm tin
"Did you lie?" Evaluating Lie Detectors across Model Scale and Belief-Verified Model Organisms
-
TrajGenAgent: Tác nhân LLM phân cấp để tạo ra chuỗi di chuyển của con người
TrajGenAgent: A Hierarchical LLM Agent for Human Mobility Trajectory Generation
-
Evoflux: Tiến hóa quy trình công cụ thực thi tại thời điểm suy luận cho các tác nhân gọn nhẹ
Evoflux: Inference-Time Evolution of Executable Tool Workflows for Compact Agents
-
Từ AGI đến ASI
From AGI to ASI
-
Đánh giá tập trung vào triển khai: Dự đoán rủi ro từ chối truy vấn trong hệ thống LLM lâm sàng
Deployment-Centered Evaluation: Predicting Query-Level Rejection Risk in a Clinical LLM System
-
Căn chỉnh định nghĩa trước khi căn chỉnh khả năng: Khung Design-Science để đánh giá tuyên bố về AGI
Definitional alignment before capability alignment: a Design-Science framework for adjudicating claims about AGI
-
Lý thuyết về lợi ích của Theory of Mind: Đặc tả hình thức cơ chế suy đoán tâm lý
The Theory of Mind Utility: Formal Specification of a Mentalizing Mechanism
-
Suy nghĩ lại đánh giá tâm lý học của LLM: Khi nào và tại sao tự khai báo dự đoán hành vi
Rethinking Psychometric Evaluation of LLMs: When and Why Self-Reports Predict Behavior
-
Đánh giá các tác nhân AI cho các thách thức khoa học trên nhiều quy mô
Benchmarking AI Agents for Addressing Scientific Challenges Across Scales
-
Giảm độ phức tạp của mô hình Deep Learning cho phân tích EEG trên thiết bị đeo
Reducing the Complexity of Deep Learning Models for EEG Analysis on Wearable Devices
-
Cách Preply kết hợp AI và gia sư con người để cá nhân hóa việc học
How Preply combines AI and human tutors to personalize learning
-
Claude Fable luôn luôn chủ động không ngừng
Claude Fable is relentlessly proactive
-
activeloopai/hivemind: Một bộ não chung cho mọi tác nhân AI
activeloopai/hivemind
-
Sumanth077/Hands-On-AI-Engineering: Các dự án AI thực tế
Sumanth077/Hands-On-AI-Engineering
-
davila7/claude-code-templates: Công cụ CLI cho Claude Code
davila7/claude-code-templates
-
ml-explore/mlx-examples: Các ví dụ trong framework MLX
ml-explore/mlx-examples
-
RSSNext/Folo: Trình đọc RSS tích hợp AI
RSSNext/Folo
-
google-labs-code/design.md: Đặc tả định dạng cho tác nhân mã hóa
google-labs-code/design.md
-
datasette 1.0a33
-
Phỏng vấn Ben Bajarin về Apple, AI và Compute
An Interview with Ben Bajarin About Apple, AI, and Compute
-
asyncinject 0.7
-
Đặt cược sai lầm của Thung lũng Silicon vào Vùng Vịnh
Silicon Valley’s Bad Bet on the Gulf
-
Từ các yếu tố rõ ràng đến ý định ngầm: Thư viện được định nghĩa trước cho suy luận hành vi có thể kiểm tra
From Explicit Elements to Implicit Intent: A Predefined Library for Auditable Behavioral Inference
-
Vị trí: Bộ nhớ rõ ràng của Hippocampal là nền tảng cho Trí tuệ Tổng quát Nhân tạo (AGI)
Position: Hippocampal Explicit Memory Is the Cornerstone for AGI
-
Liệu các tác nhân AI có thể tổng hợp kết luận khoa học?
Can AI Agents Synthesize Scientific Conclusions?
-
Biết khi nào để hỏi: Tự làm rõ cho các tác nhân ngôn ngữ phân cấp
Knowing When to Ask: Self-Gated Clarification for Hierarchical Language Agents
-
Trọng tài tự động cho đàm phán con người: Giai đoạn tiền trọng tài thông qua đường ống LLM có cấu trúc
Automated Mediator for Human Negotiation: Pre-Mediation via a Structured LLM Pipeline
-
INFRAMIND: Điều phối đa tác nhân nhận thức về cơ sở hạ tầng
INFRAMIND: Infrastructure-Aware Multi-Agent Orchestration
-
Dự đoán hành vi tương lai như một nhiệm vụ học tập
Forecasting Future Behavior as a Learning Task
-
Kỷ luật tìm kiếm cho các tác nhân nghiên cứu dài hạn
Search Discipline for Long-Horizon Research Agents
-
MoCA-Agent: Tác nhân mã thị trường cho lý luận tài chính và số
MoCA-Agent: A Market-of-Claims Code Agent for Financial and Numerical Reasoning
-
SkillJuror: Đo lường cách tổ chức kỹ năng tác nhân thay đổi hành vi thời gian chạy
SkillJuror: Measuring How Agent Skill Organization Changes Runtime Behavior
-
HERO: Tự phân tích môi trường để cải thiện học tăng cường
HERO: Hindsight-Enhanced Reflection from Environment Observations for Agentic Self-Distillation
-
Kiến trúc nhận thức trong học tăng cường
Architecture-Aware Reinforcement Learning Makes Sliding-Window Attention Competitive in Math Reasoning
-
TouchThinker: Mở rộng lý luận cảm ứng đến thế giới mở
TouchThinker: Scaling Tactile Commonsense Reasoning to the Open World with Large-scale Data and Action-aware Representation
-
TreeSeeker: Tìm kiếm cây cấu trúc trong tìm kiếm sâu
TreeSeeker: Tree-Structured Trial, Error, and Return in Deep Search
-
Lung-R1: Mô hình ngôn ngữ lớn cho chẩn đoán bệnh phổi
Lung-R1: A Knowledge Graph-Guided LLM for Pulmonary Diagnostic Reasoning
-
Restless bandits với phản hồi nhị phân không hoàn hảo
Restless bandits with imperfect binary feedback: PCL-indexability analysis and computation
-
Hướng dẫn suy luận với trộn mô hình xác suất
To Intervene or Not: Guiding Inference-time Alignment with Probabilistic Model Blending
-
Đánh giá dual-stance cho sycophancy
Dual-Stance Evaluation of Sycophancy: The Structure of Agreement and the Limits of Intervention
-
Few-Shot Resampling cho khai thác dữ liệu có ý nghĩa thống kê
Few-Shot Resampling for Scalable Statistically-Sound Data Mining
-
ProHiFlo: Trộn dòng chảy phân cấp với hướng dẫn chức năng
ProHiFlo: Hierarchical Flow Matching with Functional Guidance for De Novo Protein Generation