-
GITCO: Tối Ưu Hóa Context Thời Gian Thực Tại Thời Điểm suy Luận Trong TSFMs
GITCO: Gated Inference-Time Context Optimization in TSFMs
-
Dự Báo Hành Vi Chức Năng Và Đánh Giá Mệt Mỏi Vật Liệu Có Ý Thức Không Certain Cho Nhà Máy Tái Chế
Uncertainty Aware Functional Behavior Prediction and Material Fatigue Assessment for Circular Factory
-
SentinelBench: Một Benchmark Cho Các Đại Lý Giám Sát Chạy Lâu
SentinelBench: A Benchmark for Long-Running Monitoring Agents
-
Một Khung AI Có Thể Diễn Giải Và Tin Cậy Cho Các Nghiên Cứu Liên Quan Cấu Trúc-Đau Lớn Quy Mô Lớn Sử Dụng Dữ Liệu Từ Sáng Kiến Osteoarthritis Initiative (OAI)
An interpretable and trustworthy AI framework for large-scale longitudinal structure-pain association studies using data from the Osteoarthritis Initiative (OAI)
-
Lý luận tương phản tổng hợp cho câu hỏi và trả lời đa bảng
Synthetic Contrastive Reasoning for Multi-Table Q&A
-
Tính ổn định vs Tính dễ thao túng: Đánh giá độ bền dưới tương tác sau quyết định trong các thẩm phán LLM
Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges
-
Mô hình dư cho nén dữ liệu khoa học độ trung thực cao
Residual Modeling for High-Fidelity Learned Compression of Scientific Data
-
LeanMarathon: Hướng tới các nhà toán học AI đáng tin cậy thông qua tự động hóa Lean dài hạn
LeanMarathon: Toward Reliable AI Co-Mathematicians through Long-Horizon Lean Autoformalization
-
Khai thác các tác nhân tổng quát cho chuỗi thời gian được ngữ cảnh hóa
Harnessing Generalist Agents for Contextualized Time Series
-
Kỳ thi cuối cùng của các tác nhân
Agents' Last Exam
-
Đột biến không có biến thể: Động lực hội tụ trong tiến hóa chương trình LLM
Mutation Without Variation: Convergence Dynamics in LLM-Driven Program Evolution
-
Kiến trúc động lực cho AGI đối thoại
A Motivational Architecture for Conversational AGI
-
Người hâm mộ AI đang chạy đua với thời gian, người hoài nghi AI đang chạy đua với hỗn loạn
AI enthusiasts are in a race against time, AI skeptics are in a race against entropy
-
Thực tế: Đánh giá cuối cùng — Lukas Petersson và Axel Backlund của Andon Labs
Reality: The Final Eval — Lukas Petersson and Axel Backlund of Andon Labs
-
Bài thuyết trình AI 20 phút cho công ty Thụy Điển Sana
My twenty-minute AI talk for the Swedish company Sana
-
Trích dẫn Emanuel Maiberg, 404 Media
Quoting Emanuel Maiberg, 404 Media
-
Alex Imas và Phil Trammell – Điều gì còn khan hiếm sau AGI?
Alex Imas and Phil Trammell – What remains scarce after AGI?
-
Liên kết đa dạng ngày thứ Năm
Thursday assorted links
-
Mất bao lâu để lên kế hoạch xây cầu?
How Long Does It Take to Plan a Bridge?
-
opendataloader-project/opendataloader-pdf
-
lyogavin/airllm
-
HexStrike AI: Tăng cường bảo mật với AI
0x4m4/hexstrike-ai
-
Hiring Agent: Đánh giá hồ sơ xin việc bằng AI
interviewstreet/hiring-agent
-
EbookFoundation: Sách lập trình miễn phí
EbookFoundation/free-programming-books
-
NVIDIA-NeMo/Gym: Đánh giá và cải thiện mô hình bằng môi trường
NVIDIA-NeMo/Gym
-
TanStack/query: Quản lý trạng thái bất đồng bộ
TanStack/query
-
yangshun/tech-interview-handbook: Chuẩn bị phỏng vấn công nghệ
yangshun/tech-interview-handbook
-
Endava Đang Tái thiết Kế hoạch Giao hàng Phần mềm xung quanh Trợ lý AI
How Endava is redesigning software delivery around AI agents
-
Dreaming: Bộ nhớ tốt hơn cho ChatGPT hữu ích hơn
Dreaming: Better memory for a more helpful ChatGPT
-
Được rèn luyện trong một cuộc chiến dao: Cuộc cạnh tranh AI nội địa tàn bạo của Trung Quốc
Forged in a Knife Fight: China’s Brutal Domestic AI Competition
-
Giáo sư luật thích AI hơn câu trả lời của đồng nghiệp
Law professors prefer AI over peer answers
-
Cuộc chạy marathon sắp tới của Quân đội Mỹ
The American Military’s Coming Marathon
-
Đảm Bảo Trước Khi Đưa Dịch Vụ AI Vào Sản Xuất
Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification
-
Tìm Kiếm Sự Tương Tác Cảm Xúc Giữa Con Người Và AI
Stumbling Into AI Emotional Dependence: How Routine AI Interactions Reshape Human Connection
-
Tìm Kiếm Sự Tương Tác Cảm Xúc Giữa Con Người Và AI
Thinking Through Signs: PEEL as a Semiotic Scaffolding for Epistemically Accountable AI-Enabled Research
-
SMAC-Talk: Mở rộng ngôn ngữ tự nhiên của thử thách StarCraft Multi-Agent cho các mô hình ngôn ngữ lớn
SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models
-
Đồng thuận không đủ về mặt chiến lược: Bất đồng trong dấu vết suy luận như một tín hiệu biểu diễn tri thức
Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal
-
VAMPS: Bộ tiêu chuẩn giải quyết vấn đề toán học có hỗ trợ hình ảnh
VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark
-
StepPRM-RTL: Tinh chỉnh LLM theo hướng dẫn thưởng quy trình từng bước để tăng cường tổng hợp RTL
StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis
-
Liệu các tác nhân tổng quát có thể tự động hóa việc tuyển chọn dữ liệu?
Can Generalist Agents Automate Data Curation?
-
Đặc điểm hóa quy trình hình thức hóa chứng minh ban đầu giữa người và AI
Characterizing initial human-AI proof formalization workflows
-
Bẫy bão hòa và tính chủ quan của thời điểm can thiệp: Tại sao các tác nhân dựa trên cảm xúc và LLM không thể định thời điểm can thiệp vào tác nhân tự chủ
The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents
-
Khám phá tính tổng quát đa kịch bản của hệ thống bộ nhớ tác nhân: Chẩn đoán và một đường cơ sở mạnh mẽ
Exploring Cross-Scenario Generality of Agentic Memory Systems: Diagnostics and a Strong Baseline
-
Người học việc kỹ thuật số: Một khuôn khổ cho phát triển AI tác nhân do con người định hướng
The Digital Apprentice: A Framework for Human-Directed Agentic AI Development
-
Học kỹ năng trực tuyến cho tác nhân web thông qua truy xuất động dựa trên trạng thái
Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval
-
Không phải tất cả các lỗi đều giống nhau: Phân bổ tài nguyên tính toán dựa trên hậu quả
Not All Errors Are Equal: Consequence-Aware Reasoning Compute Allocation
-
Trivium: Hối tiếc thời gian như một mục tiêu hàng đầu cho các bộ điều khiển nhớ nguyên nhân
Trivium: Temporal Regret as a First-Class Objective for Causal-Memory Controllers
-
Phát hiện sớm bệnh Alzheimer sử dụng học máy giải thích được trên các dấu hiệu lâm sàng
Early Detection of Alzheimer's Disease Using Explainable Machine Learning on Clinical Biomarkers: A Multi-Class Classification Study Using the Alzheimer's Disease Neuroimaging Initiative (ADNI) Dataset
-
Các khía cạnh mới của định dạng số học IEEE SA P3109 cho học máy
Novel Aspects of IEEE SA P3109 Arithmetic Formats for Machine Learning
-
Vị trí: Học tăng cường nên được triển khai liên tục
Position: Deployed Reinforcement Learning should be Continual