-
Người hâm mộ AI đang chạy đua với thời gian, người hoài nghi AI đang chạy đua với hỗn loạn
AI enthusiasts are in a race against time, AI skeptics are in a race against entropy
-
Thực tế: Đánh giá cuối cùng — Lukas Petersson và Axel Backlund của Andon Labs
Reality: The Final Eval — Lukas Petersson and Axel Backlund of Andon Labs
-
Bài thuyết trình AI 20 phút cho công ty Thụy Điển Sana
My twenty-minute AI talk for the Swedish company Sana
-
Trích dẫn Emanuel Maiberg, 404 Media
Quoting Emanuel Maiberg, 404 Media
-
Alex Imas và Phil Trammell – Điều gì còn khan hiếm sau AGI?
Alex Imas and Phil Trammell – What remains scarce after AGI?
-
Liên kết đa dạng ngày thứ Năm
Thursday assorted links
-
Mất bao lâu để lên kế hoạch xây cầu?
How Long Does It Take to Plan a Bridge?
-
opendataloader-project/opendataloader-pdf
-
lyogavin/airllm
-
HexStrike AI: Tăng cường bảo mật với AI
0x4m4/hexstrike-ai
-
Hiring Agent: Đánh giá hồ sơ xin việc bằng AI
interviewstreet/hiring-agent
-
EbookFoundation: Sách lập trình miễn phí
EbookFoundation/free-programming-books
-
NVIDIA-NeMo/Gym: Đánh giá và cải thiện mô hình bằng môi trường
NVIDIA-NeMo/Gym
-
TanStack/query: Quản lý trạng thái bất đồng bộ
TanStack/query
-
yangshun/tech-interview-handbook: Chuẩn bị phỏng vấn công nghệ
yangshun/tech-interview-handbook
-
Endava Đang Tái thiết Kế hoạch Giao hàng Phần mềm xung quanh Trợ lý AI
How Endava is redesigning software delivery around AI agents
-
Dreaming: Bộ nhớ tốt hơn cho ChatGPT hữu ích hơn
Dreaming: Better memory for a more helpful ChatGPT
-
Được rèn luyện trong một cuộc chiến dao: Cuộc cạnh tranh AI nội địa tàn bạo của Trung Quốc
Forged in a Knife Fight: China’s Brutal Domestic AI Competition
-
Giáo sư luật thích AI hơn câu trả lời của đồng nghiệp
Law professors prefer AI over peer answers
-
Cuộc chạy marathon sắp tới của Quân đội Mỹ
The American Military’s Coming Marathon
-
Đảm Bảo Trước Khi Đưa Dịch Vụ AI Vào Sản Xuất
Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification
-
Tìm Kiếm Sự Tương Tác Cảm Xúc Giữa Con Người Và AI
Stumbling Into AI Emotional Dependence: How Routine AI Interactions Reshape Human Connection
-
Tìm Kiếm Sự Tương Tác Cảm Xúc Giữa Con Người Và AI
Thinking Through Signs: PEEL as a Semiotic Scaffolding for Epistemically Accountable AI-Enabled Research
-
SMAC-Talk: Mở rộng ngôn ngữ tự nhiên của thử thách StarCraft Multi-Agent cho các mô hình ngôn ngữ lớn
SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models
-
Đồng thuận không đủ về mặt chiến lược: Bất đồng trong dấu vết suy luận như một tín hiệu biểu diễn tri thức
Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal
-
VAMPS: Bộ tiêu chuẩn giải quyết vấn đề toán học có hỗ trợ hình ảnh
VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark
-
StepPRM-RTL: Tinh chỉnh LLM theo hướng dẫn thưởng quy trình từng bước để tăng cường tổng hợp RTL
StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis
-
Liệu các tác nhân tổng quát có thể tự động hóa việc tuyển chọn dữ liệu?
Can Generalist Agents Automate Data Curation?
-
Đặc điểm hóa quy trình hình thức hóa chứng minh ban đầu giữa người và AI
Characterizing initial human-AI proof formalization workflows
-
Bẫy bão hòa và tính chủ quan của thời điểm can thiệp: Tại sao các tác nhân dựa trên cảm xúc và LLM không thể định thời điểm can thiệp vào tác nhân tự chủ
The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents
-
Khám phá tính tổng quát đa kịch bản của hệ thống bộ nhớ tác nhân: Chẩn đoán và một đường cơ sở mạnh mẽ
Exploring Cross-Scenario Generality of Agentic Memory Systems: Diagnostics and a Strong Baseline
-
Người học việc kỹ thuật số: Một khuôn khổ cho phát triển AI tác nhân do con người định hướng
The Digital Apprentice: A Framework for Human-Directed Agentic AI Development
-
Học kỹ năng trực tuyến cho tác nhân web thông qua truy xuất động dựa trên trạng thái
Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval
-
Không phải tất cả các lỗi đều giống nhau: Phân bổ tài nguyên tính toán dựa trên hậu quả
Not All Errors Are Equal: Consequence-Aware Reasoning Compute Allocation
-
Trivium: Hối tiếc thời gian như một mục tiêu hàng đầu cho các bộ điều khiển nhớ nguyên nhân
Trivium: Temporal Regret as a First-Class Objective for Causal-Memory Controllers
-
Phát hiện sớm bệnh Alzheimer sử dụng học máy giải thích được trên các dấu hiệu lâm sàng
Early Detection of Alzheimer's Disease Using Explainable Machine Learning on Clinical Biomarkers: A Multi-Class Classification Study Using the Alzheimer's Disease Neuroimaging Initiative (ADNI) Dataset
-
Các khía cạnh mới của định dạng số học IEEE SA P3109 cho học máy
Novel Aspects of IEEE SA P3109 Arithmetic Formats for Machine Learning
-
Vị trí: Học tăng cường nên được triển khai liên tục
Position: Deployed Reinforcement Learning should be Continual
-
Giới hạn phổ cho sự khuếch đại tạm thời trong giảm gradient kết hợp
Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent
-
Liệu các bộ chuyển đổi cần ba phép chiếu?
Do Transformers Need Three Projections? Systematic Study of QKV Variants
-
Thiết kế thí nghiệm ngược chiều qua tối ưu hóa gradient và kiến trúc mạng thần kinh đa nhóm dựa trên sự chú ý
Inverse Critical Experiment Design via Gradient Optimization and a Multigroup Attention-Based Neural Network Architecture
-
Tính phân biệt chính sách tự phân ly
Self-Distilled Policy Gradient
-
Đại diện đủ theo Bayes trong học tập giám sát
Bayes-Sufficient Representations in Supervised Learning
-
Mở khóa học tập đặc điểm trong mạng delta có khóa có quy mô
Unlocking Feature Learning in Gated Delta Networks at Scale
-
LiftQuant: Bit-Width liên tục LLM qua nâng cấp và dự án chiều
LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection
-
RUBAS: Học động dựa trên rubric cho an toàn của đại diện
RUBAS: Rubric-Based Reinforcement Learning for Agent Safety
-
Xác định mục tiêu tập hợp của BTA trong đại số nhiệm vụ Boolean
A Goal-Set Characterization of Task Composition in the Boolean Task Algebra
-
Pháp luật quy mô của Muon
Spectral Scaling Laws of Muon
-
Nén LLM với các lựa chọn tối ưu hóa kiến trúc và lượng hóa đồng thời
LLM Compression with Jointly Optimizing Architectural and Quantization choices
-
TPA-AD: Phương pháp hướng dẫn bất thường hai giai đoạn cho phát hiện bất thường thời gian dòng của trục hộp
TPA-AD: A Two-Stage Pseudo Anomaly-Guided Method for Bearing Time-Series Anomaly Detection