-
Time Series như Ngôn ngữ: Một Universal Tokenizer cho General-Purpose Time Series Foundation Models
Time Series as Language: A Universal Tokenizer for General-Purpose Time Series Foundation Models
-
Blurry Window Attention
-
Từ Closing Tự tin đến Silent Failure: Đặc tả False Success trong LLM Agents
From Confident Closing to Silent Failure: Characterizing False Success in LLM Agents
-
Alignment Collapse Under KV Cache Quantization: Chẩn đoán và Mitigation
Alignment Collapse Under KV Cache Quantization: Diagnosis and Mitigation
-
LLM-as-a-Discriminator: Khi Bảng Tổng hợp Vẫn trông có vẻ Thật
LLM-as-a-Discriminator: When Synthetic Tables Still Look Real
-
Hai để Tango: Coupled Task-Reference Selection cho Fine-tuning LLM An toàn
Two to Tango: Coupled Task-Reference Selection for Safe LLM Fine-tuning
-
SPACE: Khái niệm Anchor Proxy không cần nguồn cho MLLMs
SPACE: Source-free Proxy Anchor Concept Erasure for MLLMs
-
QSplitFL: Học sâu Q-Learning cho việc chọn điểm chia tối ưu trong Học liên bang chia nhỏ
QSplitFL: Capability Aware Deep Q-Learning for Optimal Split Point Selection in Split Federated Learning
-
PatchSTG: Biến đổi đồ thị không gian-thời gian có thể mở rộng cho dự báo giao thông trên mạng cảm biến không đều
PatchSTG: Scalable Spatiotemporal Graph Transformers for Traffic Forecasting on Irregular Sensor Networks
-
Rotate2Think: Kích hoạt hình học thông qua xoay trực giao để cải thiện khả năng suy luận của mô hình ngôn ngữ
Rotate2Think: Geometric Priming via Orthogonal Rotation to Improve Language Model Reasoning
-
[AINews] Anthropic Claude Fable 5 — Mythos nhưng An toàn, với Điều khoản Tranh cãi
[AINews] Anthropic Claude Fable 5 — Mythos but Safe, with Controversial Terms
-
Từ dữ liệu đến quyết định: cách LSEG đang mở rộng trí tuệ nhân tạo tin cậy
From data to decisions: how LSEG is scaling trusted AI
-
Ấn tượng ban đầu về Claude Fable 5
Initial impressions of Claude Fable 5
-
llm 0.32a3
-
Thiết lập giá tùy chỉnh cho mô hình trong AgentsView
Setting a custom price for a model in AgentsView
-
google/skills
-
phuryn/pm-skills
-
alistaitsacle/free-llm-api-keys
-
magenta/magenta-realtime
-
Yuxi: Nền tảng Agent Harness đa người thuê
xerrors/Yuxi
-
Marin: Khung mã nguồn mở cho mô hình nền tảng
marin-community/marin
-
500 Dự án AI Agents
ashishpatel26/500-AI-Agents-Projects
-
UI Skills: Kỹ năng cho Kỹ sư Thiết kế
ibelick/ui-skills
-
TREK: Công cụ lập kế hoạch du lịch tự lưu trữ
mauriceboe/TREK
-
agent-teams-ai: Xây dựng công ty AI với các đội tác nhân
777genius/agent-teams-ai
-
Trích dẫn Andrej Karpathy
Quoting Andrej Karpathy
-
AI hiện tại có thể phát hiện lỗi trong các bài báo kinh tế như thế nào?
How well does current AI find errors in economics papers?
-
Về AI và “Trí tuệ Gợn Sóng”
On AI and "Jagged Intelligence"
-
Nhà phát triển Nextdoor sử dụng Codex để xây dựng mà không có giới hạn
How engineers at Nextdoor use Codex to build without limits
-
Điều gì Codex mở ra cho Notion
What Codex unlocks for Notion
-
[AINews] FrontierCode: Đánh giá chất lượng mã vượt qua độ lỏng lẻo
[AINews] FrontierCode: Benchmarking for Code Quality over Slop
-
PathoSage: Hướng tới đánh giá bằng chứng đa nguồn trong bệnh lý qua quy trình có nhận thức kinh nghiệm
PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow
-
OmniMem: Nén bộ nhớ có nhận thức nhiễu cho LLM âm thanh‑hình ảnh luồng
OmniMem: Perturbation-aware Memory Compression for Streaming Audio-Visual LLMs
-
Syll: Tự động hoá cá nhân mã nguồn mở với thực thi đa bề mặt
Syll: Open-Source Personal Automation with Cross-Surface Execution
-
Nghiên cứu trường hợp đánh giá các tác nhân AI trên quy trình dữ liệu‑đến‑khám phá trong thần kinh học
A case study of evaluating AI agents on a neuroscience data-to-discovery pipeline
-
Tại sao chỉ giới hạn luồng dư thừa ở các lớp mà không phải token? Bộ nhớ bền vững cho suy luận tiềm ẩn liên tục
Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning
-
Trích xuất tự động thông tin có cấu trúc từ báo cáo MRI não bằng mô hình ngôn ngữ lớn mở
Automatic Extraction of Structured Information from Brain MRI Reports Using an Open-Weight Large Language Model
-
Một số giả thuyết về cách chatbot hoạt động trong cuộc trò chuyện giải quyết vấn đề
Some hypotheses on how chatbots work in problem-solving-driven conversations. Large Language Models as confirmation of the Innovation Illusion
-
Che phủ đất và loại lũ quyết định giới hạn phát hiện của bản đồ lũ dựa trên vệ tinh trên các sự kiện lũ đa dạng trên toàn cầu
Land cover and flood type govern the detection limits of satellite-based flood mapping across diverse global flood events
-
Phục hồi và dự đoán đường đi của bệnh Alzheimer bằng dữ liệu thường规 trong môi trường hạn chế
Reconstructing and forecasting disease trajectories of patients with Alzheimer's disease using routine data in resource-constrained settings
-
Cải thiện lý luận đa phương thức thông qua tối ưu hóa chiều tệ nhất
Improving Multimodal Reasoning via Worst Dimension Optimization
-
Vượt ra ngoài định luật Goodhart: Một điểm chuẩn động cho đánh giá tuân thủ trong hệ thống đa tác nhân
Beyond Goodhart's Law: A Dynamic Benchmark for Evaluating Compliance in Multi-Agent Systems
-
Đâu là nơi phân cấp hướng dẫn bị phá vỡ: Chẩn đoán và sửa chữa sự thất bại trong mô hình ngôn ngữ lý luận
Where Instruction Hierarchy Breaks: Diagnosing and Repairing Failures in Reasoning Language Models
-
Tăng cường sự tham gia trong hệ thống trí tuệ nhân tạo mô-đun
Scaling Participation in Modular AI Systems
-
Cắt tỉa cấu trúc và định lượng chính xác hỗn hợp cho nén LLM
Joint Structural Pruning and Mixed-Precision Quantization for LLM Compression
-
Vượt qua nút thắt quy định thông qua giao thức tác nhân-tác nhân: Một nghiên cứu trường hợp hạt nhân
Overcoming the Regulatory Bottleneck via Agent-to-Agent Protocols: A Nuclear Case Study
-
Học tăng cường ngoại tuyến cho kiểm soát plasma trong hợp hạch hạt nhân: Cơ sở mã và điểm chuẩn
Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark
-
Hệ thống khuyến nghị y tế MedicalRec
MedicalRec: Medical recommender system for image classification without retraining
-
SPIN: Kiểm soát đàn phân tán phi tập trung
SPIN: Decentralized Swarm Control via Tensorized Policy Coordination
-
Lạm phát phương sai biên giới gây ra thiên vị trong quy trình Gaussian
Boundary Variance Inflation Causes Acquisition Bias in Gaussian Processes