-
Một mặt nạ để thống trị tất cả: Về các sự kiện ẩn sau chỉnh sửa và cách tìm chúng
One Mask to Rule Them All: On Hidden Facts after Editing and How to Find Them
-
Nguồn gốc cơ học của việc quên lãng thảm khốc: Tại sao RL bảo tồn mạch tốt hơn SFT?
Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?
-
Tối ưu hóa dẫn đầu phân tử thông qua kế hoạch công cụ có tính chủ động
Molecular Lead Optimization via Agentic Tool Planning
-
Học tăng cường tự chơi dưới thông tin không hoàn hảo trong Big 2
Self-Play Reinforcement Learning under Imperfect Information in Big 2
-
Đại diện ngữ nghĩa xuất hiện trong mô hình thế giới thông qua tương tác vật lý mà không cần giám sát ngôn ngữ
Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision
-
Sự liên tục và thứ tự quan trọng: Giới hạn token chuỗi thời gian cho phân tích chuỗi thời gian hiệu quả với mô hình ngôn ngữ lớn
Continuity and Ordinality Matter: Constraining Time Series Tokens for Effective Time Series Analysis with Large Language Models
-
PrismFlow: Động lực học dư cho phù hợp luồng trong tạo chuỗi thời gian
PrismFlow: Residual Dynamics for Flow Matching in Time-Series Generation
-
TaxDistill: Cải thiện chú thích phân loại metagenomic thông qua mô hình nền tảng bộ gen chưng cất
TaxDistill: Improving Metagenomic Taxonomic Annotation via Distilled Genomic Foundation Models
-
Cân bằng học đa phương thức thông qua việc định hình lại không gian nhãn
Balancing Multimodal Learning through Label Space Reshaping
-
Cấu trúc tuyến tính là nền tảng của sự sắp xếp đại diện
Representation Alignment Rests on Linear Structure
-
Đăng ký trước hiệu ứng phát hiện được: Ngân sách Paired-MDE cho chuẩn 4-bit
Pre-Registering the Detectable Effect: A Paired-MDE Budget for 4-bit Quantization Benchmarks, with a Pilot Audit
-
Hướng tới mô hình nền tảng nguyên nhân liên tục
Towards Continuous-time Causal Foundation Models
-
Chưng cất ngữ cảnh như quản lý bộ nhớ ẩn
Context Distillation as Latent Memory Management
-
Phân tích hình học của LoRA Adapters
Feature Geometry of LoRA Adapters: A Sparse Autoencoder Analysis of Representational Divergence in Fine-Tuned Language Models
-
Phiên bản datasette 1.0a31
datasette 1.0a31
-
Tăng cường khả năng chống chịu xã hội với Rosalind Biodefense
Strengthening societal resilience with Rosalind Biodefense
-
Anthropic nhận được 965 tỷ USD đầu tư Series H
[AINews] Anthropic raises $965B Series H, releases Opus 4.8 and Dynamic Workflows/ultracode
-
Doanh thu của Anthropic đạt 47 tỷ USD
Anthropic's run-rate revenue hits $47 billion
-
Sổ tay chung cho đánh giá đáng tin cậy của bên thứ ba
A shared playbook for trustworthy third party evaluations
-
Phiên bản Claude Opus 4.8
Claude Opus 4.8: "a modest but tangible improvement"
-
Phiên bản llm-anthropic 0.25.1
llm-anthropic 0.25.1
-
Chachamaru127/claude-code-harness
-
Hướng dẫn nâng cao để học tiếng Anh
byoungd/English-level-up-tips
-
iii - Công cụ quản lý dịch vụ thời gian thực
iii-hq/iii
-
vLLM - Công cụ suy luận và phục vụ mô hình ngôn ngữ
vllm-project/vllm
-
AgentScope - Khung công cụ xây dựng và chạy agent
agentscope-ai/agentscope
-
NVIDIA-NeMo/Megatron-Bridge - Thư viện đào tạo mô hình
NVIDIA-NeMo/Megatron-Bridge
-
crawl4ai - Công cụ thu thập dữ liệu web cho AI
unclecode/crawl4ai
-
orval - Công cụ sinh client từ OpenAPI
orval-labs/orval
-
microsoft/playwright-cli - Công cụ quản lý Playwright
microsoft/playwright-cli
-
MHSanaei/3x-ui - Bảng điều khiển web cho nhiều giao thức
MHSanaei/3x-ui
-
Công cụ markdown-svg-renderer
markdown-svg-renderer
-
Kỷ nguyên Tác nhân Bất đồng bộ — Walden Yan (Cognition) & Cole Murray (OpenInspect)
The Age of Async Agents — Cognition's Walden Yan & OpenInspect's Cole Murray
-
Trí tuệ Nhân tạo trong GDP
AI in gdp
-
Liên kết Ngẫu nhiên Thứ Năm
Thursday assorted links
-
Endava xây dựng tổ chức có khả năng tự chủ với Codex
How Endava builds an agentic organization with Codex
-
Bác sĩ trong Hộp
Doc in a Box
-
Phỏng vấn Eric Seufert về mô hình, quảng cáo và tiềm năng AI cho nhân loại
An Interview with Eric Seufert About Models and Ads, and AI’s Upside for Humanity
-
Xác Định Và Hiểu Biết Giá Trị Con Người Trong Văn Bản
Identifying and Understanding Human Values in Text: A Tailorable LLM-based Architecture
-
Soro: Mô Hình Cơ Bản Nhẹ Và Trợ Lý Trò Chuyện Cho Tiếng Tajik
Soro: A Lightweight Foundation Model and Chatbot for Tajik
-
Về Nguồn Gốc Của Thông Tin Tổng Hợp Bằng Phương Thức Di Truyền Steganographic
On the Origin of Synthetic Information by Means of Steganographic Inheritance
-
DynaSchedBench: Các Benchmark Lập Lịch Động Và Nghịch Lý Quan Sát Trong Các Đại Lý Lập Lịch Dựa Trên LLM
DynaSchedBench: Calibrated Dynamic Scheduling Benchmarks and Observability Paradox in LLM-based Scheduling Agents
-
Tại Sao LLM Thất Bại Trong Khám Phá Nguyên Nhân Và Làm Thế Nào Để Tránh
Why LLMs Fail at Causal Discovery and How Interventional Agents Escape
-
RULER: Xác Thực Mức Đồ Họa Của Máy Unlearning
RULER: Representation-Level Verification of Machine Unlearning
-
LaneRoPE: Mã Hóa Vị Trí Cho Lý Luận Song Song Và Tạo
LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation
-
Cơ Quan Khám Phá Cho Phân Tích Thời Gian Thực
Discovery Agents for Real-Time Analytics: Toward Proactive Insight Systems
-
Agyn: Nền tảng mã nguồn mở cho các tác nhân AI
Agyn: An Open-Source Platform for AI Agents with Scalable On-Demand Execution, Agent Definition as a Code, and Zero-Trust Access
-
Bạn kiểm soát trạng thái của mình
You Are in Control of Your State: Why Human Outcomes Are Controllable Through Causal State Intervention
-
Quản lý mạng xã hội: Khung khổ thống nhất từ nhận dạng nội dung đến can thiệp
Cyberbullying Governance on Social Media: A Unified Framework from Content Identification to Intervention
-
Sự hợp tác tự nguyện với công cụ bí mật trong các tác nhân LLM cạnh tranh
Voluntary Collusion with Secret Tools in Competing LLM Agents