News Hub — turtletrading.vn

Bài phân tích Công nghệ ★ Marginal Revolution (Tyler Cowen) 6 ngày

Lại một lần nữa, định dạng bài viết nghiên cứu sẽ chết

Again, the research paper format will be dying out

Bài phân tích Công nghệ ★ Swyx (latent.space) 6 ngày

[AINews] Loopcraft: Nghệ thuật xếp chồng các vòng lặp

[AINews] Loopcraft: The Art of Stacking Loops

Bài phân tích Công nghệ ★ arXiv q-fin (Quantitative Finance) 6 ngày

(Con người) Chú ý vẫn là yếu tố quyết định: Giám sát con người làm cho khoa học xã hội hỗ trợ AI đáng tin cậy

(Human) Attention Is (Still) All You Need: Human oversight makes AI-assisted social science reliable

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

ToolSense: Khung Chẩn Đoán Để Kiểm Toán Kiến Thức Công Cụ Tham Số Trong LLM

ToolSense: A Diagnostic Framework for Auditing Parametric Tool Knowledge in LLMs

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Arbor: Tìm Kiếm Cây Như Lớp Nhận Thức Cho Tác Nhân Tự Hành

Arbor: Tree Search as a Cognition Layer for Autonomous Agents

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Hỗ Trợ Quyết Định Chiến Lược Cho Tác Nhân AI

Strategic Decision Support for AI Agents

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Pythagoras-Prover: Nâng Cao Chứng Minh Hình Thức Hiệu Quả Thông Qua Chuẩn Hóa Lean Tăng Cường

Pythagoras-Prover: Advancing Efficient Formal Proving via Augmented Lean Formalisation

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

PersonaDrive: Các tác nhân VLA tăng cường truy xuất kiểu con người cho mô phỏng lái xe vòng khép kín

PersonaDrive: Human-Style Retrieval-Augmented VLA Agents for Closed-Loop Driving Simulation

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

"Bạn có nói dối?" Đánh giá bộ phát hiện lời nói dối qua quy mô mô hình và sinh vật mô hình xác thực niềm tin

"Did you lie?" Evaluating Lie Detectors across Model Scale and Belief-Verified Model Organisms

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

TrajGenAgent: Tác nhân LLM phân cấp để tạo ra chuỗi di chuyển của con người

TrajGenAgent: A Hierarchical LLM Agent for Human Mobility Trajectory Generation

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Evoflux: Tiến hóa quy trình công cụ thực thi tại thời điểm suy luận cho các tác nhân gọn nhẹ

Evoflux: Inference-Time Evolution of Executable Tool Workflows for Compact Agents

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Từ AGI đến ASI

From AGI to ASI

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Đánh giá tập trung vào triển khai: Dự đoán rủi ro từ chối truy vấn trong hệ thống LLM lâm sàng

Deployment-Centered Evaluation: Predicting Query-Level Rejection Risk in a Clinical LLM System

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Căn chỉnh định nghĩa trước khi căn chỉnh khả năng: Khung Design-Science để đánh giá tuyên bố về AGI

Definitional alignment before capability alignment: a Design-Science framework for adjudicating claims about AGI

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Lý thuyết về lợi ích của Theory of Mind: Đặc tả hình thức cơ chế suy đoán tâm lý

The Theory of Mind Utility: Formal Specification of a Mentalizing Mechanism

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Suy nghĩ lại đánh giá tâm lý học của LLM: Khi nào và tại sao tự khai báo dự đoán hành vi

Rethinking Psychometric Evaluation of LLMs: When and Why Self-Reports Predict Behavior

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Đánh giá các tác nhân AI cho các thách thức khoa học trên nhiều quy mô

Benchmarking AI Agents for Addressing Scientific Challenges Across Scales

Bài phân tích Công nghệ ★ arXiv CS.AI 6 ngày

Giảm độ phức tạp của mô hình Deep Learning cho phân tích EEG trên thiết bị đeo

Reducing the Complexity of Deep Learning Models for EEG Analysis on Wearable Devices

Bài phân tích Công nghệ ★ OpenAI Blog 6 ngày

Cách Preply kết hợp AI và gia sư con người để cá nhân hóa việc học

How Preply combines AI and human tutors to personalize learning

Bài phân tích Công nghệ ★ Simon Willison 6 ngày

Claude Fable luôn luôn chủ động không ngừng

Claude Fable is relentlessly proactive

Bài phân tích Công nghệ ★ GitHub Trending (all) 6 ngày

activeloopai/hivemind: Một bộ não chung cho mọi tác nhân AI

activeloopai/hivemind

Bài phân tích Công nghệ ★ GitHub Trending (Python) 6 ngày

Sumanth077/Hands-On-AI-Engineering: Các dự án AI thực tế

Sumanth077/Hands-On-AI-Engineering

Bài phân tích Công nghệ ★ GitHub Trending (Python) 6 ngày

davila7/claude-code-templates: Công cụ CLI cho Claude Code

davila7/claude-code-templates

Bài phân tích Công nghệ ★ GitHub Trending (Python) 6 ngày

ml-explore/mlx-examples: Các ví dụ trong framework MLX

ml-explore/mlx-examples

Bài phân tích Công nghệ ★ GitHub Trending (TypeScript) 6 ngày

RSSNext/Folo: Trình đọc RSS tích hợp AI

RSSNext/Folo

Bài phân tích Công nghệ ★ GitHub Trending (TypeScript) 6 ngày

google-labs-code/design.md: Đặc tả định dạng cho tác nhân mã hóa

google-labs-code/design.md

Bài phân tích Công nghệ ★ Simon Willison 6 ngày

datasette 1.0a33

Bài phân tích Công nghệ ★ Stratechery (Ben Thompson) 7 ngày

Phỏng vấn Ben Bajarin về Apple, AI và Compute

An Interview with Ben Bajarin About Apple, AI, and Compute

Bài phân tích Công nghệ ★ Simon Willison 7 ngày