News Hub — turtletrading.vn

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

GITCO: Tối Ưu Hóa Context Thời Gian Thực Tại Thời Điểm suy Luận Trong TSFMs

GITCO: Gated Inference-Time Context Optimization in TSFMs

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Dự Báo Hành Vi Chức Năng Và Đánh Giá Mệt Mỏi Vật Liệu Có Ý Thức Không Certain Cho Nhà Máy Tái Chế

Uncertainty Aware Functional Behavior Prediction and Material Fatigue Assessment for Circular Factory

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

SentinelBench: Một Benchmark Cho Các Đại Lý Giám Sát Chạy Lâu

SentinelBench: A Benchmark for Long-Running Monitoring Agents

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Một Khung AI Có Thể Diễn Giải Và Tin Cậy Cho Các Nghiên Cứu Liên Quan Cấu Trúc-Đau Lớn Quy Mô Lớn Sử Dụng Dữ Liệu Từ Sáng Kiến Osteoarthritis Initiative (OAI)

An interpretable and trustworthy AI framework for large-scale longitudinal structure-pain association studies using data from the Osteoarthritis Initiative (OAI)

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Lý luận tương phản tổng hợp cho câu hỏi và trả lời đa bảng

Synthetic Contrastive Reasoning for Multi-Table Q&A

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Tính ổn định vs Tính dễ thao túng: Đánh giá độ bền dưới tương tác sau quyết định trong các thẩm phán LLM

Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Mô hình dư cho nén dữ liệu khoa học độ trung thực cao

Residual Modeling for High-Fidelity Learned Compression of Scientific Data

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

LeanMarathon: Hướng tới các nhà toán học AI đáng tin cậy thông qua tự động hóa Lean dài hạn

LeanMarathon: Toward Reliable AI Co-Mathematicians through Long-Horizon Lean Autoformalization

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Khai thác các tác nhân tổng quát cho chuỗi thời gian được ngữ cảnh hóa

Harnessing Generalist Agents for Contextualized Time Series

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Kỳ thi cuối cùng của các tác nhân

Agents' Last Exam

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Đột biến không có biến thể: Động lực hội tụ trong tiến hóa chương trình LLM

Mutation Without Variation: Convergence Dynamics in LLM-Driven Program Evolution

Bài phân tích Công nghệ ★ arXiv CS.AI 13 ngày

Kiến trúc động lực cho AGI đối thoại

A Motivational Architecture for Conversational AGI

Bài phân tích Công nghệ ★ Simon Willison 13 ngày

Người hâm mộ AI đang chạy đua với thời gian, người hoài nghi AI đang chạy đua với hỗn loạn

AI enthusiasts are in a race against time, AI skeptics are in a race against entropy

Bài phân tích Công nghệ ★ Swyx (latent.space) 13 ngày

Thực tế: Đánh giá cuối cùng — Lukas Petersson và Axel Backlund của Andon Labs

Reality: The Final Eval — Lukas Petersson and Axel Backlund of Andon Labs

Bài phân tích Công nghệ ★ Marginal Revolution (Tyler Cowen) 14 ngày

Bài thuyết trình AI 20 phút cho công ty Thụy Điển Sana

My twenty-minute AI talk for the Swedish company Sana

Bài phân tích Công nghệ ★ Simon Willison 14 ngày

Trích dẫn Emanuel Maiberg, 404 Media

Quoting Emanuel Maiberg, 404 Media

Bài phân tích Công nghệ ★ Dwarkesh Patel 14 ngày

Alex Imas và Phil Trammell – Điều gì còn khan hiếm sau AGI?

Alex Imas and Phil Trammell – What remains scarce after AGI?

Bài phân tích Công nghệ ★ Marginal Revolution (Tyler Cowen) 14 ngày

Liên kết đa dạng ngày thứ Năm

Thursday assorted links

Bài phân tích Công nghệ ★ Construction Physics (Brian Potter) 14 ngày

Mất bao lâu để lên kế hoạch xây cầu?

How Long Does It Take to Plan a Bridge?

Bài phân tích Công nghệ ★ GitHub Trending (all) 14 ngày

opendataloader-project/opendataloader-pdf

Bài phân tích Công nghệ ★ GitHub Trending (all) 14 ngày

lyogavin/airllm

Bài phân tích Công nghệ ★ GitHub Trending (Python) 14 ngày

HexStrike AI: Tăng cường bảo mật với AI

0x4m4/hexstrike-ai

Bài phân tích Công nghệ ★ GitHub Trending (Python) 14 ngày

Hiring Agent: Đánh giá hồ sơ xin việc bằng AI

interviewstreet/hiring-agent

Bài phân tích Công nghệ ★ GitHub Trending (Python) 14 ngày

EbookFoundation: Sách lập trình miễn phí

EbookFoundation/free-programming-books

Bài phân tích Công nghệ ★ GitHub Trending (Python) 14 ngày

NVIDIA-NeMo/Gym: Đánh giá và cải thiện mô hình bằng môi trường

NVIDIA-NeMo/Gym

Bài phân tích Công nghệ ★ GitHub Trending (TypeScript) 14 ngày

TanStack/query: Quản lý trạng thái bất đồng bộ

TanStack/query

Bài phân tích Công nghệ ★ GitHub Trending (TypeScript) 14 ngày

yangshun/tech-interview-handbook: Chuẩn bị phỏng vấn công nghệ

yangshun/tech-interview-handbook

Bài phân tích Công nghệ ★ OpenAI Blog 14 ngày

Endava Đang Tái thiết Kế hoạch Giao hàng Phần mềm xung quanh Trợ lý AI

How Endava is redesigning software delivery around AI agents

Bài phân tích Công nghệ ★ OpenAI Blog 14 ngày

Dreaming: Bộ nhớ tốt hơn cho ChatGPT hữu ích hơn

Dreaming: Better memory for a more helpful ChatGPT

Bài phân tích Công nghệ ★ War on the Rocks 14 ngày

Được rèn luyện trong một cuộc chiến dao: Cuộc cạnh tranh AI nội địa tàn bạo của Trung Quốc

Forged in a Knife Fight: China’s Brutal Domestic AI Competition

Bài phân tích Công nghệ ★ Marginal Revolution (Tyler Cowen) 14 ngày

Giáo sư luật thích AI hơn câu trả lời của đồng nghiệp

Law professors prefer AI over peer answers

Bài phân tích Công nghệ ★ Foreign Affairs 14 ngày

Cuộc chạy marathon sắp tới của Quân đội Mỹ

The American Military’s Coming Marathon

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

Đảm Bảo Trước Khi Đưa Dịch Vụ AI Vào Sản Xuất

Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

Tìm Kiếm Sự Tương Tác Cảm Xúc Giữa Con Người Và AI

Stumbling Into AI Emotional Dependence: How Routine AI Interactions Reshape Human Connection

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

Tìm Kiếm Sự Tương Tác Cảm Xúc Giữa Con Người Và AI

Thinking Through Signs: PEEL as a Semiotic Scaffolding for Epistemically Accountable AI-Enabled Research

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

SMAC-Talk: Mở rộng ngôn ngữ tự nhiên của thử thách StarCraft Multi-Agent cho các mô hình ngôn ngữ lớn

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

Đồng thuận không đủ về mặt chiến lược: Bất đồng trong dấu vết suy luận như một tín hiệu biểu diễn tri thức

Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

VAMPS: Bộ tiêu chuẩn giải quyết vấn đề toán học có hỗ trợ hình ảnh

VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

StepPRM-RTL: Tinh chỉnh LLM theo hướng dẫn thưởng quy trình từng bước để tăng cường tổng hợp RTL

StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

Liệu các tác nhân tổng quát có thể tự động hóa việc tuyển chọn dữ liệu?

Can Generalist Agents Automate Data Curation?

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

Đặc điểm hóa quy trình hình thức hóa chứng minh ban đầu giữa người và AI

Characterizing initial human-AI proof formalization workflows

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày

Bẫy bão hòa và tính chủ quan của thời điểm can thiệp: Tại sao các tác nhân dựa trên cảm xúc và LLM không thể định thời điểm can thiệp vào tác nhân tự chủ

The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents

Bài phân tích Công nghệ ★ arXiv CS.AI 14 ngày