News Hub — turtletrading.vn

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Lấy mẫu song song: Khởi tạo truy vấn đa dạng cho tìm kiếm chủ động

Beyond Parallel Sampling: Diverse Query Initialization for Agentic Search

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Khi quy tắc học: Một tác nhân tự tiến hóa cho việc tìm kiếm vụ án pháp lý

When Rules Learn: A Self-Evolving Agent for Legal Case Retrieval

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

SkillChain-Gym: Một điểm chuẩn cho kiểm soát sản xuất-hàng tồn kho với sự gián đoạn

SkillChain-Gym: A Benchmark for Reskilling-Aware Production-Inventory Control under Disruptions

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Kiểm soát dự báo mô hình dựa trên kỹ năng cho chuỗi cung ứng sản xuất linh hoạt

Skill-Constrained Model Predictive Control for Resilient Manufacturing Supply Chains

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Không có gì từ không có gì: Liệu một mô hình ngôn ngữ có thể khám phá ra 0?

Nothing from Something: Can a Language Model Discover 0?

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Đo lường sự nhất quán trong推 lý logic của mô hình ngôn ngữ lớn thông qua不 chắc chắn cấu trúc

Quantifying Consistency in LLM Logical Reasoning via Structural Uncertainty

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

MemTrace: Khám phá những gì độ chính xác cuối cùng bỏ lỡ trong bộ nhớ dài hạn

MemTrace: Probing What Final Accuracy Misses in Long-Term Memory

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

SpeechDx: Một điểm chuẩn đa nhiệm cho trí tuệ nhân tạo ngôn ngữ lâm sàng

SpeechDx: A Multi-Task Benchmark for Clinical Speech AI

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Mạng tác nhân tổng quát phân tán: Kiến trúc, cơ chế chính và nguyên mẫu

Distributed General-Purpose Agent Networks: Architecture, Key Mechanisms, and Prototypes

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Hệ Thống Hỗ Trợ Ra Quyết Định Lâm Sàng Thông Minh Thông Qua Mô Phỏng Kép Số

Treatment Response Optimized Clinical Decision Support AI System via Digital Twin Simulation

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Ưu Thế Của Nhà Cung Cấp Đã Thành Lập: Sự Thể Hiện Của Thiếu Hụt Nhãn Hiệu Và Sự Khai Thác Nhận Thức Trong Hệ Thống Khuyến Nghị LLM

Incumbent Advantage: Brand Bias and Cognitive Manipulation Dynamics in LLM Recommendation Systems

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Chỉ Số Đồng Bệnh Học Được Học Máy

A Machine-Learned Comorbidity Index

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

MapSatisfyBench: Đánh Giá Các Đại Lý Bản Đồ Thông Qua Các Yếu Tố Quyết Định Ngầm Dựa Trên Hành Vi

MapSatisfyBench: Benchmarking Satisfaction-Aware Map Agents through Behavior-Grounded Implicit Decision Factors

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

Phân Tích Hành Vi Mô Hình Thông Qua Lộ Trình Của Đại Lý

Dissecting model behavior through agent trajectories

Bài phân tích Công nghệ ★ arXiv CS.AI 1 ngày

LLM Có Thể Là CEO? Đánh Giá Phân Bổ Nguồn Lực Chiến Lược Với Mô Phỏng Đại Lý Đa Vai Trò

Can LLMs Be CEOs? Benchmarking Strategic Resource Reallocation with Multi-Role Agent Simulation

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Định Nghĩa Về Giải Thích Tốt Và Thách Thức Giải Thích Đầu Ra Của LLM

A Definition of Good Explanations and the Challenges Explaining LLM Outputs

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Dr-DCI: Tăng Tốc Tương Tác Trực Tiếp Với Cơ Sở Dữ Liệu Thông Qua Mở Rộng Không Gian Làm Việc Động

Dr-DCI: Scaling Direct Corpus Interaction via Dynamic Workspace Expansion

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Mô hình Causal Cấu trúc Liên quan

Relational Structural Causal Models

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Sự Tin tưởng Giữa Các Đại lý AI: Đo lường Hình thành, Phá vỡ và Phục hồi

Trust Between AI Agents: Measuring Formation, Breakage, and Recovery, with Implications for Governing Multi-Agent Systems

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

PrologMCP: Giao diện Công cụ Prolog Tiêu chuẩn cho Đại lý LLM

PrologMCP: A Standardized Prolog Tool Interface for LLM Agents

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Dự báo Thời gian Dòng có Tăng cường Tìm kiếm theo Nghĩa

Semantics-Enhanced Retrieval-Augmented Time Series Forecasting

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

AI Engram: Tìm kiếm Dấu vết Bộ nhớ trong Trí tuệ Nhân tạo

AI Engram: In Search of Memory Traces in Artificial Intelligence

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Metric Match: Phương pháp Chọn Tập con để Đánh giá Độ tin cậy của LLM Judge

Metric Match: A Subset Selection Approach to Evaluating LLM Judge Reliability

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

OSGuard: Bộ chuẩn mực An toàn cho Đại lý Sử dụng Máy tính

OSGuard: A Benchmark for Safety in Computer-Use Agents

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Hợp nhất Không phải Là Một Kích cỡ Cho Tất cả: Cân bằng Đại diện Chéo Modal cho Mô hình Thời gian Sự kiện

Fusion is not one-size-fits-all: Cross-Modal Representation Alignment for Time-to-Event Modeling

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Đại lý LLM An toàn Rủi ro cho Truy xuất Dữ liệu Địa không gian: Thiết kế và Đánh giá Đối thủ

Risk-Aware LLM Agents for Geospatial Data Retrieval: Design and Preliminary Adversarial Evaluation

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Nợ Nhận thức: Trí tuệ Nhân tạo Là Đòn bẩy Trí tuệ và Động lực của Sự Dễ bị Tấn công Hệ thống

Cognitive Debt: AI as Intellectual Leverage and the Dynamics of Systemic Fragility

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

VGPT-RSI: Tiến bộ hình thức trong Giả thuyết Riemann

VGPT-RSI for RH-Adjacent Formal Progress: Boundary Certificates, Verified Finite Lagarias Inequalities, and Explicit Failure Localization

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

Khoa học dữ liệu có thể kiểm chứng: Giải quyết TSQA không đều

Towards Verifiable Agentic Data Science: Solving Irregular TSQA Via Tool-Grounded Reasoning

Bài phân tích Công nghệ ★ arXiv CS.AI 2 ngày

CONCORD: Tích hợp_sparse không đồng bộ cho RAG

CONCORD: Asynchronous Sparse Aggregation for Device-Cloud RAG under Document Isolation

Bài phân tích Công nghệ ★ arXiv CS.AI 3 ngày

Phương pháp Transformer dựa trên Học tăng cường sâu (DRL) để giải quyết vấn đề lịch trình mở

A Deep Reinforcement Learning (DRL)-Based Transformer Method for Solving the Open Shop Scheduling Problem

Bài phân tích Công nghệ ★ arXiv CS.AI 3 ngày

UP-NRPA: Phương pháp thích nghi chính sách cuộn lồng dựa trên chân dung người dùng cho hệ thống đối thoại định hướng mục tiêu

UP-NRPA: User Portrait based Nested Rollout Policy Adaptation for Planning with Large Language Models in Goal-oriented Dialogue Systems

Bài phân tích Công nghệ ★ arXiv CS.AI 3 ngày