-
Đúng Khi Ghép, Sai Khi Tách: Ngắt Kết Nối Và Chỉnh Sửa Nơ-Ron Cụ Thể Về Phương Thức Trong MLLM
Correct When Paired, Wrong When Split: Decoupling and Editing Modality-Specific Neurons in MLLMs
-
Chẩn Đoán Và Sửa Chữa Lối Cắt Ngắn Hình Dạng Trong Quang Trắc Hình Ảnh Tia Sáng Đơn
Diagnosing and Repairing Shape-Prior Shortcuts in Long-Range Single-Shot Fringe Projection Profilometry
-
Sự Thiếu Hụt Thông Tin Để Tạo Dòng Thời Gian Lâm Sàng Bất Quy Tắc
Informative Missingness to Generate Irregular Clinical Time Series
-
Mô Hình Ghi Chú Tại Prefill: Bộ Đệm KV Có Thể Được Chỉnh Sửa Và Tạo Thành
Models Take Notes at Prefill: KV Cache Can Be Editable and Composable
-
Vai trò quan trọng của việc chọn mô hình trong suy luận nguyên nhân
The Critical Role of Model Selection in Causal Inference: A Comparative Analysis of Classification Models within the InferBERT Framework for Pharmacovigilance
-
Đánh giá hệ thống về các mô hình nền tảng cho phân tích ung thư đa phương thức
Probing, Fusion, and Trustworthiness: A Systematic Evaluation of Foundation Model Representations for Multimodal Cancer Analysis
-
MODE: Nén mô hình chuyên gia đa phương thức với độ chính xác hỗn hợp
MODE: Modality-Decomposed Expert-Level Mixed-Precision Quantization for MoE Multimodal LLMs
-
Sự thoát khỏi các pha metastable do nhiễu giải thích hiện tượng Grokking trong mạng nơ-ron sâu
Noise-Driven Escape from Metastable Phases explains Grokking in Deep Neural Networks
-
Hướng tới các mô hình thay thế nhanh cho GNN trong di chuyển CO2 trong các thành tạo địa chất phức tạp
Towards Fast GNN Surrogates for CO2 Migration in Complex Geological Formations
-
Phát hiện và ngăn chặn các dị thường đồng thời trong hệ thống mô hình ngôn ngữ lớn đa tác nhân
Verified Detection and Prevention of Concurrency Anomalies in Multi-Agent Large Language Model Systems
-
Hình học Finsler, mạng nơ-ron đồ thị và ứng dụng
Finsler Geometry, Graph Neural Networks, and You
-
Mô hình khuếch tán có hạn chế với suy luận primal-dual
Constrained Diffusion Models with Primal-Dual Inference
-
PowerOPD: Tăng cường ổn định cho quá trình chưng cất chính sách với biến đổi power có giới hạn
PowerOPD: Stabilizing On-Policy Distillation with Bounded Power Transformation
-
Rào cản độ sum-of-squares cho phương pháp Reweighted-Hinge trong học nửa không gian robust
Sum-of-Squares Degree Barriers for the Reweighted-Hinge Method in Robust Halfspace Learning: A Christoffel-Function Characterization
-
Rift: Chữ Ký Xung Đột cho Sự Gian Dối trong Mô Hình Ngôn Ngữ
Rift: A Conflict Signature for Deception in Language Models
-
QPILOTS: Hướng dẫn Q-Steering hiệu quả cho Flow Policies
QPILOTS: Efficient Test-Time Q-Steering for Flow Policies
-
GRAPE: Tiến hóa không gian tham số hướng dẫn cho độ bền chống đối
GRAPE: Guided Parameter-Space Evolution for Compact Adversarial Robustness
-
Giá bảo hiểm công bằng: Một liên tục công bằng
{\alpha}-Fair Insurance Pricing: A Fairness Continuum
-
GRASP: Chuyển tham số tuần tự hướng dẫn cho học đa nguồn
GRASP: Gradient-Aligned Sequential Parameter Transfer for Memory-Efficient Multi-Source Learning
-
Hối tiếc Chính sách cho Định tuyến Mô hình Nhúng: Băng tần với Chuyên gia Thấp
Policy Regret for Embedding Model Routing: Contextual Bandits with Low-Rank Experts
-
Kiến trúc Neural Có thể Tách: Từ Lý thuyết Toán học đến Ứng dụng
Separable Neural Architectures as Physical World Models: from Mathematical Theory to Applications
-
Nhớ, Đừng Đọc lại: Trạng thái ReAct cho Thử nghiệm Tự động Hiệu quả
Remember, Don't Re-read: Stateful ReAct Agents for Token-Efficient Autonomous Experimentation
-
Nghiên cứu So sánh về Lựa chọn Lớp Mạng Neural Đồ thị cho Mô hình Tương tác trong Dự đoán Lộ trình Lái xe
A Comparative Study of Graph Neural Network Layer Selection for Interaction Modelling in Driving Trajectory Prediction
-
Khai thác Tín hiệu Sinh lý để Dự đoán Kết quả Thi bằng Học máy
Leveraging Physiological Signals to Predict Exam Outcomes with Machine Learning
-
Đánh giá Nhiễu Nhãn Trường hợp với Sự Corrupt Kiểm soát
Benchmarking Instance-Dependent Label Noise with Controlled Corruptions
-
Tối ưu Hóa Không cần Parameter cho Phương pháp LMO: Phương pháp Mới cho Tối ưu Hóa Hiệu quả
Zero-order Parameter-free Optimization for LMO-based Methods: Novel Approach for Efficient Fine-tuning
-
FastMix: Tối ưu Hóa Trộn Dữ liệu Nhanh qua Gradient Descent
FastMix: Fast Data Mixture Optimization via Gradient Descent
-
Tự động mã hóa Sparse Hợp lý
Rational Sparse Autoencoder
-
Mở khóa Kích thước Latent: Khám phá Biểu diễn Dữ liệu Tán xạ X-ray Lớn bằng Tự động mã hóa Variational
Unlocking Latent Dimensions: Exploring Representations of Large-Scale X-ray Scattering Data using Variational Autoencoders
-
Làm Thế Nào Để Đánh Giá Mô Hình Thế Giới?
How Should World Models Be Evaluated? A Decision-Making-Centric Position
-
Có thể chỉnh sửa 1 nơ-ron để sửa lỗi lặp trong LLMs?
Can Editing 1 Neuron Fix Repetition Loops in LLMs?
-
Tính toán khuếch tán LLM hiệu quả trên thiết bị di động với NPU di động
Efficient On-Device Diffusion LLM Inference with Mobile NPU
-
Giá cả tần suất cao cho thương mại điện tử
High-Frequency Pricing at Scale for E-Commerce
-
Quy trình làm việc hoàn toàn dựa trên GPU để xây dựng mô phỏng vật lý dòng chảy siêu âm
A fully GPU-based workflow for building physics emulators of hypersonic flows
-
FedSPC: Sửa lỗi tham số chung cho học tập liên bang cá nhân hóa
FedSPC: Shared Parameter Correction for Personalized Federated Learning
-
Norm trọng lượng đặt thời gian Grokking: Luật trì hoãn nguyên nhân
The Weight Norm Sets the Grokking Timescale: A Causal Delay Law
-
D2H-AD: Mô hình lai sử dụng tính toán siêu chiều cho phát hiện bất thường tiên tiến
D2H-AD: A Hybrid Model Utilizing Hyperdimensional Computing for Advanced Anomaly Detection
-
Vượt qua LoRA: Liệu thích nghi do độ 稀 có tốt hơn?
Beyond LoRA: Is Sparsity-Induced Adaptation Better?
-
Tối ưu hóa chính sách khuếch tán mà không bị phân tâm
Diffusion Policy Optimization without Drifting Apart
-
Biến động thần kinh tăng cường độ bền của mạng nhân tạo
Neural Variability Enhances Artificial Network Robustness
-
Biến số lỏng lẻo thần kinh cho các ràng buộc hình dạng
Neural Slack Variables for Shape Constraints
-
Ước tính không chắc chắn và ranh giới tổng quát hóa cho học sâu hiện đại
Uncertainty Estimation and Generalization Bounds for Modern Deep Learning
-
Ước tính dựa trên sự chú ý của xác suất lợi ích điều trị cá nhân dưới sự thay đổi liều lượng
Attention-Based Estimation of the Individual Treatment Benefit Probability under Dose Variation
-
Tiêu chí dừng và ghép cho việc nhúng phổ thời gian trễ không cần đào tạo của chuỗi thời gian đa biến
A Stationarity-and-Coupling Criterion for Training-Free Time-Lagged Spectral Embeddings of Multivariate Time Series
-
Siêu tư duy: Token lý luận trong siêu vị trí
SuperThoughts: Reasoning Tokens in Superposition
-
Restless bandits với phản hồi nhị phân không hoàn hảo
Restless bandits with imperfect binary feedback: PCL-indexability analysis and computation
-
Hướng dẫn suy luận với trộn mô hình xác suất
To Intervene or Not: Guiding Inference-time Alignment with Probabilistic Model Blending
-
Đánh giá dual-stance cho sycophancy
Dual-Stance Evaluation of Sycophancy: The Structure of Agreement and the Limits of Intervention
-
Few-Shot Resampling cho khai thác dữ liệu có ý nghĩa thống kê
Few-Shot Resampling for Scalable Statistically-Sound Data Mining
-
ProHiFlo: Trộn dòng chảy phân cấp với hướng dẫn chức năng
ProHiFlo: Hierarchical Flow Matching with Functional Guidance for De Novo Protein Generation