new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

May 7

Submitted by

CoreloneH

Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation

FrameXAI

Submitted by

CoreloneH

Stream-T1: Test-Time Scaling for Streaming Video Generation

FrameXAI

Submitted by

huiwon

RLDX-1 Technical Report

RLWRLD

Submitted by

csfufu

OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents

Tencent-Hunyuan

Tencent Hunyuan

Submitted by

LMD0311

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

H-EmbodVis

Submitted by

yhyang-myron

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

·
10 authors

Submitted by

yilunzhao

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

YaleUniversity

Yale University

Submitted by

DyJiang

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

Tongyi-MAI

Submitted by

taesiri

Lightning Unified Video Editing via In-Context Sparse Attention

·
7 authors

Submitted by

taesiri

Awaking Spatial Intelligence in Unified Multimodal Understanding and Generation

·
19 authors

Submitted by

Yirany

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

openbmb

Submitted by

chengq9

CreativityBench: Evaluating Agent Creative Reasoning via Affordance-Based Tool Repurposing

UIUC-CS

University of Illinois at Urbana-Champaign

Submitted by

EdBianchi

Parameter-Efficient Multi-View Proficiency Estimation: From Discriminative Classification to Generative Feedback

·
2 authors

Submitted by

lin1111987

ResRL: Boosting LLM Reasoning via Negative Sample Projection Residual Reinforcement Learning

CASIA

Chinese Academic of Science Institute of Automation

Submitted by

eshnil

SWE-WebDevBench: Evaluating Coding Agent Application Platforms as Virtual Software Agencies

qwikbuild

Submitted by

dorienh

APEX: Large-scale Multi-task Aesthetic-Informed Popularity Prediction for AI-Generated Music

amaai-lab

Submitted by

lhmd

Diffusion Model as a Generalist Segmentation Learner

·
11 authors

1

Submitted by

huimeiwang-1993

MedSkillAudit: A Domain-Specific Audit Framework for Medical Research Agent Skills

AIPOCH-AI

Submitted by

Dasool

XL-SafetyBench: A Country-Grounded Cross-Cultural Benchmark for LLM Safety and Cultural Sensitivity

AIM-Intelligence

AIM Intelligence

Submitted by

phuayj

A Foundation Model for Zero-Shot Logical Rule Induction

·
1 authors

Submitted by

MinaGabriel

The First Token Knows: Single-Decode Confidence for Hallucination Detection

TempleUniversityPhiladelphia

Temple University

1

Submitted by

VitaCoco

When to Think, When to Speak: Learning Disclosure Policies for LLM Reasoning

·
8 authors

1

Submitted by

yixuanh

KinDER: A Physical Reasoning Benchmark for Robot Learning and Planning

princetonu

Princeton University

Submitted by

KieDani

TT4D: A Pipeline and Dataset for Table Tennis 4D Reconstruction From Monocular Videos

MLCVLab

Chair for Machine Learning & Computer Vision

1

Submitted by

MiaoMiaoYang

Turning Drift into Constraint: Robust Reasoning Alignment in Non-Stationary Environments

·
4 authors