Jiaheng Liu's picture

Jiaheng Liu

CheeryLJH

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

A Survey on Latent Reasoning

upvoted a paper 1 day ago

CriticLean: Critic-Guided Reinforcement Learning for Mathematical Formalization

upvoted a paper 1 day ago

Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving

View all activity

Organizations

upvoted 4 papers 1 day ago

A Survey on Latent Reasoning

Paper • 2507.06203 • Published 1 day ago • 63

CriticLean: Critic-Guided Reinforcement Learning for Mathematical Formalization

Paper • 2507.06181 • Published 1 day ago • 36

Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving

Paper • 2507.06229 • Published 1 day ago • 59

ArtifactsBench: Bridging the Visual-Interactive Gap in LLM Code Generation Evaluation

Paper • 2507.04952 • Published 3 days ago • 8

upvoted a paper 13 days ago

MMSearch-R1: Incentivizing LMMs to Search

Paper • 2506.20670 • Published 15 days ago • 59

upvoted a paper 16 days ago

OAgents: An Empirical Study of Building Effective Agents

Paper • 2506.15741 • Published 23 days ago • 36

upvoted a paper 21 days ago

REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards

Paper • 2505.24760 • Published May 30 • 64

upvoted a paper 22 days ago

Scaling Test-time Compute for LLM Agents

Paper • 2506.12928 • Published 25 days ago • 61

upvoted 3 papers 23 days ago

TaskCraft: Automated Generation of Agentic Tasks

Paper • 2506.10055 • Published 29 days ago • 32

Scientists' First Exam: Probing Cognitive Abilities of MLLM via Perception, Understanding, and Reasoning

Paper • 2506.10521 • Published 28 days ago • 70

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

Paper • 2506.13585 • Published 24 days ago • 252

upvoted 3 papers 28 days ago

Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning

Paper • 2506.07044 • Published Jun 8 • 108

Seedance 1.0: Exploring the Boundaries of Video Generation Models

Paper • 2506.09113 • Published 30 days ago • 95

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

Paper • 2506.09003 • Published 30 days ago • 19

upvoted 2 papers 30 days ago

MiniCPM4: Ultra-Efficient LLMs on End Devices

Paper • 2506.07900 • Published about 1 month ago • 82

Reinforcement Pre-Training

Paper • 2506.08007 • Published about 1 month ago • 242

upvoted 4 papers about 1 month ago

MiMo-VL Technical Report

Paper • 2506.03569 • Published Jun 4 • 74

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning

Paper • 2506.01939 • Published Jun 2 • 167

HardTests: Synthesizing High-Quality Test Cases for LLM Coding

Paper • 2505.24098 • Published May 30 • 44

SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents

Paper • 2505.20411 • Published May 26 • 87