1 14 4

Shun Zheng

shun-zheng

AI & ML interests

None yet

Recent Activity

liked a dataset 4 days ago

Skywork/Skywork-OR1-RL-Data

upvoted a paper 4 days ago

Skywork Open Reasoner 1 Technical Report

upvoted a paper 5 days ago

A Survey of Context Engineering for Large Language Models

View all activity

Organizations

liked a dataset 4 days ago

Skywork/Skywork-OR1-RL-Data

Viewer • Updated May 29 • 119k • 986 • 51

upvoted a paper 4 days ago

Skywork Open Reasoner 1 Technical Report

Paper • 2505.22312 • Published May 28 • 55

upvoted 2 papers 5 days ago

A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published 14 days ago • 221

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 39

upvoted 4 papers 7 days ago

Test-Time Scaling with Reflective Generative Model

Paper • 2507.01951 • Published 29 days ago • 98

STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models

Paper • 2507.15375 • Published 11 days ago • 25

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published 9 days ago • 33

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

Paper • 2507.14683 • Published 12 days ago • 117

liked a model 8 days ago

nvidia/AceReason-Nemotron-1.1-7B

Text Generation • 8B • Updated 21 days ago • 45.3k • • 55

upvoted 2 papers 23 days ago

ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs

Paper • 2506.18896 • Published Jun 23 • 28

Skywork-R1V3 Technical Report

Paper • 2507.06167 • Published 23 days ago • 66

commented 2 papers 25 days ago

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 39 •

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 39 •

upvoted a paper 27 days ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9 • 252

upvoted a paper 29 days ago

Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

Paper • 2507.00432 • Published about 1 month ago • 72

upvoted a collection about 1 month ago

AceReason

Collection

Math and Code reasoning model trained through reinforcement learning (RL) • 7 items • Updated 10 days ago • 14

commented 2 papers about 1 month ago

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 39 •

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 39 •

upvoted a paper about 1 month ago

AceReason-Nemotron 1.1: Advancing Math and Code Reasoning through SFT and RL Synergy

Paper • 2506.13284 • Published Jun 16 • 24

commented a paper about 1 month ago

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 39 •

Shun Zheng

AI & ML interests

Recent Activity

Organizations

shun-zheng's activity