Hejian Sang's picture

Hejian Sang

pb09204048

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 25 days ago

On-Policy Self-Distillation for Reasoning Compression

submitted a paper 26 days ago

On-Policy Self-Distillation for Reasoning Compression

authored a paper 28 days ago

Overconfident Errors Need Stronger Correction: Asymmetric Confidence Penalties for Reinforcement Learning

View all activity

Organizations

Articles 1

Article

67

Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective

Papers 2

arxiv:2602.21420

arxiv:2510.00237

models 0

None public yet

datasets 0

None public yet