7 9

Xuandong Zhao

Xuandong

https://xuandongzhao.github.io/

AI & ML interests

None yet

Recent Activity

updated a model 3 days ago

sunblaze-ucb/OLMo-2-7B-SFT-GRPO-MATH-1EPOCH-SYSP

updated a model 3 days ago

sunblaze-ucb/OLMo-2-7B-SFT-Intuitor-MATH-1EPOCH-SYSP

updated a collection 3 days ago

Intuitor

View all activity

Organizations

updated 2 models 3 days ago

sunblaze-ucb/OLMo-2-7B-SFT-GRPO-MATH-1EPOCH-SYSP

Text Generation • Updated 3 days ago

sunblaze-ucb/OLMo-2-7B-SFT-Intuitor-MATH-1EPOCH-SYSP

Text Generation • Updated 3 days ago

updated a collection 3 days ago

Intuitor

Collection

Models in the paper "Learning to Reason without External Rewards" • 12 items • Updated 2 days ago

New activity in sunblaze-ucb/AgentSynth 3 days ago

Improve dataset card: update task category, add descriptive tags, abstract, and code link

#2 opened 5 days ago by

nielsr

published 2 models 4 days ago

sunblaze-ucb/OLMo-2-7B-SFT-GRPO-MATH-1EPOCH-SYSP

Text Generation • Updated 3 days ago

sunblaze-ucb/OLMo-2-7B-SFT-Intuitor-MATH-1EPOCH-SYSP

Text Generation • Updated 3 days ago

New activity in LLM360/guru-RL-92k 6 days ago

Test set is empty?

#10 opened 6 days ago by

Xuandong

upvoted a paper 8 days ago

AgentSynth: Scalable Task Generation for Generalist Computer-Use Agents

Paper • 2506.14205 • Published 10 days ago • 6

commented a paper 8 days ago

AgentSynth: Scalable Task Generation for Generalist Computer-Use Agents

Paper • 2506.14205 • Published 10 days ago • 6 •

New activity in sunblaze-ucb/AgentSynth 8 days ago

Add reinforcement-learning task category, link to paper, and project page

#1 opened 9 days ago by

nielsr

updated 5 models 10 days ago

updated a collection 11 days ago

Intuitor

Collection

Models in the paper "Learning to Reason without External Rewards" • 12 items • Updated 2 days ago

published a model 11 days ago

sunblaze-ucb/Qwen3-14B-GRPO-MATH-1EPOCH

Text Generation • Updated 10 days ago • 2

updated a model 11 days ago

Xuandong/Qwen3-14B-Intuitor-MATH-1EPOCH-R16-A100-ENLOSS

Updated 11 days ago • 2

published a model 11 days ago

Xuandong/Qwen3-14B-Intuitor-MATH-1EPOCH-R16-A100-ENLOSS

Updated 11 days ago • 2

Xuandong Zhao

AI & ML interests

Recent Activity

Organizations

Xuandong's activity

Improve dataset card: update task category, add descriptive tags, abstract, and code link

Test set is empty?

Add reinforcement-learning task category, link to paper, and project page