Xinyu Zhu

TianHongZXY

3 20 14

https://zhuxinyu.top

AI & ML interests

Large Language Models; Reasoning; Reinforcement Learning

Recent Activity

authored a paper 5 days ago

Self-Guided Test-Time Training for Long-Context LLMs

upvoted a paper 13 days ago

Self-Guided Test-Time Training for Long-Context LLMs

new activity about 1 month ago

TianHongZXY/CHIMERA-4B-RL:Add paper link and model metadata

View all activity

Organizations

Collections 2

Papers 15

models 12

datasets 6

TianHongZXY/CHIMERA

Viewer • Updated Apr 17 • 9.23k • 262 • 22

TianHongZXY/aime-1983-2025

Viewer • Updated Apr 16, 2025 • 963 • 113

TianHongZXY/AIME2025

Viewer • Updated Mar 22, 2025 • 30 • 353 • 1

TianHongZXY/AIME2024

Viewer • Updated Mar 22, 2025 • 30 • 147

TianHongZXY/amc23

Viewer • Updated Mar 22, 2025 • 40 • 410

TianHongZXY/MATH

Viewer • Updated Jan 12, 2025 • 12.5k • 1.17k • 3

Xinyu Zhu

AI & ML interests

Recent Activity

Organizations

Collections 2

TianHongZXY/CHIMERA-4B-SFT

TianHongZXY/CHIMERA

TianHongZXY/CHIMERA-4B-RL

TianHongZXY/Qwen2.5-Math-7B-PSR

TianHongZXY/Qwen2.5-Math-7B-NSR

TianHongZXY/Qwen2.5-Math-7B-PPO

TianHongZXY/Qwen2.5-Math-7B-GRPO

TianHongZXY/CHIMERA-4B-SFT

TianHongZXY/CHIMERA

TianHongZXY/CHIMERA-4B-RL

TianHongZXY/Qwen2.5-Math-7B-PSR

TianHongZXY/Qwen2.5-Math-7B-NSR

TianHongZXY/Qwen2.5-Math-7B-PPO

TianHongZXY/Qwen2.5-Math-7B-GRPO

Papers 15

models 12

TianHongZXY/CHIMERA-4B-RL

TianHongZXY/CHIMERA-4B-SFT

TianHongZXY/Qwen3-4B-NSR

TianHongZXY/Qwen2.5-Math-7B-GRPO

TianHongZXY/OpenR1-Math-46k-8192-Qwen2.5-7B-Instruct-GRPO-clip_0.28

TianHongZXY/Qwen2.5-Math-7B-W-REINFORCE

TianHongZXY/Qwen3-4B-GRPO

TianHongZXY/Qwen3-4B-PPO

TianHongZXY/Qwen3-4B-PSR

TianHongZXY/Qwen2.5-Math-7B-PPO

datasets 6

TianHongZXY/CHIMERA

TianHongZXY/aime-1983-2025

TianHongZXY/AIME2025

TianHongZXY/AIME2024

TianHongZXY/amc23

TianHongZXY/MATH

Xinyu Zhu

AI & ML interests

Recent Activity

Organizations

Collections 2

Papers 15

models 12 Sort: Recently updated

datasets 6 Sort: Recently updated

models 12

datasets 6