Xin Lai's picture

6 9 1

Xin Lai

xinlai

·

x-lai

AI & ML interests

Multimodal LLM, LLM Reasoning, Point Cloud Segmentation, Image Segmentation

Recent Activity

upvoted a paper 7 days ago

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

upvoted a paper about 2 months ago

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

upvoted a paper 2 months ago

Scaling RL to Long Videos

View all activity

Organizations

None yet

Collections 1

Papers 2

arxiv:2406.18629

arxiv:2309.12307

models 21

xinlai/Qwen2-7B-Instruct-Step-DPO

Text Generation • 8B • Updated Jun 29, 2024 • 263 • 3

xinlai/Qwen2-57B-A14B-SFT-Step-DPO

Text Generation • 57B • Updated Jun 28, 2024 • 6 • 1

xinlai/Qwen1.5-32B-SFT-Step-DPO

Text Generation • 33B • Updated Jun 28, 2024 • 10 • 1

xinlai/Llama-3-70B-SFT-Step-DPO

Text Generation • 71B • Updated Jun 28, 2024 • 4

xinlai/DeepSeekMath-Base-SFT-Step-DPO

Text Generation • 7B • Updated Jun 28, 2024 • 13

xinlai/Qwen2-7B-SFT-Step-DPO

Text Generation • 8B • Updated Jun 28, 2024 • 5

xinlai/Qwen2-72B-Instruct-Step-DPO

Text Generation • 73B • Updated Jun 28, 2024 • 7

xinlai/DeepSeekMath-RL-Step-DPO

Text Generation • 7B • Updated Jun 28, 2024 • 37 • 2

xinlai/Qwen2-57B-A14B-SFT

Text Generation • 57B • Updated Jun 26, 2024 • 4

xinlai/Qwen1.5-32B-SFT

Text Generation • 33B • Updated Jun 26, 2024 • 8

datasets 1

xinlai/Math-Step-DPO-10K

Viewer • Updated Jul 4, 2024 • 10.8k • 397 • 57