Fanqi Wan's picture

Fanqi Wan

Wanfq

·

https://fanqiwan.github.io/

AI & ML interests

Large Language Models, Model Fusion, Reasoning, Alignment

Recent Activity

liked a dataset about 1 month ago

Skywork/Skywork-OR1-RL-Data

liked a dataset about 1 month ago

a-m-team/AM-Thinking-v1-RL-Dataset

upvoted a paper about 1 month ago

Reinforcement Pre-Training

View all activity

Organizations

upvoted a paper about 1 month ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9 • 247

upvoted 7 papers about 2 months ago

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning

Paper • 2506.01939 • Published Jun 2 • 170

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Paper • 2505.22617 • Published May 28 • 125

SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond

Paper • 2505.19641 • Published May 26 • 67

VerIPO: Cultivating Long Reasoning in Video-LLMs via Verifier-Gudied Iterative Policy Optimization

Paper • 2505.19000 • Published May 25 • 43

AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting

Paper • 2505.18822 • Published May 24 • 14

QwenLong-CPRS: Towards infty-LLMs with Dynamic Context Optimization

Paper • 2505.18092 • Published May 23 • 44

QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning

Paper • 2505.17667 • Published May 23 • 89

upvoted a paper 2 months ago

Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models

Paper • 2505.04921 • Published May 8 • 179

upvoted a paper 5 months ago

FuseChat-3.0: Preference Optimization Meets Heterogeneous Model Fusion

Paper • 2503.04222 • Published Mar 6 • 15

upvoted 2 collections 6 months ago

🧠 Reasoning datasets

Datasets with reasoning traces for math and code released by the community • 24 items • Updated May 19 • 161

FuseO1-Preview

System-II Reasoning Fusion of LLMs • 11 items • Updated Apr 8 • 22

upvoted an article 6 months ago

Article

FuseO1-Preview: System-II Reasoning Fusion of LLMs

By

and 4 others •

Jan 20

• 21

upvoted an article 7 months ago

Article

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

By

and 2 others •

Dec 18, 2024

• 5

upvoted 2 collections 7 months ago

FuseChat 3.0

Preference Optimization for Implicit Model Fusion • 11 items • Updated Jan 16 • 1

FuseChat 3.0

Preference Optimization for Implicit Model Fusion • 14 items • Updated Mar 7 • 14

upvoted a paper 8 months ago

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12

upvoted a paper 11 months ago

FuseChat: Knowledge Fusion of Chat Models

Paper • 2408.07990 • Published Aug 15, 2024 • 14

upvoted a collection 11 months ago

FuseChat 2.0

Knowledge Fusion of Chat Models • 25 items • Updated Dec 25, 2024 • 3

upvoted a collection over 1 year ago

Tiny Series

Tiny datasets that empower the foundation of Small Language Model! • 11 items • Updated Jan 26, 2024 • 39