Dongfu jiang's picture

3

Dongfu jiang

jiangdongfu

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

Knapsack RL: Unlocking Exploration of LLMs via Optimizing Budget Allocation

upvoted a paper 6 days ago

EditReward: A Human-Aligned Reward Model for Instruction-Guided Image Editing

upvoted a paper 12 days ago

VCRL: Variance-based Curriculum Reinforcement Learning for Large Language Models

View all activity

Organizations

upvoted 2 papers 6 days ago

Knapsack RL: Unlocking Exploration of LLMs via Optimizing Budget Allocation

Paper • 2509.25849 • Published 9 days ago • 42

EditReward: A Human-Aligned Reward Model for Instruction-Guided Image Editing

Paper • 2509.26346 • Published 9 days ago • 15

upvoted a paper 12 days ago

VCRL: Variance-based Curriculum Reinforcement Learning for Large Language Models

Paper • 2509.19803 • Published 15 days ago • 115