1 14 4

Yifan Zeng

yokey

https://xhmy.github.io/

AI & ML interests

Large Language Model, Agentic AI, Deep Learning

Recent Activity

upvoted a paper 3 minutes ago

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

upvoted a paper 14 days ago

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

upvoted an article 16 days ago

Fine-tune Deepseek-R1 with a Synthetic Reasoning Dataset

View all activity

Organizations

None yet

yokey's activity

upvoted a paper 3 minutes ago

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published about 10 hours ago • 1

upvoted a paper 14 days ago

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

Paper • 2502.18449 • Published 15 days ago • 68

upvoted an article 16 days ago

Article

Fine-tune Deepseek-R1 with a Synthetic Reasoning Dataset

•

about 1 month ago

• 48

upvoted a paper about 2 months ago

LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs

Paper • 2501.06186 • Published Jan 10 • 61

upvoted a paper 3 months ago

Token-Budget-Aware LLM Reasoning

Paper • 2412.18547 • Published Dec 24, 2024 • 46

upvoted 3 papers 4 months ago

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

Paper • 2411.14405 • Published Nov 21, 2024 • 58

Unpacking SDXL Turbo: Interpreting Text-to-Image Models with Sparse Autoencoders

Paper • 2410.22366 • Published Oct 28, 2024 • 78

OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization

Paper • 2410.19609 • Published Oct 25, 2024 • 17

upvoted a paper 5 months ago

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

Paper • 2410.13828 • Published Oct 17, 2024 • 4

upvoted 2 papers 6 months ago

Training Language Models to Self-Correct via Reinforcement Learning

Paper • 2409.12917 • Published Sep 19, 2024 • 138

Towards a Unified View of Preference Learning for Large Language Models: A Survey

Paper • 2409.02795 • Published Sep 4, 2024 • 72

upvoted 2 papers 11 months ago

Stream of Search (SoS): Learning to Search in Language

Paper • 2404.03683 • Published Apr 1, 2024 • 31

Social Skill Training with Large Language Models

Paper • 2404.04204 • Published Apr 5, 2024 • 16

upvoted a paper 12 months ago

AutoDefense: Multi-Agent LLM Defense against Jailbreak Attacks

Paper • 2403.04783 • Published Mar 2, 2024 • 2