Jinming Wu's picture

1 16 3

Jinming Wu

kimingng

·

https://kimingng.notion.site/Jinming-Kimmy-Wu-b22c1682d48d47939dcd7c41bf6a6bab?source=copy_link

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

upvoted a paper 21 days ago

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

updated a dataset about 1 month ago

lmms-lab/FVQA

View all activity

Organizations

upvoted a paper 6 days ago

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

Paper • 2509.02479 • Published 6 days ago • 78

upvoted a paper 21 days ago

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

Paper • 2508.13154 • Published 21 days ago • 58

upvoted 6 papers about 2 months ago

Towards Video Thinking Test: A Holistic Benchmark for Advanced Video Reasoning and Understanding

Paper • 2507.15028 • Published Jul 20 • 20

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published Jul 17 • 73

A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published Jul 17 • 251

SWE-Perf: Can Language Models Optimize Code Performance on Real-World Repositories?

Paper • 2507.12415 • Published Jul 16 • 41

High-Resolution Visual Reasoning via Multi-Turn Grounding-Based Reinforcement Learning

Paper • 2507.05920 • Published Jul 8 • 11

First Return, Entropy-Eliciting Explore

Paper • 2507.07017 • Published Jul 9 • 23

upvoted 2 papers 2 months ago

MMSearch-R1: Incentivizing LMMs to Search

Paper • 2506.20670 • Published Jun 25 • 63

OmniGen2: Exploration to Advanced Multimodal Generation

Paper • 2506.18871 • Published Jun 23 • 75

upvoted a paper 7 months ago

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published Feb 13 • 44

upvoted 2 papers 9 months ago

Autoregressive Video Generation without Vector Quantization

Paper • 2412.14169 • Published Dec 18, 2024 • 14

VisionZip: Longer is Better but Not Necessary in Vision Language Models

Paper • 2412.04467 • Published Dec 5, 2024 • 119

upvoted a paper 11 months ago

Video Instruction Tuning With Synthetic Data

Paper • 2410.02713 • Published Oct 3, 2024 • 40

upvoted a collection 11 months ago

LLaVA-Video

Models focus on video understanding (previously known as LLaVA-NeXT-Video). • 8 items • Updated Feb 21 • 62

upvoted a collection about 1 year ago

LMMs-Eval

Dataset Collection of LMMs-Eval • 36 items • Updated Oct 4, 2024 • 30