Haote Yang's picture

1 9 1

Haote Yang

Hoter

·

Hoteryoung

AI & ML interests

None yet

Recent Activity

liked a model 6 days ago

opendatalab/MinerU2.5-2509-1.2B

upvoted a paper 6 days ago

MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing

upvoted a paper 3 months ago

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

View all activity

Organizations

liked a model 6 days ago

opendatalab/MinerU2.5-2509-1.2B

Image-Text-to-Text • 1B • Updated 6 days ago • 26.6k • 164

upvoted a paper 6 days ago

MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing

Paper • 2509.22186 • Published 9 days ago • 99

upvoted 2 papers 3 months ago

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published Jul 17 • 74

Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

Paper • 2507.00432 • Published Jul 1 • 79

updated a collection 4 months ago

MLLM/LLM

7 items • Updated Jun 17

upvoted 3 papers 4 months ago

VS-Bench: Evaluating VLMs for Strategic Reasoning and Decision-Making in Multi-Agent Environments

Paper • 2506.02387 • Published Jun 3 • 58

MME-Reasoning: A Comprehensive Benchmark for Logical Reasoning in MLLMs

Paper • 2505.21327 • Published May 27 • 83

GTR-CoT: Graph Traversal as Visual Chain of Thought for Molecular Structure Recognition

Paper • 2506.07553 • Published Jun 9 • 15

authored 2 papers 4 months ago

PM4Bench: A Parallel Multilingual Multi-Modal Multi-task Benchmark for Large Vision Language Model

Paper • 2503.18484 • Published Mar 24

GTR-CoT: Graph Traversal as Visual Chain of Thought for Molecular Structure Recognition

Paper • 2506.07553 • Published Jun 9 • 15

commented a paper 4 months ago

GTR-CoT: Graph Traversal as Visual Chain of Thought for Molecular Structure Recognition

Paper • 2506.07553 • Published Jun 9 • 15 •

upvoted a paper 11 months ago

Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining

Paper • 2410.08102 • Published Oct 10, 2024 • 21

updated a collection about 1 year ago

MLLM/LLM

7 items • Updated Jun 17

authored a paper about 1 year ago

UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios

Paper • 2408.17267 • Published Aug 30, 2024 • 23