3 21 17

bohan zeng

zbhpku

AI & ML interests

None yet

Recent Activity

liked a dataset 19 days ago

Open-Dataflow/dataflow-demo-Agent

liked a dataset 19 days ago

Open-Dataflow/dataflow-demo-Text

liked a dataset 19 days ago

Open-Dataflow/dataflow-demo-Text2SQL

View all activity

Organizations

None yet

liked 4 datasets 19 days ago

upvoted a paper 24 days ago

MemOS: A Memory OS for AI System

Paper • 2507.03724 • Published 29 days ago • 144

authored a paper about 1 month ago

Native Visual Understanding: Resolving Resolution Dilemmas in Vision-Language Models

Paper • 2506.12776 • Published Jun 15 • 2

upvoted a paper about 1 month ago

Native Visual Understanding: Resolving Resolution Dilemmas in Vision-Language Models

Paper • 2506.12776 • Published Jun 15 • 2

upvoted a collection about 1 month ago

NativeRes-LLaVA

Collection

LLaVA using images with native resolution • 7 items • Updated Jun 14 • 5

liked a dataset about 2 months ago

DogNeverSleep/MME-VideoOCR_Dataset

Viewer • Updated May 29 • 2k • 55 • 1

upvoted a paper about 2 months ago

Autoregressive Images Watermarking through Lexical Biasing: An Approach Resistant to Regeneration Attack

Paper • 2506.01011 • Published Jun 1 • 9

authored 2 papers about 2 months ago

Let's Verify Math Questions Step by Step

Paper • 2505.13903 • Published May 20 • 1

MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios

Paper • 2505.21333 • Published May 27 • 39

upvoted a paper 2 months ago

MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios

Paper • 2505.21333 • Published May 27 • 39

liked a model 2 months ago

showlab/OmniConsistency

Image-to-Image • Updated Jun 4 • 1.67k • 119

upvoted a paper 2 months ago

OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data

Paper • 2505.18445 • Published May 24 • 65

liked a model 2 months ago

ByteDance-Seed/BAGEL-7B-MoT

Any-to-Any • 15B • Updated Jun 23 • 1.08k • 1.1k

upvoted a paper 4 months ago

TinyLLaVA-Video-R1: Towards Smaller LMMs for Video Reasoning

Paper • 2504.09641 • Published Apr 13 • 16

authored a paper 4 months ago

Mavors: Multi-granularity Video Representation for Multimodal Large Language Model

Paper • 2504.10068 • Published Apr 14 • 30

upvoted 2 papers 4 months ago

UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics

Paper • 2412.07774 • Published Dec 10, 2024 • 31

Mavors: Multi-granularity Video Representation for Multimodal Large Language Model

Paper • 2504.10068 • Published Apr 14 • 30

bohan zeng

AI & ML interests

Recent Activity

Organizations

zbhpku's activity