LMMs-Lab-Encoder

community

EvolvingLMMs-Lab

AI & ML interests

None defined yet.

Recent Activity

xiangan updated a dataset about 9 hours ago

lmms-lab-encoder/ov2_quickstart

xiangan published a dataset about 10 hours ago

lmms-lab-encoder/ov2_quickstart

kcz358 authored a paper about 11 hours ago

ParaVT: Taming the Tool Prior Paradox for Parallel Tool Use in Agentic Video Reinforcement Learning

View all activity

updated a dataset about 9 hours ago

lmms-lab-encoder/ov2_quickstart

Updated about 9 hours ago

published a dataset about 10 hours ago

lmms-lab-encoder/ov2_quickstart

Updated about 9 hours ago

authored a paper about 11 hours ago

ParaVT: Taming the Tool Prior Paradox for Parallel Tool Use in Agentic Video Reinforcement Learning

Paper • 2605.20342 • Published 8 days ago • 29

updated a model 6 days ago

lmms-lab-encoder/LLaVA-OneVision-2-8B-Instruct

Image-Text-to-Text • 9B • Updated 6 days ago • 2.96k • 4

updated a dataset 12 days ago

lmms-lab-encoder/JumpScore

Viewer • Updated 12 days ago • 189 • 628

published a model 15 days ago

lmms-lab-encoder/LLaVA-OneVision-2-8B-Instruct

Image-Text-to-Text • 9B • Updated 6 days ago • 2.96k • 4

published a dataset 16 days ago

lmms-lab-encoder/JumpScore

Viewer • Updated 12 days ago • 189 • 628

updated 2 models 20 days ago

lmms-lab-encoder/onevision-encoder-large-lang-tf57

Updated 20 days ago • 42

lmms-lab-encoder/onevision-encoder-large-tf57

0.3B • Updated 20 days ago • 45

updated a collection 20 days ago

onevision-encoder

4 items • Updated 20 days ago • 6

published 2 models 20 days ago

lmms-lab-encoder/onevision-encoder-large-lang-tf57

Updated 20 days ago • 42

lmms-lab-encoder/onevision-encoder-large-tf57

0.3B • Updated 20 days ago • 45

authored a paper 22 days ago

Visual Generation in the New Era: An Evolution from Atomic Mapping to Agentic World Modeling

Paper • 2604.28185 • Published 27 days ago • 90

submitted a paper to Daily Papers 3 months ago

UniG2U-Bench: Do Unified Models Advance Multimodal Understanding?

Paper • 2603.03241 • Published Mar 3 • 87

authored a paper 3 months ago

OneVision-Encoder: Codec-Aligned Sparsity as a Foundational Principle for Multimodal Intelligence

Paper • 2602.08683 • Published Feb 9 • 52

submitted a paper to Daily Papers 3 months ago

OneVision-Encoder: Codec-Aligned Sparsity as a Foundational Principle for Multimodal Intelligence

Paper • 2602.08683 • Published Feb 9 • 52

authored 2 papers 3 months ago

ProCLIP: Progressive Vision-Language Alignment via LLM-based Embedder

Paper • 2510.18795 • Published Oct 21, 2025 • 11

DanQing: An Up-to-Date Large-Scale Chinese Vision-Language Pre-training Dataset

Paper • 2601.10305 • Published Jan 15 • 37