Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

sentence-transformers

Transformers.js

Apps

Inference Providers

Models

6,163

Full-text search

Active filters: image-text-to-text

ByteDance/Dolphin

Image-Text-to-Text • 0.4B • Updated Jul 16 • 4.33k • 508

google/gemma-3n-E4B

Image-Text-to-Text • 8B • Updated Jul 14 • 6.76k • 111

unsloth/Mistral-Small-3.2-24B-Instruct-2506-GGUF

Image-Text-to-Text • 24B • Updated Aug 26 • 57.9k • 140

moonshotai/Kimi-VL-A3B-Thinking-2506

Image-Text-to-Text • 16B • Updated Aug 18 • 165k • 326

zai-org/GLM-4.1V-9B-Thinking

Image-Text-to-Text • 10B • Updated Oct 25 • 309k • • 757

rednote-hilab/dots.ocr

Image-Text-to-Text • 3B • Updated Oct 31 • 978k • 1.16k

openbmb/MiniCPM-V-4_5

Image-Text-to-Text • 9B • Updated Oct 10 • 52.3k • 1.02k

OpenGVLab/ScaleCUA-3B

Image-Text-to-Text • 4B • Updated Sep 17 • 510 • 11

huihui-ai/Huihui-Qwen3-VL-8B-Thinking-abliterated

Image-Text-to-Text • 9B • Updated Nov 1 • 6.37k • 25

Qwen/Qwen3-VL-2B-Thinking

Image-Text-to-Text • 2B • Updated Oct 20 • 35.3k • 90

noctrex/Huihui-Qwen3-VL-30B-A3B-Instruct-abliterated-GGUF

Image-Text-to-Text • 31B • Updated Nov 7 • 6.2k • 8

nvidia/NVIDIA-Nemotron-Nano-12B-v2-VL-FP8

Image-Text-to-Text • 13B • Updated about 1 month ago • 16.8k • 44

unsloth/Qwen3-VL-2B-Instruct-GGUF

Image-Text-to-Text • 2B • Updated Oct 31 • 17k • 15

unsloth/Qwen3-VL-4B-Thinking-GGUF

Image-Text-to-Text • 4B • Updated Oct 31 • 39k • 15

unsloth/Qwen3-VL-30B-A3B-Thinking-GGUF

Image-Text-to-Text • 31B • Updated Nov 11 • 27.6k • 20

unsloth/Qwen3-VL-32B-Thinking-GGUF

Image-Text-to-Text • 33B • Updated Oct 31 • 14.5k • 14

Qwen/Qwen3-VL-2B-Instruct-GGUF

Image-Text-to-Text • 2B • Updated Nov 1 • 9.02k • 15

jzhang533/PaddleOCR-VL-For-Manga

Image-Text-to-Text • 1.0B • Updated Nov 12 • 1.9k • 112

zai-org/WebVIA-Agent

Image-Text-to-Text • 10B • Updated Nov 12 • 96 • 15

nvidia/NVIDIA-Nemotron-Parse-v1.1

Image-Text-to-Text • Updated 17 days ago • 24.1k • 113

coder3101/Qwen3-VL-4B-Instruct-heretic

Image-Text-to-Text • 4B • Updated 20 days ago • 170 • 3

NexaAI/AutoNeural

Image-Text-to-Text • Updated 11 days ago • 42 • 11

huihui-ai/Huihui-Qwen3-VL-4B-Instruct-abliterated-FP8

Image-Text-to-Text • 4B • Updated 13 days ago • 538 • 4

Keyven/german-ocr

Image-Text-to-Text • 2B • Updated 9 days ago • 14 • 3

hustvl/InfiniteVL

Image-Text-to-Text • 4B • Updated 2 days ago • 19 • 2

alecccdd/moondream3-preview-4bit

Image-Text-to-Text • Updated 9 days ago • 291 • 4

jenerallee78/Ministral-3-14B-abliterated-GGUF

Image-Text-to-Text • 14B • Updated 9 days ago • 951 • 2

prithivMLmods/proxima-ocr-d.markdown-post3.0.l-GGUF

Image-Text-to-Text • 8B • Updated 5 days ago • 261 • 2

sensenova/SenseNova-SI-1.1-Qwen2.5-VL-7B

Image-Text-to-Text • 8B • Updated 5 days ago • 234 • 2

sensenova/SenseNova-SI-1.1-Qwen2.5-VL-3B

Image-Text-to-Text • 4B • Updated 5 days ago • 222 • 2