Liangyu Chen's picture

3 8 7

Liangyu Chen

liangyuch

·

https://cliangyu.com/

AI & ML interests

Multimodal AI, Computer vision

Organizations

upvoted a paper 4 months ago

SmolVLM: Redefining small and efficient multimodal models

Paper • 2504.05299 • Published Apr 7 • 196

upvoted a paper 5 months ago

Video Action Differencing

Paper • 2503.07860 • Published Mar 10 • 34

upvoted a paper 7 months ago

BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature

Paper • 2501.07171 • Published Jan 13 • 56

upvoted 5 papers almost 2 years ago

Large Language Models are Visual Reasoning Coordinators

Paper • 2310.15166 • Published Oct 23, 2023 • 2

Making Your First Choice: To Address Cold Start Problem in Vision Active Learning

Paper • 2210.02442 • Published Oct 5, 2022 • 1

MIMIC-IT: Multi-Modal In-Context Instruction Tuning

Paper • 2306.05425 • Published Jun 8, 2023 • 11

Otter: A Multi-Modal Model with In-Context Instruction Tuning

Paper • 2305.03726 • Published May 5, 2023 • 6

Deep Geometrized Cartoon Line Inbetweening

Paper • 2309.16643 • Published Sep 28, 2023 • 25