VisOnlyQA - a ryokamoi Collection

ryokamoi 's Collections

FoVer

VisOnlyQA

updated May 21

Dataset for evaluating the visual perception capabilities of LVLMs.

VisOnlyQA: Large Vision Language Models Still Struggle with Visual Perception of Geometric Information

Paper • 2412.00947 • Published Dec 1, 2024 • 8
ryokamoi/VisOnlyQA_Eval_Real_v1.1

Viewer • Updated Mar 29 • 900 • 223
ryokamoi/VisOnlyQA_Eval_Synthetic

Viewer • Updated Mar 29 • 700 • 178 • 2
ryokamoi/VisOnlyQA_Train

Viewer • Updated Mar 29 • 70k • 648 • 2
ryokamoi/VisOnlyQA_metadata

Viewer • Updated 17 days ago • 3 • 88
ryokamoi/VisOnlyQA_Eval_Real

Viewer • Updated Mar 29 • 500 • 191 • 2