merve
/

Qwen2.5-VL-3B-Instruct-trl-mpo-rlaif-v

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-VL-3B-Instruct-trl-mpo-rlaif-v / runs /Jul23_12-45-37_6818cf0925f0

35.1 kB

1 contributor

History: 11 commits

merve's picture

merve HF Staff

Training in progress, step 110

f709810 verified 2 months ago

events.out.tfevents.1753275050.6818cf0925f0.789.0

35.1 kB
xet

Training in progress, step 110 2 months ago