JayHyeon
/

Qwen_0.5-ultrainteract_IRPO_5e-7-1ep_0.5bdpo_lambda

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen_0.5-ultrainteract_IRPO_5e-7-1ep_0.5bdpo_lambda / .gitattributes

Commit History

Training in progress, step 500

6e8f074
verified

JayHyeon commited on Mar 29

initial commit

0769e8e
verified

JayHyeon commited on Mar 29