chenggong1995
/

Qwen-2.5-Base-7B-gen8-mix_hint50-grpo-CL-beta0-epoch1-v2

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-Base-7B-gen8-mix_hint50-grpo-CL-beta0-epoch1-v2 / tokenizer.json

Commit History

Training in progress, epoch 0

4df2947
verified

chenggong1995 commited on May 16