ajagota71
/

Qwen2.5-0.5B-detox

Reinforcement Learning

text-generation

text-generation-inference

Model card Files Files and versions

Qwen2.5-0.5B-detox

1.99 GB

1 contributor

History: 2 commits

ajagota71's picture

Final model after RLHF training

10d30c6 verified about 1 month ago