line-corporation
/

p-sacpo

Reinforcement Learning

text-generation

reinforcement-learning-from-human-feedback

text-generation-inference

Model card Files Files and versions

13.5 GB

3 contributors

History: 5 commits

akifumiwachi's picture

Update README.md

2901c06 verified over 1 year ago