zou00080
/

llama_PPO_pos_formal

Reinforcement Learning

text-generation

text-generation-inference

Model card Files Files and versions Community

llama_PPO_pos_formal

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

zou00080's picture

Upload 8 files

bbc82de about 2 years ago