estnafinema0
/

smolLM-variation-ppo

Text Generation

Proximal Policy Optimization

text-generation-inference

Model card Files Files and versions Community

smolLM-variation-ppo

Commit History

Update README.md

8b64bc1
verified

estnafinema0 commited on Mar 30

Upload tokenizer

c52613f
verified

estnafinema0 commited on Mar 30

Upload LlamaForCausalLM

f3976ed
verified

estnafinema0 commited on Mar 30

initial commit

97f7ce1
verified

estnafinema0 commited on Mar 30