RegularizedSelfPlay
/

Llama-3-8B-Instruct-SPPO-Iter1-gp-8b-gpm-reg0.5-sppo-reversekl-table

Text Generation

text-generation-inference

Model card Files Files and versions

Llama-3-8B-Instruct-SPPO-Iter1-gp-8b-gpm-reg0.5-sppo-reversekl-table

1.52 kB

1 contributor

History: 1 commit

timxiaohangt's picture

initial commit

3597f38 verified 3 months ago

.gitattributes

1.52 kB

initial commit 3 months ago