tzwilliam0
/

maxmin-dpo-init-kl-coef-0.1-rebuttal-dongnan

Reinforcement Learning

Model card Files Files and versions Community

maxmin-dpo-init-kl-coef-0.1-rebuttal-dongnan

Ctrl+K

Ctrl+K

2 contributors

History: 3 commits

v-guidongnan

add all

0fbdeeb 3 months ago