tzwilliam0
/

maxmin-dpo-init-kl-coef-0.5-rebuttal-dongnan

Reinforcement Learning

Model card Files Files and versions Community

maxmin-dpo-init-kl-coef-0.5-rebuttal-dongnan

Commit History

add all

d4e98c4

v-guidongnan commited on Mar 27

Upload model

f009ddf
verified

tzwilliam0 commited on Mar 27

initial commit

3374b3d
verified

tzwilliam0 commited on Mar 27