kevinpro
/

R-PRM-7B-DPO

Text Generation

reinforcement-learning

Model card Files Files and versions Community

R-PRM-7B-DPO / merges.txt

kevinpro's picture

Upload folder using huggingface_hub

a4bfcc4 verified 3 months ago

history contribute delete

1.67 MB

File too large to display, you can check the raw version instead.