RLHFlow
/

RewardModel-Mistral-7B-for-DPA-v1

Text Classification

text-generation-inference

Model card Files Files and versions

RewardModel-Mistral-7B-for-DPA-v1 / model-00002-of-00003.safetensors

Commit History

Upload MistralForAttributePrediction

12f4861
verified

Haoxiang-Wang commited on Apr 21, 2024