Decision-Tree Reward Models - a RLHFlow Collection

RLHFlow 's Collections

Decision-Tree Reward Models

RLHFlow MATH Process Reward Model

Standard-format-preference-dataset

Mixture-of-preference-reward-modeling

RM-Bradley-Terry

PM-pair

RLHFLow Reward Models

Decision-Tree Reward Models

updated Feb 5

RLHFlow/Decision-Tree-Reward-Gemma-2-27B

Text Classification • 27B • Updated Jan 24 • 58 • 7
RLHFlow/Decision-Tree-Reward-Llama-3.1-8B

Text Classification • 8B • Updated Jan 24 • 9 • 7
RLHFlow/LLM-Preferences-HelpSteer2

Viewer • Updated Feb 5 • 9.13k • 9 • 1