Tool-Augmented Reward Models - a ernie-research Collection

ernie-research 's Collections

Tool-Augmented Reward Models

Multilingual Code Pre-training (ERNIE-Code)

Pixel-based Pre-training (PixelGPT)

Macro-Action RLHF

Tool-Augmented Reward Models

updated 19 days ago

[ICLR'24 Spotlight] Tool-Augmented Reward Modeling