rubricreward

non-profit

https://rubricreward.github.io

AI & ML interests

R3/R-three/R-cube

Collections 7

View 7 collections

models 79

rubricreward/mR3-Qwen3-14B-tgt-prompt-tgt-thinking-translated

Text Generation • 15B • Updated Oct 2, 2025 • 8

rubricreward/mR3-Qwen3-8B-tgt-prompt-tgt-thinking-translated

Text Generation • 8B • Updated Oct 2, 2025 • 9

rubricreward/mR3-Qwen3-4B-tgt-prompt-tgt-thinking-translated

Text Generation • 4B • Updated Oct 2, 2025 • 6

rubricreward/mR3-Qwen3-14B-tgt-prompt-tgt-thinking

Text Generation • 15B • Updated Oct 2, 2025 • 46

rubricreward/mR3-Qwen3-8B-tgt-prompt-tgt-thinking

Text Generation • 8B • Updated Oct 2, 2025 • 11

rubricreward/mR3-Qwen3-4B-tgt-prompt-tgt-thinking

Text Generation • 4B • Updated Oct 2, 2025 • 36 • 1

rubricreward/mR3-Qwen3-4B-tgt-prompt-en-thinking

Text Generation • 4B • Updated Oct 2, 2025 • 7

rubricreward/mR3-Qwen3-8B-tgt-prompt-en-thinking

Text Generation • 8B • Updated Oct 2, 2025 • 37

rubricreward/mR3-Qwen3-14B-tgt-prompt-en-thinking

Text Generation • 15B • Updated Oct 2, 2025 • 9

rubricreward/mR3-Qwen3-14B-en-prompt-en-thinking

Text Generation • 15B • Updated Oct 2, 2025 • 23 • 1

datasets 171

rubricreward/mmr3-synthalign

Viewer • Updated Feb 10 • 12.4k • 11

rubricreward/mmr3-bpo

Viewer • Updated Feb 10 • 14.4k • 18

rubricreward/mR3-Dataset-100K-EasyToHard

Viewer • Updated Jan 29 • 100k • 490 • 2

rubricreward/m-ArenaHard-v2.0

Viewer • Updated Sep 21, 2025 • 11.5k • 21

rubricreward/reward-bench

Viewer • Updated Sep 18, 2025 • 2.99k • 17

rubricreward/mR3-Dataset-100K-EasyToHard-Truncated

Viewer • Updated Sep 17, 2025 • 99.5k • 413 • 1

rubricreward/PPE-Human-Preference

Viewer • Updated Sep 12, 2025 • 15.5k • 20

rubricreward/mR3-Dataset-100K-StartEng-EasyToHard

Viewer • Updated Sep 7, 2025 • 100k • 576 • 1

rubricreward/mR3-Dataset-100K-StartEng-HardToEasy

Viewer • Updated Sep 7, 2025 • 100k • 421

rubricreward/mR3-Dataset-100K-HardToEasy

Viewer • Updated Sep 7, 2025 • 100k • 410

View 171 datasets