TamasSimonds (Toby Simonds)

Papers 4

arxiv:2504.19394

arxiv:2503.00735

arxiv:2412.04645

arxiv:2410.07490

models 7

datasets 7

TamasSimonds/record-test4

Viewer • Updated Dec 16, 2025 • 2.19k • 11

TamasSimonds/record-test3

Updated Dec 16, 2025 • 9

TamasSimonds/olympiad-proof-problems

Viewer • Updated Aug 17, 2025 • 39.8k • 19 • 1

TamasSimonds/poker_safety_realignment

Viewer • Updated Aug 15, 2025 • 70 • 8

TamasSimonds/imo-dataset

Viewer • Updated Aug 9, 2025 • 370 • 3

TamasSimonds/TextbooksToRLQuestions-100k

Viewer • Updated Mar 25, 2025 • 108k • 11 • 5

TamasSimonds/ReasonSet

Viewer • Updated Nov 28, 2024 • 1.78k • 12

Toby Simonds

AI & ML interests

Organizations

Papers 4

models 7

TamasSimonds/llama3.1-8b-kp-1k-self-play-step-336-sys-prompt

TamasSimonds/spiral-qwen2-5-3b-base-KP-1k-self-play-1-1-step-192

TamasSimonds/spiral-qwen3-8b-base-KP-1k-self-play-1-1-step-192

TamasSimonds/spiral-llama-3B-base-KP-1k-self-play-1-1-step-192

TamasSimonds/Qwen3-4B-KP-no-sys-prompt-1k-self-play-1-1-step-192

TamasSimonds/spiral-qwen3-4b-base-KP-1k-self-play-1.1_0707T15-09-49

TamasSimonds/O1-Llama-3.2-3B

datasets 7

TamasSimonds/record-test4

TamasSimonds/record-test3

TamasSimonds/olympiad-proof-problems

TamasSimonds/poker_safety_realignment

TamasSimonds/imo-dataset

TamasSimonds/TextbooksToRLQuestions-100k

TamasSimonds/ReasonSet

Toby Simonds

AI & ML interests

Organizations

Papers 4

models 7 Sort: Recently updated

datasets 7 Sort: Recently updated

models 7

datasets 7