nanoverl (nanoverl)

koalazf99

authored a paper 2 months ago

OctoThinker: Mid-training Incentivizes Reinforcement Learning Scaling

Paper • 2506.20512 • Published Jun 25 • 46

koalazf99

authored a paper 3 months ago

Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective

Paper • 2506.14965 • Published Jun 17 • 49

koalazf99

updated a dataset 4 months ago

nanoverl/aime2025_repeated_8x

Viewer • Updated May 8 • 240 • 3

koalazf99

published a dataset 4 months ago

nanoverl/aime2025_repeated_8x

Viewer • Updated May 8 • 240 • 3

koalazf99

updated a dataset 4 months ago

nanoverl/aime2025

Viewer • Updated May 8 • 30 • 2

koalazf99

published a dataset 4 months ago

nanoverl/aime2025

Viewer • Updated May 8 • 30 • 2

koalazf99

in nanoverl/finqa 4 months ago

[bot] Conversion to Parquet

#1 opened 4 months ago by

parquet-converter

koalazf99

published a dataset 4 months ago

nanoverl/finqa

Viewer • Updated May 6 • 1.15k • 1

koalazf99

updated a dataset 4 months ago

nanoverl/finqa

Viewer • Updated May 6 • 1.15k • 1

koalazf99

authored a paper 5 months ago

MegaMath: Pushing the Limits of Open Math Corpora

Paper • 2504.02807 • Published Apr 3 • 34

koalazf99

authored a paper 7 months ago

Sailor2: Sailing in South-East Asia with Inclusive Multilingual LLMs

Paper • 2502.12982 • Published Feb 18 • 18

koalazf99

updated 6 datasets 7 months ago

koalazf99

published 3 datasets 7 months ago

nanoverl/deepscaler

Viewer • Updated Feb 16 • 40.3k • 8

nanoverl/olympiad_bench

Viewer • Updated Feb 16 • 675 • 1

nanoverl/minerva

Viewer • Updated Feb 16 • 272 • 2

AI & ML interests

Team members 1

nanoverl's activity

[bot] Conversion to Parquet