RLMs (Reasoning Language Models) - a sugatoray Collection

sugatoray 's Collections

Papers + RL/Reasoning

Marimo

RLMs (Reasoning Language Models)

Books And Notes

Reasoning Datasets

SmolAgents Tools (Spaces)

Bookmark::Models

LLMs

AV LLMs

LLM Training Datasets

Papers

Leaderboards 🔥

Papers-Fundamentals

TFM: TimeSeries Foundation Models

Papers-Benchmarks

LLMs-EmbeddingModels

LLM + Datasets : Finance

RLMs (Reasoning Language Models)

updated 13 days ago

LADDER: Self-Improving LLMs Through Recursive Problem Decomposition

Paper • 2503.00735 • Published Mar 2 • 22
START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6 • 114
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning

Paper • 2503.05592 • Published Mar 7 • 27
R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcing Learning

Paper • 2503.05379 • Published Mar 7 • 39
RekaAI/reka-flash-3

21B • Updated Mar 13 • 1.48k • 380
RekaAI/VibeEval

Viewer • Updated Dec 12, 2024 • 269 • 1.07k • 47
Qwen/QwQ-32B

Text Generation • 33B • Updated Mar 11 • 196k • • 2.82k
open-r1/OlympicCoder-7B

Text Generation • 8B • Updated Mar 17 • 1.08k • • 180
open-r1/OlympicCoder-32B

Text Generation • 33B • Updated Mar 17 • 802 • • 156
Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn't

Paper • 2503.16219 • Published Mar 20 • 51
predibase/Predibase-T2T-32B-RFT

33B • Updated Mar 19 • 31 • 19
agentica-org/DeepCoder-1.5B-Preview

Text Generation • 2B • Updated Apr 9 • 1.41k • 66
agentica-org/DeepCoder-14B-Preview

Text Generation • 15B • Updated May 11 • 27.2k • • 668
reasonir/ReasonIR-8B

Feature Extraction • 8B • Updated May 13 • 4.38k • 53
deepseek-ai/DeepSeek-R1-0528

Text Generation • 685B • Updated May 29 • 491k • • 2.34k
nvidia/Nemotron-Research-Reasoning-Qwen-1.5B

Text Generation • 2B • Updated 10 days ago • 9.73k • 180
Haoz0206/Omni-R1

Video-Text-to-Text • 9B • Updated May 28 • 295 • 22
mistralai/Magistral-Small-2506

Text Generation • 24B • Updated 5 days ago • 47.4k • 590
microsoft/Phi-4-mini-reasoning

Text Generation • 4B • Updated May 1 • 32.1k • 196
microsoft/Phi-4-mini-flash-reasoning

Text Generation • 4B • Updated 14 days ago • 12.5k • 212
microsoft/Phi-4-reasoning

Text Generation • 15B • Updated Jun 13 • 8.2k • 200
osmosis-ai/Osmosis-Apply-1.7B

Text Generation • 2B • Updated 30 days ago • 500 • 83