LLM-papers - a llouice Collection

llouice 's Collections

LLM-papers

updated 4 days ago

SSRL: Self-Search Reinforcement Learning

Paper • 2508.10874 • Published 25 days ago • 91
Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens

Paper • 2508.01191 • Published Aug 2 • 234
Thinking with Nothinking Calibration: A New In-Context Learning Paradigm in Reasoning Large Language Models

Paper • 2508.03363 • Published Aug 5 • 1
MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

Paper • 2507.14683 • Published Jul 19 • 128