LLM Reasoning - a samar-inception Collection

samar-inception 's Collections

LLM Reasoning

updated 2 days ago

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Paper • 2505.11896 • Published 5 days ago • 50