Adaptive Length Penalty - a SynthLabsAI Collection

SynthLabsAI 's Collections

Adaptive Length Penalty

PERSONA

Adaptive Length Penalty

updated Jun 24

Teaching language models to think efficiently with Adaptive Length Penalty (ALP)

Just Enough Thinking: Efficient Reasoning with Adaptive Length Penalties Reinforcement Learning

Paper • 2506.05256 • Published Jun 5 • 2
SynthLabsAI/ALP_DeepScaleR_1.5B_C16K

Reinforcement Learning • 2B • Updated Jun 24 • 6 • 2
SynthLabsAI/ALP_R1_Qwen1.5B

Reinforcement Learning • 2B • Updated Jun 24 • 4