Thanh-Long V. Le's picture

2 4

Thanh-Long V. Le

bltnynk

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning

upvoted a paper 12 days ago

No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping

commented on a paper 13 days ago

No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping

View all activity

Organizations

None yet

upvoted a paper 2 days ago

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning

Paper • 2510.03259 • Published 16 days ago • 42

upvoted a paper 12 days ago

No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping

Paper • 2509.21880 • Published 16 days ago • 39

upvoted a paper 13 days ago

ReviewScore: Misinformed Peer Review Detection with Large Language Models

Paper • 2509.21679 • Published 16 days ago • 62

upvoted a paper 5 months ago

Reasoning Model is Stubborn: Diagnosing Instruction Overriding in Reasoning Models

Paper • 2505.17225 • Published May 22 • 64