Thanh-Long V. Le's picture

2 4

Thanh-Long V. Le

bltnynk

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 10 hours ago

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning

upvoted a paper 11 days ago

No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping

commented on a paper 11 days ago

No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping

View all activity

Organizations

None yet

commented a paper 11 days ago

No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping

Paper • 2509.21880 • Published 14 days ago • 39 •

New activity in OpenCoder-LLM/RefineCode-code-corpus-meta 6 months ago

Further release and details

#1 opened 11 months ago by