programmer.ie - a ernanhughes Collection

ernanhughes 's Collections

code

programmer.ie

updated about 6 hours ago

Papers I have written about on my blog.

MARS: A Multi-Agent Framework Incorporating Socratic Guidance for Automated Prompt Optimization

Paper • 2503.16874 • Published Mar 21 • 45
System Prompt Optimization with Meta-Learning

Paper • 2505.09666 • Published May 14 • 72
UniRL: Self-Improving Unified Multimodal Models via Supervised and Reinforcement Learning

Paper • 2505.23380 • Published May 29 • 23
DeepTheorem: Advancing LLM Reasoning for Theorem Proving Through Natural Language and Reinforcement Learning

Paper • 2505.23754 • Published May 29 • 16
Guided by Gut: Efficient Test-Time Scaling with Reinforced Intrinsic Confidence

Paper • 2505.20325 • Published May 23 • 46
Reward Reasoning Model

Paper • 2505.14674 • Published May 20 • 36
I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 120
Pre-trained Large Language Models Learn Hidden Markov Models In-context

Paper • 2506.07298 • Published Jun 8 • 26
Give Me FP32 or Give Me Death? Challenges and Solutions for Reproducible Reasoning

Paper • 2506.09501 • Published Jun 11 • 17
Evolving Prompts In-Context: An Open-ended, Self-replicating Perspective

Paper • 2506.17930 • Published 20 days ago • 19
Dynamic Chunking for End-to-End Hierarchical Sequence Modeling

Paper • 2507.07955 • Published 2 days ago • 8