Jack Ronaldo

Jack99j

1

·

AI & ML interests

None yet

Organizations

None yet

commented a paper about 1 year ago

Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning

Paper • 2505.03318 • Published May 6, 2025 • 94 •

commented a paper over 1 year ago

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24, 2025 • 121 •