Bo Liu's picture

Building on HF

Bo Liu

Benjamin-eecs

·

https://benjamin-eecs.github.io/

AI & ML interests

Reinforcement Learning, Reasoning, Machine Learning Systems

Recent Activity

upvoted a paper 18 days ago

Paying Less Generalization Tax: A Cross-Domain Generalization Study of RL Training for LLM Agents

liked a dataset about 2 months ago

facebook/principia-bench

upvoted a paper 2 months ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

View all activity

Organizations

Collections 1

Papers 17

arxiv:2511.03773

arxiv:2510.24684

arxiv:2510.08697

arxiv:2510.08558

models 2

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Policy

Feature Extraction • 8B • Updated Nov 24, 2024 • 1

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Value

Feature Extraction • 8B • Updated Nov 24, 2024

datasets 0

None public yet