9 20 4

HUANG SHAOHAN

buaahsh

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

Reinforcement Pre-Training

upvoted a paper 4 days ago

BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation

upvoted a paper 15 days ago

On-Policy RL with Optimal Reward Baseline

View all activity

Organizations

buaahsh's activity

upvoted 2 papers 4 days ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published 4 days ago • 194

BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation

Paper • 2506.07530 • Published 5 days ago • 18

upvoted a paper 15 days ago

On-Policy RL with Optimal Reward Baseline

Paper • 2505.23585 • Published 15 days ago • 14

upvoted a paper 23 days ago

Reward Reasoning Model

Paper • 2505.14674 • Published 24 days ago • 35

upvoted a paper 24 days ago

Think Only When You Need with Large Hybrid-Reasoning Models

Paper • 2505.14631 • Published 24 days ago • 19

authored a paper about 2 months ago

BitNet b1.58 2B4T Technical Report

Paper • 2504.12285 • Published Apr 16 • 73

liked a model about 2 months ago

microsoft/bitnet-b1.58-2B-4T

Text Generation • Updated May 1 • 13.1k • 1.06k

authored a paper 5 months ago

GeAR: Generation Augmented Retrieval

Paper • 2501.02772 • Published Jan 6 • 23

upvoted a paper 6 months ago

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published Dec 11, 2024 • 46

commented a paper 6 months ago

MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25, 2024 • 29 •

authored a paper 6 months ago

On Domain-Specific Post-Training for Multimodal Large Language Models

Paper • 2411.19930 • Published Nov 29, 2024 • 29

upvoted a paper 6 months ago

On Domain-Specific Post-Training for Multimodal Large Language Models

Paper • 2411.19930 • Published Nov 29, 2024 • 29

liked a model 6 months ago

AdaptLLM/Adapt-MLLM-to-Domains

Updated Mar 21 • 12

authored a paper 7 months ago

MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25, 2024 • 29

upvoted a paper 7 months ago

MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25, 2024 • 29

commented a paper 7 months ago

MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25, 2024 • 29 •

upvoted 2 papers 11 months ago

Multi-Head Mixture-of-Experts

Paper • 2404.15045 • Published Apr 23, 2024 • 61

E5-V: Universal Embeddings with Multimodal Large Language Models

Paper • 2407.12580 • Published Jul 17, 2024 • 41

authored a paper 12 months ago

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Paper • 2406.14491 • Published Jun 20, 2024 • 94

upvoted a paper 12 months ago

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Paper • 2406.14491 • Published Jun 20, 2024 • 94