xiaotong's picture

xiaotong

xtongji

AI & ML interests

None yet

Recent Activity

upvoted a paper 26 days ago

Decoding as Optimisation on the Probability Simplex: From Top-K to Top-P (Nucleus) to Best-of-K Samplers

upvoted a paper about 1 month ago

Multi-Task GRPO: Reliable LLM Reasoning Across Tasks

authored a paper about 2 months ago

Bourbaki: Self-Generated and Goal-Conditioned MDPs for Theorem Proving

View all activity

Organizations

None yet

Papers 3

arxiv:2601.21590

arxiv:2509.22921

arxiv:2507.02726

models 0

None public yet

datasets 0

None public yet