Xin Liu's picture

4 2

Xin Liu

xinliucs

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives

liked a dataset 6 days ago

launch/ExpertLongBench

upvoted a paper 28 days ago

ExpertLongBench: Benchmarking Language Models on Expert-Level Long-Form Generation Tasks with Structured Checklists

View all activity

Organizations

upvoted a paper 6 days ago

CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives

Paper • 2504.10823 • Published Apr 15 • 15

upvoted a paper 28 days ago

ExpertLongBench: Benchmarking Language Models on Expert-Level Long-Form Generation Tasks with Structured Checklists

Paper • 2506.01241 • Published Jun 2 • 9

upvoted a paper about 2 months ago

VeriFact: Enhancing Long-Form Factuality Evaluation with Refined Fact Extraction and Reference Facts

Paper • 2505.09701 • Published May 14 • 2

upvoted a paper 3 months ago

MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges?

Paper • 2504.09702 • Published Apr 13 • 18