xiaoqijian's picture

4 2

xiaoqijian

mx1024

·

AI & ML interests

None yet

Recent Activity

authored a paper 28 days ago

Stress Testing Generalization: How Minor Modifications Undermine Large Language Model Performance

authored a paper 28 days ago

Evaluation is All You Need: Strategic Overclaiming of LLM Reasoning Capabilities Through Evaluation Design

upvoted a paper 28 days ago

Evaluation is All You Need: Strategic Overclaiming of LLM Reasoning Capabilities Through Evaluation Design

View all activity

Organizations

mx1024 's models

None public yet