Ben Shi's picture

1 3

Ben Shi

benshi34

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

commented on a paper 3 days ago

When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

authored a paper about 2 months ago

Can Language Models Solve Olympiad Programming?

View all activity

Organizations

None yet

benshi34's activity

upvoted a paper 2 days ago

When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

Paper • 2506.05579 • Published 7 days ago • 3

commented a paper 3 days ago

When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

Paper • 2506.05579 • Published 7 days ago • 3 •

authored 3 papers about 2 months ago

Can Language Models Solve Olympiad Programming?

Paper • 2404.10952 • Published Apr 16, 2024 • 1

BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval

Paper • 2407.12883 • Published Jul 16, 2024 • 10

IMPersona: Evaluating Individual Level LM Impersonation

Paper • 2504.04332 • Published Apr 6 • 1

upvoted a paper about 2 months ago

IMPersona: Evaluating Individual Level LM Impersonation

Paper • 2504.04332 • Published Apr 6 • 1

upvoted an article 4 months ago

Article

Introducing the LiveCodeBench Leaderboard - Holistic and Contamination-Free Evaluation of Code LLMs

By

and 6 others •

Apr 16, 2024

• 15

updated a dataset 5 months ago

benshi34/qual-analysis-reasoning-retrieval

Viewer • Updated Jan 7 • 80 • 21