Sam Paech's picture

Sam Paech PRO

sam-paech

·

https://eqbench.com

AI & ML interests

Emotional intelligence, alignment, benchmarking

Organizations

upvoted a paper 10 months ago

EQ-Bench: An Emotional Intelligence Benchmark for Large Language Models

Paper • 2312.06281 • Published Dec 11, 2023 • 2

upvoted a paper over 1 year ago

PingPong: A Benchmark for Role-Playing Language Models with User Emulation and Multi-Model Evaluation

Paper • 2409.06820 • Published Sep 10, 2024 • 68

upvoted an article over 1 year ago

Article

ZebraLogic: Benchmarking the Logical Reasoning Ability of Language Models

Jul 27, 2024

•

34