LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
7.43k
•
94
Viewer
•
Updated
•
164
•
72.2k
•
315
Viewer
•
Updated
•
541
•
22.1k
•
66
Viewer
•
Updated
•
7.79k
•
326k
•
192
Updated
•
282k
•
61
Viewer
•
Updated
•
12.1k
•
49k
•
351
Viewer
•
Updated
•
231k
•
125k
•
462
Viewer
•
Updated
•
1.63k
•
38.3k
•
243
Viewer
•
Updated
•
17.6k
•
543k
•
720
Viewer
•
Updated
•
60k
•
296k
•
119
Updated
•
32.8k
•
54
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
464
•
17
Viewer
•
Updated
•
34.6k
•
2.85k
•
110
Viewer
•
Updated
•
95.4k
•
3.68k
•
49