Juyoung Suk's picture

Juyoung Suk PRO

juyoungml

·

https://juyoungml.github.io/

AI & ML interests

LLM

Recent Activity

new activity 21 days ago

trillionlabs/Tri-21B-Think:Device assertion errors with transformers

liked a model 21 days ago

trillionlabs/Tri-21B-Think

upvoted a paper 21 days ago

Generative Visual Code Mobile World Models

View all activity

Organizations

authored 3 papers 11 months ago

MM-Eval: A Multilingual Meta-Evaluation Benchmark for LLM-as-a-Judge and Reward Models

Paper • 2410.17578 • Published Oct 23, 2024 • 1

LLM-as-an-Interviewer: Beyond Static Testing Through Dynamic LLM Evaluation

Paper • 2412.10424 • Published Dec 10, 2024 • 2

Trillion 7B Technical Report

Paper • 2504.15431 • Published Apr 21, 2025 • 38

authored 2 papers over 1 year ago

Evaluating Language Models as Synthetic Data Generators

Paper • 2412.03679 • Published Dec 4, 2024 • 47

The BiGGen Bench: A Principled Benchmark for Fine-grained Evaluation of Language Models with Language Models

Paper • 2406.05761 • Published Jun 9, 2024 • 3

authored 2 papers almost 2 years ago

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published May 2, 2024 • 124

CLIcK: A Benchmark Dataset of Cultural and Linguistic Intelligence in Korean

Paper • 2403.06412 • Published Mar 11, 2024 • 3