7 4 13

Yapei Chang PRO

yapeichang

https://lilakk.github.io/

AI & ML interests

NLP

Recent Activity

published a model about 1 month ago

yapeichang/grpo_olmo3_pretrain_sft_ckpt_80pct

published a model about 1 month ago

yapeichang/sft_olmo3_pretrain_ckpt_80pct

published a model about 1 month ago

yapeichang/grpo_olmo3_pretrain_sft_ckpt_10pct

View all activity

Organizations

Collections 1

Papers 7

models 42

datasets 4

yapeichang/WebOrganizer-format-topic-merged-Llama-3.1-8B

Viewer • Updated Jul 14, 2025 • 1M • 2.04k

yapeichang/WebOrganizer-format-topic-merged-Llama-3.1-405B-FP8

Viewer • Updated Jul 9, 2025 • 100k • 52

yapeichang/hotpotqa-filtered

Viewer • Updated Jun 17, 2025 • 5.31k • 31

yapeichang/BLEUBERI-Tulu3-50k

Viewer • Updated Jun 9, 2025 • 50k • 599 • 1

Yapei Chang PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

BLEUBERI: BLEU is a surprisingly effective reward for instruction following

yapeichang/BLEUBERI-Tulu3-50k

yapeichang/Qwen2.5-7B-BLEUBERI

yapeichang/Qwen2.5-7B-RM8B

BLEUBERI: BLEU is a surprisingly effective reward for instruction following

yapeichang/BLEUBERI-Tulu3-50k

yapeichang/Qwen2.5-7B-BLEUBERI

yapeichang/Qwen2.5-7B-RM8B

Papers 7

models 42

yapeichang/memo-32b-4tier

yapeichang/memo-7b-4tier-50B-preserved

yapeichang/memo-7b-4tier

yapeichang/grpo_olmo3_pretrain_sft_ckpt_80pct

yapeichang/sft_olmo3_pretrain_ckpt_80pct

yapeichang/grpo_olmo3_pretrain_sft_ckpt_10pct

yapeichang/grpo_olmo3_pretrain_sft_ckpt_25pct

yapeichang/grpo_olmo3_pretrain_sft_ckpt_50pct

yapeichang/grpo_olmo3_pretrain_sft_ckpt_100pct

yapeichang/memo-7b

datasets 4

yapeichang/WebOrganizer-format-topic-merged-Llama-3.1-8B

yapeichang/WebOrganizer-format-topic-merged-Llama-3.1-405B-FP8

yapeichang/hotpotqa-filtered

yapeichang/BLEUBERI-Tulu3-50k

Yapei Chang PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 7

models 42 Sort: Recently updated

datasets 4 Sort: Recently updated

models 42

datasets 4