Kawamura Masaki's picture

Kawamura Masaki

KMasaki

·

KMasaki0210

AI & ML interests

None yet

Organizations

Collections 3

View 3 collections

models 21

KMasaki/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • 2B • Updated Apr 9 • 2

KMasaki/8expert_2granularity_0shared_top2_0.52b-GRPO

KMasaki/8expert_2granularity_0shared_top2_0.52b-Distill

Text Generation • 0.5B • Updated Apr 7 • 3

KMasaki/Qwen2.5-1.5B-Open-R1-Distill

Text Generation • 2B • Updated Apr 6 • 2

KMasaki/llm-jp-3-3.7b-Open-R1-GRPO

4B • Updated Mar 29 • 3

KMasaki/DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation • 2B • Updated Mar 29 • 40

KMasaki/llm-jp-3-3.7b-Open-R1-Distill

Text Generation • 2B • Updated Mar 13 • 3

KMasaki/Llama-3.1-8B-Instruct-safety-exp1-LR_2.5e-5_MINLR_2.5e-6_WD_0.1_GC_1-iter_0000390

8B • Updated Oct 20, 2024 • 2

KMasaki/Llama-3.1-8B-Instruct-safety-exp2-LR_2.5e-5_MINLR_2.5e-6_WD_0.1_GC_1-iter_0000387

8B • Updated Oct 20, 2024 • 2

KMasaki/Llama-3.1-8B-Instruct-gsm8k-exp7-LR_2.5e-5_MINLR_2.5e-6_WD_0.1_GC_1-iter_0000123

8B • Updated Oct 17, 2024 • 2

datasets 0

None public yet