Dooroo2025_v1.0: ์ฌ์ ๊ด๊ด ํนํ ์ฑ๋ด ๋ชจ๋ธ
์ด ๋ชจ๋ธ์ unsloth/Qwen3-4B-Instruct-2507 ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก, ๋ํ๋ฏผ๊ตญ ์ฌ์์์ ๊ด๊ด ์ ๋ณด์ ์ฌ ์ ๋ณด์ ๋ํด ํนํ๋ ์ง์์ ๊ฐ๋๋ก ํ์ธํ๋๋์์ต๋๋ค.
Unsloth ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ LoRA(Low-Rank Adaptation) ๊ธฐ๋ฒ์ผ๋ก ํจ์จ์ ์ธ ํ์ต์ ์งํํ์ผ๋ฉฐ, ์ฌ์ ์ฌํ์ ๊ดํ ์ง๋ฌธ์ ์์ฐ์ค๋ฝ๊ณ ์ ํํ ๋ต๋ณ์ ์์ฑํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
๐ ๏ธ ํ์ต ๊ณผ์ (Training Procedure)
1. ๊ธฐ๋ฐ ๋ชจ๋ธ (Base Model)
* Model: unsloth/Qwen3-4B-Instruct-2507
* Library: Unsloth๋ฅผ ์ฌ์ฉํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ต์ ํํ๊ณ ํ์ต ์๋๋ฅผ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.
2. ๋ฐ์ดํฐ์ (Dataset)
ํ์ต์๋ ์๋ ๋ ๊ฐ์ง ๋ฐ์ดํฐ์
์ ๋ณํฉํ์ฌ ์ฌ์ฉํ์ต๋๋ค. ๊ฐ ๋ฐ์ดํฐ์
์ train๊ณผ test ์คํ๋ฆฟ์ ํฉ์น ํ, train ๋ฐ์ดํฐ์
์ ๋ฌด์์๋ก ์์ด ๋ชจ๋ธ์ด ํน์ ์ฃผ์ ์ ํธํฅ๋์ง ์๋๋ก ํ์ต๋๋ค.
* kingkim/yeosu_tour: ์ฌ์ ๊ด๊ด ๋ช ์ ๊ด๋ จ ๋ฐ์ดํฐ * kingkim/yeosu_island: ์ฌ์ ์ฌ ๊ด๋ จ ๋ฐ์ดํฐ
3. ํ์ดํผํ๋ผ๋ฏธํฐ (Hyperparameters)
๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋ ์ฃผ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
LoRA ์ค์
| ํ๋ผ๋ฏธํฐ | ๊ฐ | ์ค๋ช |
|---|---|---|
r |
16 |
LoRA ํ๋ ฌ์ ๋ญํฌ (rank) |
lora_alpha |
32 |
LoRA ์ค์ผ์ผ๋ง ์ธ์ |
lora_dropout |
0.05 |
LoRA ๋ ์ด์ด์ ๋๋กญ์์ ๋น์จ |
target_modules |
q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj |
LoRA๋ฅผ ์ ์ฉํ ๋์ ๋ชจ๋ |
Training Arguments
| ํ๋ผ๋ฏธํฐ | ๊ฐ | ์ค๋ช |
|---|---|---|
num_train_epochs |
30 |
์ด ํ์ต ์ํฌํฌ ์ |
learning_rate |
4e-6 |
ํ์ต๋ฅ |
per_device_train_batch_size |
32 |
๋๋ฐ์ด์ค๋น ํ์ต ๋ฐฐ์น ํฌ๊ธฐ |
gradient_accumulation_steps |
2 |
๊ทธ๋๋์ธํธ ๋์ ์คํ |
optimizer |
adamw_8bit |
8๋นํธ AdamW ์ตํฐ๋ง์ด์ |
lr_scheduler_type |
linear |
์ ํ ํ์ต๋ฅ ์ค์ผ์ค๋ฌ |
๐ ํ๊ฐ ๊ฒฐ๊ณผ (Evaluation Results)
ํ์ต ์์ค (Training Loss)
eval_dataset์ ๋ํ ์ต์ข
ํ๊ฐ ๊ฒฐ๊ณผ์
๋๋ค. Loss๋ ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ๋ํ๋ด๋ฉฐ, ๋ฎ์์๋ก ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ข์์ ์๋ฏธํฉ๋๋ค.
| ๋ฉํธ๋ฆญ (Metric) | ๊ฐ (Value) |
|---|---|
eval_loss |
1.2925 |
eval_runtime |
30.8675 ์ด |
eval_samples_per_second |
68.556 |
eval_steps_per_second |
8.585 |
epoch |
30.0 |
์ธ๋ถ ์ ๋ฌธ๊ธฐ๊ด ํ๊ฐ
์ธ๋ถ ์ ๋ฌธ๊ธฐ๊ด์ LLM ํ์ง ํ๊ฐ ๊ฒฐ๊ณผ, ์ด์ 4.5/5์ ์ด์์ ํ๋ํ์ฌ ๋ชฉํ์น๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. ์ด๋ ๊ฒฝ์ ๋ชจ๋ธ์ธ GPT-3.5์ ํ๊ท ์ ์(4.43)๋ฅผ ์ํํ๋ ์์ค์ด๋ฉฐ, ๊ณํ์์ ์ค์ ๋ ๊ฐ๋ณ ๋ชฉํ(์ ์ฐฝ์ฑ, ์ผ๊ด์ฑ, ์ ํ์ฑ, ์๊ฒฐ์ฑ)์ ํ๊ท ๋ชฉํ์น์ธ 4.425์ ์ ๋๋ ๊ฒฐ๊ณผ์ ๋๋ค.
| ์งํ | ๊ณํ | ์ค์ | ๋ฌ์ฑ ์ฌ๋ถ |
|---|---|---|---|
| LLM ํ์ง(์ด์ ) | ํ๊ท 4.425 | โฅ 4.5/5 (์ ๋ฌธ๊ธฐ๊ด ํ๊ฐ) | ๋ฌ์ฑ (GPT-3.5 ํ๊ท 4.43 ์ํ) |
- Downloads last month
- -