license: other
license_name: exaone
license_link: LICENSE
library_name: transformers
tags:
- trl
- sft
datasets:
- huggingface-KREW/KoCulture-Dialogues-v2
base_model:
- LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct
Model Card for EXAONE-3.5-7.8B-Instruct-KoCulture-fulltrain-transformers
์ด ๋ชจ๋ธ์ LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct ๋ชจ๋ธ์ Hugging Face KREW์ ํ๊ตญ์ด ์ ์กฐ์ด ๋ํ ๋ฐ์ดํฐ์ v2๋ก ํ์ธํ๋ํ ๊ฒ์ ๋๋ค. ์ต์ ํ๊ตญ์ด ์ ์กฐ์ด, ์ ํ์ด, ๋ฐ์ ์ฌ์ฉํ์ฌ ๋ณด๋ค ์์ฐ์ค๋ฝ๊ณ ํ์ค์ ์ธ ํ๊ตญ์ด ๋ํ๋ฅผ ์์ฑํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
Model Details
Model Description
์ด ๋ชจ๋ธ์ LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct
๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, ํ๊ตญ์ ์ต์ ์ธ์ด ๋ฌธํ(์ ์กฐ์ด, ๋ฐ ๋ฑ)๋ฅผ ๋ ์ ์ดํดํ๊ณ ์์ฑํ๋๋ก ํนํ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์
๋๋ค. Hugging Face์ trl
๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ SFT(Supervised Fine-tuning) ๋ฐฉ์์ผ๋ก ํ์ต๋์์ต๋๋ค. ํ์ต ๋ฐ์ดํฐ์๋ ์น๊ตฌ์ ๋ํํ๋ ์ํฉ์ ๊ฐ์ ํ์ฌ, ํน์ ์ง๋ฌธ์ ๋ํด ๋ฐ๊ณผ ์ ํ์ด๋ฅผ ํ์ฉํด ๋ตํ๋ ํ์์ผ๋ก ๊ตฌ์ฑ๋ ๋ํ ์์ด ์ฌ์ฉ๋์์ต๋๋ค.
- Developed by: Hugging Face KREW (Yongsang Yoo, Harheem Kim, Sungmin Oh)
- Model type: Causal Language Model (Decoder-only Transformer)
- Language(s) (NLP): Korean (ko)
- License: The license for this model is based on the base model's license, 'exaone'. The training dataset,
huggingface-KREW/KoCulture-Dialogues-v2
, is available under the CC BY-NC-SA 4.0 license. - Finetuned from model: LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct
Model Sources
- Repository: https://huggingface.co/Yongsang/EXAONE-3.5-7.8B-Instruct-KoCulture-fulltrain-transformers
- Paper: ์ถ๊ฐ๋ ์์
- Demo: ์ถ๊ฐ๋ ์์
Uses
์ด ๋ชจ๋ธ์ ํ๊ตญ์ด ์ ์กฐ์ด์ ๋ฐ์ด ํฌํจ๋ ๋น๊ณต์์ ์ด๊ณ ๊ตฌ์ด์ ์ธ ํ ์คํธ๋ฅผ ์์ฑํ๋๋ก ์ค๊ณ๋์์ต๋๋ค.
Direct Use
๋ชจ๋ธ์ ์ฃผ์ด์ง ์ง๋ฌธ์ด๋ ๋ฌธ๋งฅ์ ๋ํด ์น๊ตฌ์ ๋ํํ๋ฏ ์ต์ ์ ํ์ด๋ฅผ ์ฌ์ฉํ์ฌ ์๋ต์ ์์ฑํ ์ ์์ต๋๋ค. ์ฑ๋ด์ด๋ ๊ฐ์ ๋น์์ ๊ฐ์ ๋ํํ AI์ ์ง์ ์ ์ฉํ์ฌ ์ฌ์ฉ์์ ์ฌ๋ฏธ์ ๊ฒฝํ์ ํฅ์์ํค๋ ๋ฐ ํ์ฉ๋ ์ ์์ต๋๋ค.
Out-of-Scope Use
- ๋ณธ ๋ชจ๋ธ์ CC BY-NC-SA 4.0 ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฅด๋ ๋ฐ์ดํฐ์ ์ผ๋ก ํ์ต๋์์ผ๋ฏ๋ก, ์๋ฆฌ์ ๋ชฉ์ ์ผ๋ก ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
- ๋ชจ๋ธ์ด ์ ํดํ๊ฑฐ๋ ์ฐจ๋ณ์ ์ธ ์ฝํ ์ธ (๊ณต๊ฒฉ์ ์ธ์ด, ํ์ค ๋ฐ์ธ ๋ฑ)๋ฅผ ์์ฑํ๊ฑฐ๋ ํ์ฐํ๋ ๋ฐ ์ฌ์ฉ๋์ด์๋ ์ ๋ฉ๋๋ค.
- ๋ชจ๋ธ์ ์์ฑ๋ฌผ์ ์ฌ์ค์ด ์๋ ์ ์์ผ๋ฉฐ, ์ฌ์ค ํ์ธ์ด ํ์ํ ์ค์ํ ์ ๋ณด ์ ๊ณต ๋ชฉ์ ์ผ๋ก ์ฌ์ฉํด์๋ ์ ๋ฉ๋๋ค.
Bias, Risks, and Limitations
- Bias: ํ์ต ๋ฐ์ดํฐ๋ ์ฃผ๋ก ์จ๋ผ์ธ ์ปค๋ฎค๋ํฐ์ ๋ฏธ๋์ด์์ ์ ๋ํ ์ ์กฐ์ด ๋ฐ ์ ํ์ด๋ฅผ ์ค์ฌ์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ด, ํน์ ์ฐ๋ น๋(์: ์ ์ ์ธ๋)๋ ํน์ ์จ๋ผ์ธ ๋ฌธํ์ ํธํฅ๋ ์ธ์ด ์ฌ์ฉ์ ๋ฐ์ํ ์ ์์ต๋๋ค.
- Risks: ์ ์กฐ์ด์ ์ ํ์ด๋ ์์์ฑ์ด ๋งค์ฐ ๊ฐํ์ฌ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์๋ฏธ๊ฐ ๋ณํ๊ฑฐ๋ ์ฌ์ฉ๋์ง ์๊ฒ ๋ ์ ์์ต๋๋ค(๋ฐ์ดํฐ ๋ ธํํ). ํํฐ๋ง ๋ ธ๋ ฅ์๋ ๋ถ๊ตฌํ๊ณ , ๋งฅ๋ฝ์ ๋ฐ๋ผ ๋ถ์ ์ ํ๊ฑฐ๋ ๊ณต๊ฒฉ์ ์ผ๋ก ํด์๋ ์ ์๋ ๋ด์ฉ์ด ํฌํจ๋ ์ํ์ด ์์ต๋๋ค.
- Limitations: ์ด ๋ชจ๋ธ์ ํ๊ตญ์ด ์ ์กฐ์ด์ ์ ์ฒด ๋ฒ์๋ฅผ ํฌ๊ดํ์ง ๋ชปํ๋ฉฐ, ํน์ ์์ ๊น์ง ์์ง๋ ๋ด์ฉ์ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค. ๋ฐ์ดํฐ์ ์ ํฌ๊ธฐ๊ฐ ๋น๊ต์ ์๊ธฐ ๋๋ฌธ์ ๋ชจ๋ ์ํฉ์ ๋ํด ์๋ฒฝํ๊ฒ ์์ฐ์ค๋ฌ์ด ๋ต๋ณ์ ์์ฑํ์ง ๋ชปํ ์ ์์ต๋๋ค.
Recommendations
์ฌ์ฉ์๋ ๋ชจ๋ธ์ด ์์ฑํ๋ ๊ฒฐ๊ณผ๋ฌผ์ ํธํฅ ๊ฐ๋ฅ์ฑ๊ณผ ์์์ฑ์ ์ธ์งํ๊ณ ์ฃผ์ ๊น๊ฒ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ๋น์๋ฆฌ์ ๋ชฉ์ ์ผ๋ก๋ง ์ฌ์ฉํด์ผ ํ๋ฉฐ, ์ถ์ฒ(Hugging Face KREW ๋ฐ ์๋ณธ ๋ฐ์ดํฐ ์ ๊ณต์ฒ)๋ฅผ ๋ช ํํ ๋ฐํ์ผ ํฉ๋๋ค.
How to Get Started with the Model
์๋ ์ฝ๋๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ ์ถ๋ก ์ ์์ํ ์ ์์ต๋๋ค.
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
# Hugging Face Hub์์ ํ ํฌ๋์ด์ ์ ๋ชจ๋ธ ๋ก๋
model_id = "huggingface_KREW/EXAONE-3.5-7.8B-Instruct-KoCulture-fulltrain-transformers"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto"
)
# ์ถ๋ก ์ ์ํ ์
๋ ฅ ํ
์คํธ ์ค๋น
# ํ์ต ์ ์ฌ์ฉ๋ ํ๋กฌํํธ ํ์์ ๋ฐ๋ฆ
๋๋ค.
PREFIX = "์น๊ตฌ์ ์ฑํ
์ ํ๊ณ ์๋ค๊ณ ๊ฐ์ ํ๊ณ ๋ค์ ์ง๋ฌธ์ ๋ฐ๊ณผ ์ ํ์ด๋ฅผ ํ์ฉํ์ฌ ๋๋ตํ์ธ์."
question = "๋ ์ด์ ํ์ ๋ ์ ํผ์๋ง ์กฐ์ฉํ ์์์ด?"
input_text = f"{PREFIX}: {question}"
# ๋ํ ํ
ํ๋ฆฟ ์ ์ฉ
messages = [{'role': 'user', 'content': input_text}]
chat_input = tokenizer.apply_chat_template(
messages,
add_generation_prompt=True,
tokenize=False,
enable_thinking=False # 'enable_thinking' ํ๋ผ๋ฏธํฐ๊ฐ ์์ ๊ฒฝ์ฐ ์ด ์ค์ ์ ๊ฑฐํ์ธ์.
)
# ๋ชจ๋ธ ์
๋ ฅ ์์ฑ
inputs = tokenizer(chat_input, return_tensors="pt").to(model.device)
# ํ
์คํธ ์์ฑ
outputs = self.model.generate(
**inputs,
max_new_tokens=256,
temperature=0.7,
top_p=0.8,
top_k=20,
min_p=0,
repetition_penalty=1.15,
do_sample=True,
pad_token_id=tokenizer.eos_token_id
)
# ๊ฒฐ๊ณผ ๋์ฝ๋ฉ ๋ฐ ์ถ๋ ฅ
response_ids = outputs[0][len(inputs.input_ids[0]):]
answer = tokenizer.decode(response_ids, skip_special_tokens=True)
# ์์ฑ๋ ๋ต๋ณ๋ง ์ถ์ถ
print(f"์ง๋ฌธ: {question}")
print(f"๋ต๋ณ: {answer}")
# ์์ ์ถ๋ ฅ:
# ์ง๋ฌธ: ์ ๋ ์ฌ์ง ์ฐ๋ ๊ฑธ ์ข์ํด์.
# ๋ต๋ณ: ์ฌ์ง์๊ฐ๋ ์ด์์ค๊ณ ใ
ใ
ใ
์ผ๊ฐ๋ ๊ผญ ์ฐ์ธ์!
Training Details
Training Data
์ด ๋ชจ๋ธ์ huggingface-KREW/KoCulture-Dialogues-v2 ๋ฐ์ดํฐ์
์ ์ฌ์ฉํ์ฌ ํ์ต๋์์ต๋๋ค. ์ด ๋ฐ์ดํฐ์
์ ์ต์ ํ๊ตญ์ด ์ ์กฐ์ด, ์ ํ์ด, ๋ฐ์ ํฌํจํ๋ ๋ํ ์์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. ๋ฐ์ดํฐ๋ title
(์ ํ์ด), question
(์ง๋ฌธ ๋งฅ๋ฝ), answer
(์ ํ์ด๋ฅผ ์ฌ์ฉํ ๋ต๋ณ)์ ์ธ ๊ฐ์ง ํ๋๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค.
Training Procedure
Preprocessing
ํ์ต ๋ฐ์ดํฐ๋ ๋ค์ ๊ณผ์ ์ ๊ฑฐ์ณ ์ฒ๋ฆฌ๋์์ต๋๋ค.
- ๊ฐ
question
ํญ๋ชฉ ์์"์น๊ตฌ์ ์ฑํ ์ ํ๊ณ ์๋ค๊ณ ๊ฐ์ ํ๊ณ ๋ค์ ์ง๋ฌธ์ ๋ฐ๊ณผ ์ ํ์ด๋ฅผ ํ์ฉํ์ฌ ๋๋ตํ์ธ์.: "
๋ผ๋ ํ๋กฌํํธ(PREFIX)๊ฐ ์ถ๊ฐ๋ฉ๋๋ค. - ์์ ๋
question
๊ณผanswer
๋user
์assistant
์ญํ ์ ๊ฐ๋ ๋ํ ํ์์ผ๋ก ๋ณํ๋ฉ๋๋ค. tokenizer.apply_chat_template
ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ด ํ์ตํ ์ ์๋ ์ต์ข ํ ์คํธ ํ์์ผ๋ก ํฌ๋งทํ ๋ฉ๋๋ค.
Training Hyperparameters
- Training regime: bf16 mixed precision
model_name
:LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct
max_seq_length
: 512num_epochs
: 3per_device_train_batch_size
: 1gradient_accumulation_steps
: 64learning_rate
: 6e-5lr_scheduler_type
:linear
optim
:adamw_8bit
warmup_ratio
: 0.05weight_decay
: 0.01
Evaluation
Testing Data & Metrics
Testing Data
๋ณ๋์ ๊ฒ์ฆ ๋ฐ์ดํฐ ํ์ผ์ ์ฌ์ฉํ์ฌ ํ์ต ์ ํ ๋ชจ๋ธ์ ์๋ต์ ์ ์ฑ์ ์ผ๋ก ๋น๊ตํ์ต๋๋ค.
meme_sample_with_question.txt
usage_question.txt
Metrics
๋ณ๋์ ์ ๋์ ํ๊ฐ ์งํ(์: BLEU, ROUGE)๋ ์ฌ์ฉ๋์ง ์์์ต๋๋ค. ํ๊ฐ๋ ์์ฑ๋ ๋ต๋ณ์ ์์ฐ์ค๋ฌ์๊ณผ ์ ํ์ด ์ฌ์ฉ์ ์ ์ ์ฑ์ ์ ์ฑ์ ์ผ๋ก ํ๋จํ๋ ๋ฐฉ์์ผ๋ก ์ด๋ฃจ์ด์ก์ต๋๋ค.
Results
[More Information Needed]
Summary
ํ์ต ํ ๋ชจ๋ธ์ ํ์ต ์ ์๋ณธ ๋ชจ๋ธ์ ๋นํด ์ฃผ์ด์ง ์ง๋ฌธ์ ๋งฅ๋ฝ์ ๋ง๋ ํ๊ตญ์ด ์ ์กฐ์ด์ ์ ํ์ด๋ฅผ ๋ ์์ฐ์ค๋ฝ๊ฒ ์ฌ์ฉํ๋ ๊ฒฝํฅ์ ๋ณด์์ต๋๋ค.
Citation [optional]
BibTeX:
ํ์ต ๋ฐ์ดํฐ์ ์ ๋ํ ์ธ์ฉ ์ ๋ณด์ ๋๋ค.
@misc{huggingface_krew_korean_neologism_2025, title={{ํ๊ตญ์ด ์ ์กฐ์ด ๋ฐ์ดํฐ์
(Korean Neologism Dataset)}}, author={{Hugging Face KREW} and Yoo, Yongsang and Kim, Harheem and Oh, Sungmin}, year={2025}, publisher={Hugging Face KREW}, howpublished={\url{https://huggingface.co/datasets/huggingface-KREW/KoCulture-Dialogues}} }
More Information
- Hugging Face KREW Discord: https://discord.gg/bKh5M7xsXP
- Project Repository: https://github.com/Pseudo-Lab/Hugging-Face-Hub-Garden
Model Card Authors
- Yongsang Yoo (์ ์ฉ์)
- Harheem Kim (๊นํ๋ฆผ)
- Sungmin Oh (์ค์ฑ๋ฏผ)
Model Card Contact
https://github.com/Pseudo-Lab/Hugging-Face-Hub-Garden/issues