|
--- |
|
language: |
|
- la |
|
- en |
|
tags: |
|
- t5 |
|
- translation |
|
- latin |
|
- english |
|
- hf-trained |
|
- custom-model |
|
license: cc-by-4.0 |
|
library_name: transformers |
|
model_name: William_Tyndale |
|
datasets: |
|
- opus |
|
- bible-uedin |
|
- tatoeba |
|
- xlent |
|
--- |
|
|
|
# William Tyndale ๐๏ธ |
|
|
|
**William_Tyndale**๋ ๋ผํด์ด(la)์์ ์์ด(en)๋ก ๋ฒ์ญํ๊ธฐ ์ํด ํ์ต๋ `T5-small` ๊ธฐ๋ฐ ์ปค์คํ
๋ชจ๋ธ์
๋๋ค. Hugging Face์ Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ Seq2SeqTrainer๋ฅผ ์ด์ฉํ์ฌ ํ์ต๋์์ต๋๋ค. |
|
|
|
## ๐ ํ์ต ๋ฐ์ดํฐ ์ถ์ฒ |
|
|
|
์ด ๋ชจ๋ธ์ ๋ค์ ๊ณต๊ฐ ๋ณ๋ ฌ ์ฝํผ์ค๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ต๋์์ต๋๋ค: |
|
|
|
- [**bible-uedin** (CC0 1.0)](http://opus.nlpl.eu/bible-uedin.php): ๋ค์ํ ์ธ์ด๋ก ๋ ์ฑ๊ฒฝ ๊ตฌ์ ์ ํฌํจํ ๋ง๋ญ์น |
|
- [**Tatoeba** (CC BY 2.0 FR)](https://tatoeba.org): ์ฌ์ฉ์๋ค์ด ์ ๊ณตํ ์๋ฌธ ๊ธฐ๋ฐ ๋ค๊ตญ์ด ๋ณ๋ ฌ ๋ฌธ์ฅ |
|
- [**XLENT** (์ธ์ฉ ํ์)](http://data.statmt.org/xlent/): WikiMatrix, CCAligned ๋ฑ์์ ์ถ์ถ๋ ๋๊ท๋ชจ ์ํฐํฐ ์ ๋ ฌ ๋ณ๋ ฌ ๋ฌธ์ฅ ๋ฐ์ดํฐ์
|
|
- [**OPUS** (CC BY 4.0)](http://opus.nlpl.eu): ๋ค์ํ ๊ณต๊ฐ ๋ฒ์ญ ๋ณ๋ ฌ ์ฝํผ์ค์ ๋ชจ์ |
|
|
|
> โ ๏ธ ๊ฐ ๋ฐ์ดํฐ๋ ์ ์ถ์ฒ์ ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฅด๋ฉฐ, ๋ณธ ๋ชจ๋ธ์ ์ฐ๊ตฌ ๋ฐ ํ์ต ๋ชฉ์ ๋ฐฐํฌ๋ฅผ ์ ์ ๋ก ํฉ๋๋ค. |
|
|
|
## ๐ง ๋ชจ๋ธ ์ ๋ณด |
|
|
|
- **๋ชจ๋ธ ๊ตฌ์กฐ**: T5-small (220M ํ๋ผ๋ฏธํฐ) |
|
- **์ง์ ์ธ์ด์**: Latin โ English |
|
- **ํ์ต ํ๊ฒฝ**: Kaggle GPU (T4 x2), Transformers 4.51.3 |
|
- **ํ ํฐํ**: `T5Tokenizer` (max_length=128, padding="max_length") |
|
- **์์ค ํจ์**: CrossEntropyLoss |
|
- **์ต์ ํ ์๊ณ ๋ฆฌ์ฆ**: AdamW (lr=2e-4, weight_decay=0.01) |
|
- **ํ๊ฐ์งํ**: BLEU, ROUGE, METEOR |
|
|
|
## โ๏ธ ๋ผ์ด์ ์ค |
|
|
|
- ๋ชจ๋ธ ์ฝ๋ ๋ฐ ํ์ ๋ชจ๋ธ: **Creative Commons Attribution 4.0 International (CC BY 4.0)** |
|
- ํ์ต ๋ฐ์ดํฐ: ๊ฐ ์ถ์ฒ์ ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฆ
๋๋ค (CC0, CC-BY ๋ฑ) |
|
|
|
## ๐ ์ธ์ฉ |
|
|
|
์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ ๋ค๋ฉด ์๋ ํ์์ผ๋ก ์ธ์ฉํด์ฃผ์ธ์. |
|
|
|
> William_Tyndale, valla2345 (2025). Hugging Face Hub. https://huggingface.co/valla2345/William_Tyndale |
|
|