File size: 2,055 Bytes
755053c |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 |
---
language:
- la
- en
tags:
- t5
- translation
- latin
- english
- hf-trained
- custom-model
license: cc-by-4.0
library_name: transformers
model_name: William_Tyndale
datasets:
- opus
- bible-uedin
- tatoeba
- xlent
---
# William Tyndale ๐๏ธ
**William_Tyndale**๋ ๋ผํด์ด(la)์์ ์์ด(en)๋ก ๋ฒ์ญํ๊ธฐ ์ํด ํ์ต๋ `T5-small` ๊ธฐ๋ฐ ์ปค์คํ
๋ชจ๋ธ์
๋๋ค. Hugging Face์ Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ Seq2SeqTrainer๋ฅผ ์ด์ฉํ์ฌ ํ์ต๋์์ต๋๋ค.
## ๐ ํ์ต ๋ฐ์ดํฐ ์ถ์ฒ
์ด ๋ชจ๋ธ์ ๋ค์ ๊ณต๊ฐ ๋ณ๋ ฌ ์ฝํผ์ค๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ต๋์์ต๋๋ค:
- [**bible-uedin** (CC0 1.0)](http://opus.nlpl.eu/bible-uedin.php): ๋ค์ํ ์ธ์ด๋ก ๋ ์ฑ๊ฒฝ ๊ตฌ์ ์ ํฌํจํ ๋ง๋ญ์น
- [**Tatoeba** (CC BY 2.0 FR)](https://tatoeba.org): ์ฌ์ฉ์๋ค์ด ์ ๊ณตํ ์๋ฌธ ๊ธฐ๋ฐ ๋ค๊ตญ์ด ๋ณ๋ ฌ ๋ฌธ์ฅ
- [**XLENT** (์ธ์ฉ ํ์)](http://data.statmt.org/xlent/): WikiMatrix, CCAligned ๋ฑ์์ ์ถ์ถ๋ ๋๊ท๋ชจ ์ํฐํฐ ์ ๋ ฌ ๋ณ๋ ฌ ๋ฌธ์ฅ ๋ฐ์ดํฐ์
- [**OPUS** (CC BY 4.0)](http://opus.nlpl.eu): ๋ค์ํ ๊ณต๊ฐ ๋ฒ์ญ ๋ณ๋ ฌ ์ฝํผ์ค์ ๋ชจ์
> โ ๏ธ ๊ฐ ๋ฐ์ดํฐ๋ ์ ์ถ์ฒ์ ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฅด๋ฉฐ, ๋ณธ ๋ชจ๋ธ์ ์ฐ๊ตฌ ๋ฐ ํ์ต ๋ชฉ์ ๋ฐฐํฌ๋ฅผ ์ ์ ๋ก ํฉ๋๋ค.
## ๐ง ๋ชจ๋ธ ์ ๋ณด
- **๋ชจ๋ธ ๊ตฌ์กฐ**: T5-small (220M ํ๋ผ๋ฏธํฐ)
- **์ง์ ์ธ์ด์**: Latin โ English
- **ํ์ต ํ๊ฒฝ**: Kaggle GPU (T4 x2), Transformers 4.51.3
- **ํ ํฐํ**: `T5Tokenizer` (max_length=128, padding="max_length")
- **์์ค ํจ์**: CrossEntropyLoss
- **์ต์ ํ ์๊ณ ๋ฆฌ์ฆ**: AdamW (lr=2e-4, weight_decay=0.01)
- **ํ๊ฐ์งํ**: BLEU, ROUGE, METEOR
## โ๏ธ ๋ผ์ด์ ์ค
- ๋ชจ๋ธ ์ฝ๋ ๋ฐ ํ์ ๋ชจ๋ธ: **Creative Commons Attribution 4.0 International (CC BY 4.0)**
- ํ์ต ๋ฐ์ดํฐ: ๊ฐ ์ถ์ฒ์ ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฆ
๋๋ค (CC0, CC-BY ๋ฑ)
## ๐ ์ธ์ฉ
์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ ๋ค๋ฉด ์๋ ํ์์ผ๋ก ์ธ์ฉํด์ฃผ์ธ์.
> William_Tyndale, valla2345 (2025). Hugging Face Hub. https://huggingface.co/valla2345/William_Tyndale
|