Colab Notebook
ํ์ต ๋ฐ์ดํฐ์
[AI hub]์์ฐ์ด ๊ธฐ๋ฐ ์ง์(NL2SQL) ๊ฒ์ ์์ฑ ๋ฐ์ดํฐ
https://huggingface.co/combe4259/NHSQLNL/blob/main/TEXT_NL2SQL_label_nh_consultation.json https://huggingface.co/combe4259/NHSQLNL/blob/main/nh_consultation_db_annotation.json
NHSQLNL: ๊ธ์ต ์์ฐ์ด โ SQL ๋ณํ ๋ชจ๋ธ
NHSQLNL
์ ํ๊ตญ์ด ๊ธ์ต ์์ฐ์ด ์ง์๋ฅผ SQL ์ฟผ๋ฆฌ๋ก ๋ณํํ๋ Text-to-SQL (NL2SQL) ๋ชจ๋ธ์
๋๋ค.
์ํ ๋ฐ ๊ธ์ต๊ถ ๋๋ฉ์ธ ์ง์๋ฅผ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ง์(SQL)๋ก ์๋ ๋ณํํ์ฌ, ๊ณ ๊ฐ ์ง์ ์๋ต ์์คํ
๋ฐ ๊ธ์ต ๋ฐ์ดํฐ ๋ถ์์ ํ์ฉํ ์ ์์ต๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ (Features)
- ํ๊ตญ์ด ๊ธ์ต ๋๋ฉ์ธ ์์ฐ์ด ์ ๋ ฅ์ SQL ์ฟผ๋ฆฌ๋ก ๋ณํ
- ์ฌ์ ์ ์๋ ์คํค๋ง์ ๋ง์ถ ์์ ํ SQL ์์ฑ
- PyTorch ๋ฐ Hugging Face
transformers
๊ธฐ๋ฐ
์ฌ์ฉ ๋ฐฉ๋ฒ (How to Use)
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
# ๋ชจ๋ธ ๋ก๋
MODEL_PATH = "combe4259/NHSQLNL"
tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_PATH)
# ์
๋ ฅ ์ง์
query = "2023๋
์ ๊ฐ์ค๋ ์๊ธ ๊ณ์ข ์๋ฅผ ์๋ ค์ค"
inputs = tokenizer(query, return_tensors="pt")
# SQL ์์ธก
outputs = model.generate(**inputs, max_length=128)
sql = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("์
๋ ฅ:", query)
print("์์ฑ๋ SQL:", sql)
---
## ํ์ต ๋ฐ์ดํฐ (Training Data)
- ์์ฒด ๊ตฌ์ถํ ๊ธ์ต ๋๋ฉ์ธ **์์ฐ์ด โ SQL ๋งคํ ๋ฐ์ดํฐ์
** ์ฌ์ฉ
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ: SQL ์คํค๋ง ์ ๊ทํ ๋ฐ ํ ํฌ๋์ด์ ๊ธฐ๋ฐ ์
๋ ฅ ๋ณํ
---
---
## ํ์ฉ ๊ฐ๋ฅ ๋ถ์ผ (Applications)
- ๊ธ์ต๊ถ ์ฑ๋ด ๋ฐ ์๋ด ์๋ํ
- ์์ฐ์ด ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์กฐํ ๋ฐ ๋ฆฌํฌํธ ์์ฑ
- ๋น์ ๋ฌธ๊ฐ ๋์ SQL ํ์ต/์ฐ์ต ๋๊ตฌ
- Downloads last month
- 82
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
๐
Ask for provider support