Spaces:

Daddario
/

hotel_bot

Sleeping

Daddario commited on Dec 2, 2024

Commit

cd21527

verified ·

1 Parent(s): c748179

Create train.py

Files changed (1) hide show

train.py ADDED Viewed

+from transformers import Trainer, TrainingArguments, BertForTokenClassification
+from datasets import Dataset
+import json
+# Carica il dataset
+with open('entity_dataset.json', 'r') as f:
+    dataset = json.load(f)
+# Prepara il dataset per l'addestramento
+def prepare_dataset(dataset):
+    # Converti il dataset in un formato adatto per Hugging Face Dataset
+    data = {
+        "text": [entry["query"] for entry in dataset],
+        "labels": [entry["entities"] for entry in dataset]
+    }
+    return Dataset.from_dict(data)
+train_dataset = prepare_dataset(dataset)
+# Carica il modello pre-addestrato
+model = BertForTokenClassification.from_pretrained("dbmdz/bert-base-italian-uncased")
+# Imposta i parametri di addestramento
+training_args = TrainingArguments(
+    output_dir="./results",          # Cartella di output
+    evaluation_strategy="epoch",     # Come viene eseguita la valutazione
+    learning_rate=2e-5,              # Tasso di apprendimento
+    per_device_train_batch_size=16,  # Dimensione del batch
+    num_train_epochs=3,              # Numero di epoche
+)
+# Inizializza il trainer
+trainer = Trainer(
+    model=model,                     # Il modello
+    args=training_args,              # I parametri di addestramento
+    train_dataset=train_dataset,     # Il dataset di addestramento
+)
+# Avvia l'addestramento
+trainer.train()