IndoBERT Emotion Classification (5-Class)

Model ini merupakan hasil fine-tuning dari indobenchmark/indobert-base-p1 untuk tugas klasifikasi emosi dalam Bahasa Indonesia, dengan 5 label emosi: love, happiness, anger, fear, dan sadness.

🧠 Dataset

Model ini dilatih menggunakan PRDECT-ID Dataset, yaitu kumpulan ulasan produk berbahasa Indonesia dari e-commerce Tokopedia, yang sudah dianotasi dengan label emosi oleh ahli psikologi klinis.

  • 29 kategori produk
  • Anotasi emosi oleh tim profesional
  • Setiap entri memiliki 1 label emosi

πŸ›  Fine-tuning Details

  • Base model: indobenchmark/indobert-base-p1
  • Training epochs: 5 dari total 10 (early stopping dengan load_best_model_at_end=True)
  • Batch size: 8
  • Learning rate: 2e-5
  • Weight decay: 0.05
  • Validation strategy: per epoch
  • Evaluation metric: eval_accuracy (dengan greater_is_better=True)
  • Cross-validation: Stratified K-Fold (n_splits=5)

Eval Results (Best Model @ Epoch 3)

Metric Value
Accuracy 0.7167
F1 Score 0.7125
Precision 0.7179
Recall 0.7167
Eval Loss 0.7614

πŸš€ How to Use

from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

model = AutoModelForSequenceClassification.from_pretrained("galennolan/indobert-b-p1-indoemotion-5class")
tokenizer = AutoTokenizer.from_pretrained("galennolan/indobert-b-p1-indoemotion-5class")

emotion_classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)

emotion_classifier("Produk ini bikin aku senang banget!")
Downloads last month
15
Safetensors
Model size
124M params
Tensor type
F32
Β·
Inference Providers NEW
This model isn't deployed by any Inference Provider. πŸ™‹ Ask for provider support

Model tree for galennolan/indobert-b-p1-indoemotion-5class

Finetuned
(73)
this model

Space using galennolan/indobert-b-p1-indoemotion-5class 1

Collection including galennolan/indobert-b-p1-indoemotion-5class

Evaluation results