π§ Informasi
Model ini dikembangkan sebagai bagian dari tugas akhir (skripsi) dengan judul:
βPERBANDINGAN ALGORITMA JARO-WINKLER, BERT DAN SPACY PADA EKSTRAKSI PESAN SINGKAT WHATSAPP UNTUK MITIGASI BENCANAβ
Program Studi Informatika, Fakultas Teknologi Informasi dan Sains Data,
Universitas Sebelas Maret β Tahun 2025
Penulis: Muhammad Priyo Utomo (NIM: M0518036)
π Kode Sistem dan Dataset
- https://github.com/MuhammadPriyoUtomo/ner-pesan-singkat-laporan-bencana
- https://huggingface.co/datasets/utomomuhammadpriyo/dataset-ner-pesan-singkat-laporan-bencana/
π Hasil Pelatihan
Epoch | Step | Training Loss | Validation Loss | Precision | Recall | F1 Score | Accuracy |
---|---|---|---|---|---|---|---|
1 | 2000 | 0.0001 | 0.000829 | 0.999902 | 0.999902 | 0.999902 | 0.999902 |
2 | 4000 | 0.0 | 0.000438 | 0.999926 | 0.999926 | 0.999927 | 0.999927 |
3 | 6000 | 0.0 | 0.000709 | 0.999926 | 0.999926 | 0.999927 | 0.999927 |
4 | 8000 | 0.0 | 0.000486 | 0.999926 | 0.999927 | 0.999927 | 0.999927 |
π Contoh Deteksi Entitas
Teks Asli:
- tolong ada banjir di surakarta!
hasil Deteksi:
- DISASTER: "banjir", Score: 1.0000
- LOCATION: "surakarta", Score: 0.9998
π·οΈ Tokenizer
Model ini menggunakan:
indobert-base-uncased
dari Hugging Face Transformers.
π₯ Cara Menggunakan
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("utomomuhammadpriyo/ner-pesan-singkat-laporan-bencana")
model = AutoModelForTokenClassification.from_pretrained("utomomuhammadpriyo/ner-pesan-singkat-laporan-bencana")
βοΈ BERT Training Configuration
Parameter | Nilai |
---|---|
Data Used | 20.000 |
Epoch | 10 |
Test Size | 0.2 |
Train Batch Size | 8 |
Eval Batch Size | 8 |
Weight Decay | 0.001 |
Learning Rate | 3e-5 |
Early Stopping Patience | 3 |
Early Stopping Threshold | 0.001 |
πΉ Catatan:
- Dataset dibagi 80% untuk pelatihan dan 20% untuk validasi. Tidak digunakan test set eksplisit, meskipun label "Test Size" muncul dalam konfigurasi.
π₯οΈ Spesifikasi Pelatihan
Komponen | Detail |
---|---|
Python | 3.12 |
PyTorch | 2.7.0+cu128 |
CPU | Intel Core i5-8265U |
GPU | NVIDIA GeForce MX230 |
RAM | 12 GB |
OS | Windows 11 |
Pelatihan dilakukan secara lokal.
- Downloads last month
- 1
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
π
Ask for provider support
Model tree for utomomuhammadpriyo/ner-pesan-singkat-laporan-bencana
Base model
indolem/indobert-base-uncased