metadata
language: tr
tags:
- turkish
- conspiracy-detection
- bert
- classification
- text-classification
- fine-tuned
license: apache-2.0
datasets:
- custom
metrics:
- accuracy
- f1
- precision
- recall
model-index:
- name: turkish-conspiracy-detection
results:
- task:
type: text-classification
name: Text Classification
dataset:
type: custom
name: Turkish Conspiracy Detection Dataset
metrics:
- type: accuracy
value: 0.9879
name: Accuracy
- type: f1
value: 0.9879
name: F1 Score
- type: precision
value: 0.9879
name: Precision
- type: recall
value: 0.9879
name: Recall
Türkçe Komplo Teorisi Tespit Modeli
Bu model, Türkçe metinlerde komplo teorisi tespiti yapmak için fine-tune edilmiş BERT tabanlı bir sınıflandırma modelidir.
Model Detayları
Model Açıklaması
- Geliştirici: Metinimo19
- Model Türü: Text Classification (İkili Sınıflandırma)
- Dil: Türkçe (tr)
- Temel Model: savasy/bert-base-turkish-sentiment-cased
- Fine-tuning Görevi: Komplo teorisi vs gerçek haber ayrımı
- Lisans: Apache 2.0
Model Kaynakları
- Repository: https://huggingface.co/Metinimo19/turkish-conspiracy-detection
- Temel Model: https://huggingface.co/savasy/bert-base-turkish-sentiment-cased
Kullanım
Doğrudan Kullanım
Model, Türkçe metinlerde komplo teorisi tespiti için kullanılabilir:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
# Model ve tokenizer'ı yükle
tokenizer = AutoTokenizer.from_pretrained("Metinimo19/turkish-conspiracy-detection")
model = AutoModelForSequenceClassification.from_pretrained("Metinimo19/turkish-conspiracy-detection")
# Örnek metin
text = "5G teknolojisi insanları kontrol etmek için tasarlanmış gizli bir sistemdir."
# Tahmin yap
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
predicted_class = torch.argmax(predictions, dim=-1).item()
# Sonuç
result = "Komplo Teorisi" if predicted_class == 1 else "Gerçek Haber"
confidence = predictions[0][predicted_class].item()
print(f"Tahmin: {result} (Güven: {confidence:.2%})")
Eğitim Detayları
Eğitim Verisi
- Veri Seti Boyutu: 1,651 Türkçe örnek
- Sınıf Dağılımı: Dengeli (yaklaşık %50 gerçek haber, %50 komplo teorisi)
- Veri Türü: Türkçe metinler (haberler, sosyal medya içerikleri, makale özetleri)
Eğitim Prosedürü
Eğitim Hiperparametreleri
- Batch Size: 16 (train ve eval)
- Learning Rate: 2e-5
- Epochs: 3
- Warmup Steps: 500
- Weight Decay: 0.01
- Optimizer: AdamW
- Mixed Precision: FP16 (GPU kullanımında)
Veri Bölünmesi
- Eğitim: %70 (1,155 örnek)
- Doğrulama: %15 (248 örnek)
- Test: %15 (248 örnek)
Değerlendirme
Test Sonuçları
Model test seti üzerinde şu performansı gösterdi:
Metrik | Değer |
---|---|
Accuracy | 0.9879 |
F1 Score | 0.9879 |
Precision | 0.9879 |
Recall | 0.9879 |
Sınıf Tanımları
- 0: Gerçek Haber - Doğrulanabilir, güvenilir kaynaklardan gelen bilgiler
- 1: Komplo Teorisi - Kanıtlanmamış, spekülatif veya yanlış bilgiler
Sınırlamalar ve Önyargılar
Sınırlamalar
- Model sadece Türkçe metinler için eğitilmiştir
- 512 token uzunluğundaki metinlerle sınırlıdır
- Eğitim verisinin boyutu nispeten küçüktür (1,651 örnek)
- Belirli konularda (5G, aşı, uzaylılar vb.) daha fazla veri içerir
Öneriler
- Kritik kararlar için model çıktılarını tek başına kullanmayın
- Sonuçları uzman değerlendirmesiyle destekleyin
- Modelin sınırlarını göz önünde bulundurun
Teknik Özellikler
Model Mimarisi
- Temel Mimari: BERT (Bidirectional Encoder Representations from Transformers)
- Parametre Sayısı: ~110M parametre
- Sınıflandırma Katmanı: Linear layer (768 → 2)
- Aktivasyon: Softmax
Hesaplama Altyapısı
- Eğitim Platformu: Google Colab
- GPU: Tesla T4 (16GB)
- Eğitim Süresi: Yaklaşık 10-15 dakika
- Framework: PyTorch + Transformers
Nasıl Başlanır
from transformers import pipeline
# Pipeline kullanarak basit kullanım
classifier = pipeline("text-classification", model="Metinimo19/turkish-conspiracy-detection")
result = classifier("Ay'a hiç çıkmadık, tüm görüntüler sahteydi.")
print(result)
Bu model, eğitim ve araştırma amaçları için geliştirilmiştir. Üretim ortamında kullanmadan önce kapsamlı testler yapılması önerilir.