Türkçe Komplo Teorisi Tespit Modeli

Bu model, Türkçe metinlerde komplo teorisi tespiti yapmak için fine-tune edilmiş BERT tabanlı bir sınıflandırma modelidir.

Model Detayları

Model Açıklaması

  • Geliştirici: Metinimo19
  • Model Türü: Text Classification (İkili Sınıflandırma)
  • Dil: Türkçe (tr)
  • Temel Model: savasy/bert-base-turkish-sentiment-cased
  • Fine-tuning Görevi: Komplo teorisi vs gerçek haber ayrımı
  • Lisans: Apache 2.0

Model Kaynakları

Kullanım

Doğrudan Kullanım

Model, Türkçe metinlerde komplo teorisi tespiti için kullanılabilir:

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

# Model ve tokenizer'ı yükle
tokenizer = AutoTokenizer.from_pretrained("Metinimo19/turkish-conspiracy-detection")
model = AutoModelForSequenceClassification.from_pretrained("Metinimo19/turkish-conspiracy-detection")

# Örnek metin
text = "5G teknolojisi insanları kontrol etmek için tasarlanmış gizli bir sistemdir."

# Tahmin yap
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
    outputs = model(**inputs)
    predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
    predicted_class = torch.argmax(predictions, dim=-1).item()

# Sonuç
result = "Komplo Teorisi" if predicted_class == 1 else "Gerçek Haber"
confidence = predictions[0][predicted_class].item()
print(f"Tahmin: {result} (Güven: {confidence:.2%})")

Eğitim Detayları

Eğitim Verisi

  • Veri Seti Boyutu: 1,651 Türkçe örnek
  • Sınıf Dağılımı: Dengeli (yaklaşık %50 gerçek haber, %50 komplo teorisi)
  • Veri Türü: Türkçe metinler (haberler, sosyal medya içerikleri, makale özetleri)

Eğitim Prosedürü

Eğitim Hiperparametreleri

  • Batch Size: 16 (train ve eval)
  • Learning Rate: 2e-5
  • Epochs: 3
  • Warmup Steps: 500
  • Weight Decay: 0.01
  • Optimizer: AdamW
  • Mixed Precision: FP16 (GPU kullanımında)

Veri Bölünmesi

  • Eğitim: %70 (1,155 örnek)
  • Doğrulama: %15 (248 örnek)
  • Test: %15 (248 örnek)

Değerlendirme

Test Sonuçları

Model test seti üzerinde şu performansı gösterdi:

Metrik Değer
Accuracy 0.9879
F1 Score 0.9879
Precision 0.9879
Recall 0.9879

Sınıf Tanımları

  • 0: Gerçek Haber - Doğrulanabilir, güvenilir kaynaklardan gelen bilgiler
  • 1: Komplo Teorisi - Kanıtlanmamış, spekülatif veya yanlış bilgiler

Sınırlamalar ve Önyargılar

Sınırlamalar

  • Model sadece Türkçe metinler için eğitilmiştir
  • 512 token uzunluğundaki metinlerle sınırlıdır
  • Eğitim verisinin boyutu nispeten küçüktür (1,651 örnek)
  • Belirli konularda (5G, aşı, uzaylılar vb.) daha fazla veri içerir

Öneriler

  • Kritik kararlar için model çıktılarını tek başına kullanmayın
  • Sonuçları uzman değerlendirmesiyle destekleyin
  • Modelin sınırlarını göz önünde bulundurun

Teknik Özellikler

Model Mimarisi

  • Temel Mimari: BERT (Bidirectional Encoder Representations from Transformers)
  • Parametre Sayısı: ~110M parametre
  • Sınıflandırma Katmanı: Linear layer (768 → 2)
  • Aktivasyon: Softmax

Hesaplama Altyapısı

  • Eğitim Platformu: Google Colab
  • GPU: Tesla T4 (16GB)
  • Eğitim Süresi: Yaklaşık 10-15 dakika
  • Framework: PyTorch + Transformers

Nasıl Başlanır

from transformers import pipeline

# Pipeline kullanarak basit kullanım
classifier = pipeline("text-classification", model="Metinimo19/turkish-conspiracy-detection")
result = classifier("Ay'a hiç çıkmadık, tüm görüntüler sahteydi.")
print(result)

Bu model, eğitim ve araştırma amaçları için geliştirilmiştir. Üretim ortamında kullanmadan önce kapsamlı testler yapılması önerilir.

Downloads last month
10
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Evaluation results