Türkçe Komplo Teorisi Tespit Modeli

Bu model, Türkçe metinlerde komplo teorisi tespiti yapmak için fine-tune edilmiş BERT tabanlı bir sınıflandırma modelidir.

Model Detayları

Model Açıklaması

Geliştirici: Metinimo19
Model Türü: Text Classification (İkili Sınıflandırma)
Dil: Türkçe (tr)
Temel Model: savasy/bert-base-turkish-sentiment-cased
Fine-tuning Görevi: Komplo teorisi vs gerçek haber ayrımı
Lisans: Apache 2.0

Model Kaynakları

Repository: https://huggingface.co/Metinimo19/turkish-conspiracy-detection
Temel Model: https://huggingface.co/savasy/bert-base-turkish-sentiment-cased

Kullanım

Doğrudan Kullanım

Model, Türkçe metinlerde komplo teorisi tespiti için kullanılabilir:

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

# Model ve tokenizer'ı yükle
tokenizer = AutoTokenizer.from_pretrained("Metinimo19/turkish-conspiracy-detection")
model = AutoModelForSequenceClassification.from_pretrained("Metinimo19/turkish-conspiracy-detection")

# Örnek metin
text = "5G teknolojisi insanları kontrol etmek için tasarlanmış gizli bir sistemdir."

# Tahmin yap
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
    outputs = model(**inputs)
    predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
    predicted_class = torch.argmax(predictions, dim=-1).item()

# Sonuç
result = "Komplo Teorisi" if predicted_class == 1 else "Gerçek Haber"
confidence = predictions[0][predicted_class].item()
print(f"Tahmin: {result} (Güven: {confidence:.2%})")

Eğitim Detayları

Eğitim Verisi

Veri Seti Boyutu: 1,651 Türkçe örnek
Sınıf Dağılımı: Dengeli (yaklaşık %50 gerçek haber, %50 komplo teorisi)
Veri Türü: Türkçe metinler (haberler, sosyal medya içerikleri, makale özetleri)

Eğitim Prosedürü

Eğitim Hiperparametreleri

Batch Size: 16 (train ve eval)
Learning Rate: 2e-5
Epochs: 3
Warmup Steps: 500
Weight Decay: 0.01
Optimizer: AdamW
Mixed Precision: FP16 (GPU kullanımında)

Veri Bölünmesi

Eğitim: %70 (1,155 örnek)
Doğrulama: %15 (248 örnek)
Test: %15 (248 örnek)

Değerlendirme

Test Sonuçları

Model test seti üzerinde şu performansı gösterdi:

Metrik	Değer
Accuracy	0.9879
F1 Score	0.9879
Precision	0.9879
Recall	0.9879

Sınıf Tanımları

0: Gerçek Haber - Doğrulanabilir, güvenilir kaynaklardan gelen bilgiler
1: Komplo Teorisi - Kanıtlanmamış, spekülatif veya yanlış bilgiler

Sınırlamalar ve Önyargılar

Sınırlamalar

Model sadece Türkçe metinler için eğitilmiştir
512 token uzunluğundaki metinlerle sınırlıdır
Eğitim verisinin boyutu nispeten küçüktür (1,651 örnek)
Belirli konularda (5G, aşı, uzaylılar vb.) daha fazla veri içerir

Öneriler

Kritik kararlar için model çıktılarını tek başına kullanmayın
Sonuçları uzman değerlendirmesiyle destekleyin
Modelin sınırlarını göz önünde bulundurun

Teknik Özellikler

Model Mimarisi

Temel Mimari: BERT (Bidirectional Encoder Representations from Transformers)
Parametre Sayısı: ~110M parametre
Sınıflandırma Katmanı: Linear layer (768 → 2)
Aktivasyon: Softmax

Hesaplama Altyapısı

Eğitim Platformu: Google Colab
GPU: Tesla T4 (16GB)
Eğitim Süresi: Yaklaşık 10-15 dakika
Framework: PyTorch + Transformers

Nasıl Başlanır

from transformers import pipeline

# Pipeline kullanarak basit kullanım
classifier = pipeline("text-classification", model="Metinimo19/turkish-conspiracy-detection")
result = classifier("Ay'a hiç çıkmadık, tüm görüntüler sahteydi.")
print(result)

Bu model, eğitim ve araştırma amaçları için geliştirilmiştir. Üretim ortamında kullanmadan önce kapsamlı testler yapılması önerilir.

Metinimo19
/

turkish-conspiracy-detection