File size: 4,879 Bytes
82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 82107cd 4eb1640 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 |
---
language: tr
tags:
- turkish
- conspiracy-detection
- bert
- classification
- text-classification
- fine-tuned
license: apache-2.0
datasets:
- custom
metrics:
- accuracy
- f1
- precision
- recall
model-index:
- name: turkish-conspiracy-detection
results:
- task:
type: text-classification
name: Text Classification
dataset:
type: custom
name: Turkish Conspiracy Detection Dataset
metrics:
- type: accuracy
value: 0.9879
name: Accuracy
- type: f1
value: 0.9879
name: F1 Score
- type: precision
value: 0.9879
name: Precision
- type: recall
value: 0.9879
name: Recall
---
# Türkçe Komplo Teorisi Tespit Modeli
Bu model, Türkçe metinlerde komplo teorisi tespiti yapmak için fine-tune edilmiş BERT tabanlı bir sınıflandırma modelidir.
## Model Detayları
### Model Açıklaması
- **Geliştirici**: Metinimo19
- **Model Türü**: Text Classification (İkili Sınıflandırma)
- **Dil**: Türkçe (tr)
- **Temel Model**: [savasy/bert-base-turkish-sentiment-cased](https://huggingface.co/savasy/bert-base-turkish-sentiment-cased)
- **Fine-tuning Görevi**: Komplo teorisi vs gerçek haber ayrımı
- **Lisans**: Apache 2.0
### Model Kaynakları
- **Repository**: https://huggingface.co/Metinimo19/turkish-conspiracy-detection
- **Temel Model**: https://huggingface.co/savasy/bert-base-turkish-sentiment-cased
## Kullanım
### Doğrudan Kullanım
Model, Türkçe metinlerde komplo teorisi tespiti için kullanılabilir:
```python
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
# Model ve tokenizer'ı yükle
tokenizer = AutoTokenizer.from_pretrained("Metinimo19/turkish-conspiracy-detection")
model = AutoModelForSequenceClassification.from_pretrained("Metinimo19/turkish-conspiracy-detection")
# Örnek metin
text = "5G teknolojisi insanları kontrol etmek için tasarlanmış gizli bir sistemdir."
# Tahmin yap
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
predicted_class = torch.argmax(predictions, dim=-1).item()
# Sonuç
result = "Komplo Teorisi" if predicted_class == 1 else "Gerçek Haber"
confidence = predictions[0][predicted_class].item()
print(f"Tahmin: {result} (Güven: {confidence:.2%})")
```
## Eğitim Detayları
### Eğitim Verisi
- **Veri Seti Boyutu**: 1,651 Türkçe örnek
- **Sınıf Dağılımı**: Dengeli (yaklaşık %50 gerçek haber, %50 komplo teorisi)
- **Veri Türü**: Türkçe metinler (haberler, sosyal medya içerikleri, makale özetleri)
### Eğitim Prosedürü
#### Eğitim Hiperparametreleri
- **Batch Size**: 16 (train ve eval)
- **Learning Rate**: 2e-5
- **Epochs**: 3
- **Warmup Steps**: 500
- **Weight Decay**: 0.01
- **Optimizer**: AdamW
- **Mixed Precision**: FP16 (GPU kullanımında)
#### Veri Bölünmesi
- **Eğitim**: %70 (1,155 örnek)
- **Doğrulama**: %15 (248 örnek)
- **Test**: %15 (248 örnek)
## Değerlendirme
### Test Sonuçları
Model test seti üzerinde şu performansı gösterdi:
| Metrik | Değer |
|--------|-------|
| **Accuracy** | 0.9879 |
| **F1 Score** | 0.9879 |
| **Precision** | 0.9879 |
| **Recall** | 0.9879 |
### Sınıf Tanımları
- **0**: Gerçek Haber - Doğrulanabilir, güvenilir kaynaklardan gelen bilgiler
- **1**: Komplo Teorisi - Kanıtlanmamış, spekülatif veya yanlış bilgiler
## Sınırlamalar ve Önyargılar
### Sınırlamalar
- Model sadece Türkçe metinler için eğitilmiştir
- 512 token uzunluğundaki metinlerle sınırlıdır
- Eğitim verisinin boyutu nispeten küçüktür (1,651 örnek)
- Belirli konularda (5G, aşı, uzaylılar vb.) daha fazla veri içerir
### Öneriler
- Kritik kararlar için model çıktılarını tek başına kullanmayın
- Sonuçları uzman değerlendirmesiyle destekleyin
- Modelin sınırlarını göz önünde bulundurun
## Teknik Özellikler
### Model Mimarisi
- **Temel Mimari**: BERT (Bidirectional Encoder Representations from Transformers)
- **Parametre Sayısı**: ~110M parametre
- **Sınıflandırma Katmanı**: Linear layer (768 → 2)
- **Aktivasyon**: Softmax
### Hesaplama Altyapısı
- **Eğitim Platformu**: Google Colab
- **GPU**: Tesla T4 (16GB)
- **Eğitim Süresi**: Yaklaşık 10-15 dakika
- **Framework**: PyTorch + Transformers
## Nasıl Başlanır
```python
from transformers import pipeline
# Pipeline kullanarak basit kullanım
classifier = pipeline("text-classification", model="Metinimo19/turkish-conspiracy-detection")
result = classifier("Ay'a hiç çıkmadık, tüm görüntüler sahteydi.")
print(result)
```
---
*Bu model, eğitim ve araştırma amaçları için geliştirilmiştir. Üretim ortamında kullanmadan önce kapsamlı testler yapılması önerilir.*
|