File size: 4,879 Bytes
82107cd
4eb1640
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
82107cd
 
4eb1640
82107cd
4eb1640
82107cd
4eb1640
82107cd
4eb1640
 
 
 
 
 
 
82107cd
4eb1640
 
 
82107cd
4eb1640
82107cd
4eb1640
 
 
 
 
 
82107cd
4eb1640
 
 
82107cd
4eb1640
 
82107cd
4eb1640
 
 
 
 
 
82107cd
4eb1640
 
 
 
 
82107cd
4eb1640
82107cd
4eb1640
 
 
 
82107cd
4eb1640
82107cd
4eb1640
 
 
 
 
 
 
 
82107cd
4eb1640
 
 
 
82107cd
4eb1640
82107cd
4eb1640
 
82107cd
4eb1640
 
 
 
 
 
82107cd
4eb1640
 
 
82107cd
4eb1640
82107cd
4eb1640
 
 
 
 
82107cd
4eb1640
 
 
 
82107cd
4eb1640
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
82107cd
4eb1640
 
 
 
 
82107cd
4eb1640
82107cd
4eb1640
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
---
language: tr
tags:
- turkish
- conspiracy-detection
- bert
- classification
- text-classification
- fine-tuned
license: apache-2.0
datasets:
- custom
metrics:
- accuracy
- f1
- precision
- recall
model-index:
- name: turkish-conspiracy-detection
  results:
  - task:
      type: text-classification
      name: Text Classification
    dataset:
      type: custom
      name: Turkish Conspiracy Detection Dataset
    metrics:
    - type: accuracy
      value: 0.9879
      name: Accuracy
    - type: f1
      value: 0.9879
      name: F1 Score
    - type: precision
      value: 0.9879
      name: Precision
    - type: recall
      value: 0.9879
      name: Recall
---

# Türkçe Komplo Teorisi Tespit Modeli

Bu model, Türkçe metinlerde komplo teorisi tespiti yapmak için fine-tune edilmiş BERT tabanlı bir sınıflandırma modelidir.

## Model Detayları

### Model Açıklaması
- **Geliştirici**: Metinimo19
- **Model Türü**: Text Classification (İkili Sınıflandırma)
- **Dil**: Türkçe (tr)
- **Temel Model**: [savasy/bert-base-turkish-sentiment-cased](https://huggingface.co/savasy/bert-base-turkish-sentiment-cased)
- **Fine-tuning Görevi**: Komplo teorisi vs gerçek haber ayrımı
- **Lisans**: Apache 2.0

### Model Kaynakları
- **Repository**: https://huggingface.co/Metinimo19/turkish-conspiracy-detection
- **Temel Model**: https://huggingface.co/savasy/bert-base-turkish-sentiment-cased

## Kullanım

### Doğrudan Kullanım
Model, Türkçe metinlerde komplo teorisi tespiti için kullanılabilir:

```python
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

# Model ve tokenizer'ı yükle
tokenizer = AutoTokenizer.from_pretrained("Metinimo19/turkish-conspiracy-detection")
model = AutoModelForSequenceClassification.from_pretrained("Metinimo19/turkish-conspiracy-detection")

# Örnek metin
text = "5G teknolojisi insanları kontrol etmek için tasarlanmış gizli bir sistemdir."

# Tahmin yap
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
    outputs = model(**inputs)
    predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
    predicted_class = torch.argmax(predictions, dim=-1).item()

# Sonuç
result = "Komplo Teorisi" if predicted_class == 1 else "Gerçek Haber"
confidence = predictions[0][predicted_class].item()
print(f"Tahmin: {result} (Güven: {confidence:.2%})")
```

## Eğitim Detayları

### Eğitim Verisi
- **Veri Seti Boyutu**: 1,651 Türkçe örnek
- **Sınıf Dağılımı**: Dengeli (yaklaşık %50 gerçek haber, %50 komplo teorisi)
- **Veri Türü**: Türkçe metinler (haberler, sosyal medya içerikleri, makale özetleri)

### Eğitim Prosedürü

#### Eğitim Hiperparametreleri
- **Batch Size**: 16 (train ve eval)
- **Learning Rate**: 2e-5
- **Epochs**: 3
- **Warmup Steps**: 500
- **Weight Decay**: 0.01
- **Optimizer**: AdamW
- **Mixed Precision**: FP16 (GPU kullanımında)

#### Veri Bölünmesi
- **Eğitim**: %70 (1,155 örnek)
- **Doğrulama**: %15 (248 örnek)
- **Test**: %15 (248 örnek)

## Değerlendirme

### Test Sonuçları
Model test seti üzerinde şu performansı gösterdi:

| Metrik | Değer |
|--------|-------|
| **Accuracy** | 0.9879 |
| **F1 Score** | 0.9879 |
| **Precision** | 0.9879 |
| **Recall** | 0.9879 |

### Sınıf Tanımları
- **0**: Gerçek Haber - Doğrulanabilir, güvenilir kaynaklardan gelen bilgiler
- **1**: Komplo Teorisi - Kanıtlanmamış, spekülatif veya yanlış bilgiler

## Sınırlamalar ve Önyargılar

### Sınırlamalar
- Model sadece Türkçe metinler için eğitilmiştir
- 512 token uzunluğundaki metinlerle sınırlıdır
- Eğitim verisinin boyutu nispeten küçüktür (1,651 örnek)
- Belirli konularda (5G, aşı, uzaylılar vb.) daha fazla veri içerir

### Öneriler
- Kritik kararlar için model çıktılarını tek başına kullanmayın
- Sonuçları uzman değerlendirmesiyle destekleyin
- Modelin sınırlarını göz önünde bulundurun

## Teknik Özellikler

### Model Mimarisi
- **Temel Mimari**: BERT (Bidirectional Encoder Representations from Transformers)
- **Parametre Sayısı**: ~110M parametre
- **Sınıflandırma Katmanı**: Linear layer (768 → 2)
- **Aktivasyon**: Softmax

### Hesaplama Altyapısı
- **Eğitim Platformu**: Google Colab
- **GPU**: Tesla T4 (16GB)
- **Eğitim Süresi**: Yaklaşık 10-15 dakika
- **Framework**: PyTorch + Transformers

## Nasıl Başlanır

```python
from transformers import pipeline

# Pipeline kullanarak basit kullanım
classifier = pipeline("text-classification", model="Metinimo19/turkish-conspiracy-detection")
result = classifier("Ay'a hiç çıkmadık, tüm görüntüler sahteydi.")
print(result)
```

---

*Bu model, eğitim ve araştırma amaçları için geliştirilmiştir. Üretim ortamında kullanmadan önce kapsamlı testler yapılması önerilir.*