model_card: name: "cagrigungor/urun-kategori-classifier" description: | Bu model, ürün isimlerini belirli kategorilere ayırmak için ince ayarlanmış bir BERT tabanlı metin sınıflandırma modelidir. Özellikle Türkçe ürün açıklamaları için tasarlanmıştır ve e-ticaret platformlarında ürünleri doğru kategorilere otomatik olarak atamak amacıyla geliştirilmiştir.
details: developer: "Çağrı Güngör" model_type: "Sequence Classification" language: "Turkish" finetuned_from: "bert-base-uncased"
training_data: source: "urunkat.parquet (CSV/Parquet formatında)" sample_count: "Yaklaşık N örnek" category_count: "{len(unique_labels)} adet" split: "%%train_size%%/%%validation_size%% (varsayılan 90%/10%)" preprocessing: - "NaN veriler atıldı" - "Text alanı 512 token'a truncation=True ile kırpıldı"
training_procedure: base_model: "bert-base-uncased" epochs: 5 train_batch_size: 16 eval_batch_size: 32 learning_rate: 2e-5 optimizer: "AdamW" evaluation_metrics: - accuracy - precision - recall - f1 best_model_selection: "load_best_model_at_end=True"
evaluation_results: accuracy: "%%accuracy%%" precision: "%%precision%%" recall: "%%recall%%" f1_score: "%%f1%%"
intended_uses: direct_use: - "Ürün isimlerini veya kısa ürün açıklamalarını alarak ilgili kategoriye sınıflandırma" - "E-ticaret siteleri ve envanter yönetimi sistemlerinde otomatik kategori atama" downstream_use: - "Arama Motoru Optimizasyonu" - "Öneri Sistemleri" - "Veri Temizliği" out_of_scope: - "Genel amaçlı doğal dil anlama (NLU) görevleri" - "Çok uzun veya karmaşık metinlerin sınıflandırılması" - "Niş kategorilerdeki ürünlerin sınıflandırılması" - "Tıbbi veya hukuki karar mekanizmalarında kullanılması"
bias_and_limitations: | - Modelin performansı eğitim verisinin kalitesine ve çeşitliliğine bağlıdır. - Yeni veya az örnekli kategorilerde düşük performans gösterebilir. - Yazım hataları veya eksik bilgiler hatalı sınıflandırmaya sebep olabilir. - Yakın kategoriler arasındaki ince ayrımlarda zorlanabilir.
recommendations: - "Model çıktılarını insan denetiminden geçirin." - "Periyodik retraining yaparak güncel tutun." - "Düşük güven skorlu tahminler için manuel inceleme mekanizması kurun." - "Kritik alanlarda tek başına karar için kullanmayın."
usage_example: | from transformers import pipeline classifier = pipeline( 'text-classification', model='cagrigungor/urun-kategori-classifier', tokenizer='cagrigungor/urun-kategori-classifier' ) res = classifier("çevre dostu bambu diş fırçası") print(res)
citation: | @misc{urunKategoriClassifier2025, title={Product-to-Category Classifier}, author={Çağrı Güngör}, year={2025}, howpublished={\url{https://huggingface.co/cagrigungor/urun-kategori-classifier}}, }
- Downloads last month
- 4