SetFit with intfloat/multilingual-e5-small

This is a SetFit model that can be used for Text Classification. This SetFit model uses intfloat/multilingual-e5-small as the Sentence Transformer embedding model. A SetFitHead instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
0
  • "des aides à la conduite intégrées à mon pare-brise par exemple et ça pas certain que tout le monde le fasse c'est sûr qui mieux que renault peut entretenir ma renault ? renault car service numéro 1 du sav 2025 offre à particulier pour les véhicules renault et dacia dans le réseau participants franchise offerte dans la limite de 200 euros voir renaultfr source l'automobile magazine 2024 c'est pour toi le sofa double solde pour double économie trouvez le canapé de vos rêves avec les doubles soldes doubles économies sur la collection infinie 50% de remise plus 20% supplémentaire mais tout ça c'est terminé mardi 4 février pour le trône sofa seuls des vannes des qualités et voilà uniquement des canapés de qualité vérifiez condition au magasin dans tous ces états décryptés par françois gervais il n'y a pas d'apocalypse climatique aux éditions de l'artilleur effectivement et vous ajoutez d'ailleurs c'est le sous-titre de votre livre françois gervais modèle mesure et prévision se délivrer de l'éco-anxiété effectivement vous en parlez beaucoup dans votre livre mais cette éco-anxiété il faut comprendre les gens se disent on leur dit écoutez on va avoir 4 degrés de plus des villes vont d'antier vont disparaître nous allons crever de faim et de soif dans le sud et chez nous ça va être 4 à 5 degrés de plus beaucoup de gens l'ont dit à la télévision et ailleurs et depuis 50 ans et évidemment de 20 ans en 20 ans on vous raconte les mêmes choses et ça continue donc cette éco-anxiété elle est presque devenue généralisée on l'a vu aussi dans d'autres domaines mais là comment vous l'analysez cette éco-anxiété ? alors il y a plusieurs choses la première chose c'est qu'effectivement depuis 2 siècles la population mondiale a été multipliée par 8 mais c'est énorme et depuis 50 ans la population mondiale a doublé donc on ne peut pas nier que le fait qu'il y ait beaucoup"
  • "94 paquebots égale 260 millions de voitures moi j'ai l'étude sous les yeux bon bah écoutez quand j'entends ça mais la pollution des paquebots va pas être les paquebots sont assez rares sur la seine ça nous a pas échappé mais la pollution elle ne s'arrête pas elle n'a pas de mur moi ce que je veux mettre en avant sur ce projet zfe qu'il faut à tout prix abroger pour les français parce qu'on ne peut pas demain assigner à domicile comme le dit justement agnès pannier-runacher sur la partie du dossier qu'elle maîtrise je préfère dire honnêtement qu'on ne peut pas conserver les zfe parce que socialement elles ne tiennent pas il faut voir ce qu'il s'est passé ce week-end on a quand même un petit air de gilet jaune qui est en train d'augmenter qu'est-ce qui s'est passé ce week-end ? il y avait des manifestations sur le terrain moi qui me fais assez peur je vois quand même ce petit mouvement qui glisse le gilet jaune puissance disque 40 millions d'automobilistes a annoncé au moment du vote du texte zfe on me riait au nez en 2019 et aujourd'hui on voit quoi ? eh bien on voit un mouvement qui commence à monter donc ça me fait peur socialement il faut abroger il y a d'autres solutions plus pertinentes qui permettent de baisser la pollution et tiens petit rappel on a peut-être baissé la pollution de 30% sur paris mais pendant ce temps-là sans zfe à nice on l'a baissée de 50% donc je me dis aussi que c'est bien de comparer un petit peu ce qui se passe aussi dans les autres métropoles yann boucard comment vous percevez les choses ? notamment voilà que vous disent vos électeurs et ceux dont vous gérez aujourd'hui la vie ? alors moi je vais être très clair dans le territoire de belfort il n'y a pas de zfe aujourd'hui et pourtant ce débat il prend chez nous pourquoi ?"
  • "prudence sur les routes ce soir 30 départements sont en vigilance orange neige et verglas dans le nord et l'est de la france en ile-de-france la vitesse maximale est abaissée de 20 km par heure et retenez qu'au volant l'important est d'anticiper c'est ce que rappelle"
1
  • "'est indéniable c'est indéniable et on a inventé les zfe pour faire baisser la pollution des villes sauf qu'aujourd'hui en france une voiture neuve émet en moyenne 89 grammes de co2 par kilomètre c'est-à-dire à peu près la moitié de ce que ça émettait il y a 15 ans donc il faudrait mesurer les taux de pollution des villes aujourd'hui à circulation constante ce que la mairie de paris refuse de faire évidemment madame hidalgo ne devrait pas se torcher à dents sur le principe benjamin cuc des zfe à terme d'avoir des voitures moins polluantes dans les grandes agglomérations ça peut se comprendre mais c'est le calendrier là parce qu'il y a beaucoup de gens il y a 13 millions de voitures critère 3 c'est ça oui c'est ça"
  • "la demande reste orientée à la hausse et parce que les enr les énergies renouvelables ne fonctionnent pas suffisamment bien aujourd'hui c'est un rendement de l'ordre de 25% du rendement optimal donc on est très loin si vous voulez ce n'est pas incitatif les enr aujourd'hui parce qu'on n'arrive pas à stocker l'électricité on n'arrive pas à la stocker je vais vous citer deux exemples d'investissement dans lesquels il y a des français d'ailleurs ce ne serait pas en france mais il y a des français et je pense qu'il faut plutôt s'en réjouir aux etats-unis au canada alors ce sont des investissements qui portent essentiellement sur le gnl les images que vous voyez là ce sont des"
  • "et c'est financé par la facture des français par le tur 300 milliards d'euros et c'est financé essentiellement par la dette ces 300 milliards d'euros vont plomber la facture d'électricité sonia babrouk il faut comprendre on a déjà eu une explosion de la facture d'électricité des français si nous continuons dans la feuille de route d'agnès pannier-runacher à savoir multiplication par 2 des éoliennes terrestres multiplication par 50 des éoliennes en mer multiplication par 5 des panneaux solaires nous allons avoir une nouvelle"

Evaluation

Metrics

Label F1
all 1.0

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("setfit_model_id")
# Run inference
preds = model("ame écoutez-moi bien 100 milliards aux français 100 milliards pour financer l'énergie intermittente dont nous savons pertinemment qu'elle n'est pas la solution à nos problèmes 100 milliards dont 37 milliards uniquement pour raccorder les éoliennes en mer au réseau électrique vous croyez que je peux admettre cela  donc c'est un combat essentiel y compris dans les débats qui nous")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 26 170.1111 342
Label Training Sample Count
0 27
1 27

Training Hyperparameters

  • batch_size: (4, 4)
  • num_epochs: (1, 1)
  • max_steps: -1
  • sampling_strategy: oversampling
  • body_learning_rate: (2e-05, 1e-05)
  • head_learning_rate: 0.01
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • l2_weight: 0.01
  • seed: 42
  • run_name: multilingual-e5-small-climateguard04-06-2025_10-59-25
  • eval_max_steps: -1
  • load_best_model_at_end: True

Training Results

Epoch Step Training Loss Validation Loss
0.0026 1 0.2111 -
0.1323 50 0.3139 0.2420
0.2646 100 0.1369 0.2478
0.3968 150 0.0404 0.1904
0.5291 200 0.0025 0.1282
0.6614 250 0.0007 0.0669
0.7937 300 0.0005 0.0578
0.9259 350 0.0004 0.0567

Framework Versions

  • Python: 3.12.8
  • SetFit: 1.1.2
  • Sentence Transformers: 4.1.0
  • Transformers: 4.52.2
  • PyTorch: 2.7.0
  • Datasets: 3.6.0
  • Tokenizers: 0.21.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
11
Safetensors
Model size
118M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for gmguarino/multilingual-e5-small-climateguard

Finetuned
(94)
this model

Evaluation results