GPT-FR – Gutenberg CLM
Modèle GPT-2 affiné sur un roman français
(“Les belles-de-nuit, tome IV” – Paul Féval, Project Gutenberg #43554).
Idéal pour la génération créative façon roman-feuilleton XIXᵉ siècle.
Valeur | |
---|---|
Base | asi/gpt-fr-cased-small |
Corpus | 1 roman FR (~1,2 M tokens) |
Époques | 40 |
Perplexité (val) | 12 |
Token accuracy | 88 % |
Exemple
from transformers import pipeline
gen = pipeline("text-generation",
model="mkd13mkd/gpt-fr-gutenberg-clm",
tokenizer="asi/gpt-fr-cased-small",
max_new_tokens=60, do_sample=True, temperature=0.8)
print(gen("Une silhouette drapée de voiles noirs errait dans le château, et")[0]["generated_text"])
Model tree for mkd13mkd/gpt-fr-sentiment-classifier
Base model
asi/gpt-fr-cased-small