XLM-RoBERTa model pre-trained on 2.5TB of filtered CommonCrawl data containing 100 languages.

This model is fine tuned with The Latin Library - 15M Token

The dataset was cleaned:

Safetensors

Model size

278M params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Cicciokr/XLM-Roberta-Base-Latin-Uncased

Base model

Finetuned

(2987)

this model