|
--- |
|
license: cc-by-nc-4.0 |
|
tags: |
|
- tts |
|
- russian |
|
- fine-tuned |
|
- f5-tts |
|
- voice-clone |
|
language: |
|
- ru |
|
base_model: |
|
- SWivid/F5-TTS |
|
pipeline_tag: text-to-speech |
|
--- |
|
|
|
**F5-TTS_RUSSIAN** - дообученная версия оригинальной модели **[F5-TTS](https://huggingface.co/SWivid/F5-TTS)**, адаптированная для синтеза русской речи. |
|
Модель обучалась на 5 000 часах с сочетанием русской и английской речи и поддерживает управление ударением в словах. |
|
|
|
## Ключевые особенности |
|
|
|
* **Ударения**: для изменения ударения поставьте символ `+` перед ударной гласной (`молок+о → молокó`). |
|
Для автоматической расстановки ударений можно использовать модель **[RUAccent](https://github.com/Den4ikAI/ruaccent)**. |
|
* **Демо**: демо работы модели и сравнение с XTTS и FishSpeech — <https://misha24-10.github.io/Misha24-10/> |
|
|
|
## Обучающие данные (5000+ часов) |
|
| Источник | Часов | |
|
|--------------------------------------|-------| |
|
| Кастомный русский датасет | 4 000 | |
|
| Common Voice RU | 239 | |
|
| Common Voice EN | 240 | |
|
| Sova (RuDevices + RuAudiobooks) | 400 | |
|
| LibriHeavy (частично) | 180 | |