JyuViole commited on
Commit
aa08dd6
·
verified ·
1 Parent(s): 4169f5f

Upload app.py

Browse files
Files changed (1) hide show
  1. app.py +1 -63
app.py CHANGED
@@ -1,4 +1,3 @@
1
- ```python
2
  import gc
3
  import json
4
  import re
@@ -869,65 +868,4 @@ if __name__ == "__main__":
869
  if not USING_SPACES:
870
  main()
871
  else:
872
- app.queue().launch()
873
- ```
874
-
875
- ### Изменения
876
- 1. **Обновлён `RUSSIAN_TTS_MODEL_CFG`**:
877
- - Путь к модели изменён на `"hf://Misha24-10/F5-TTS_RUSSIAN/F5TTS_v1_Base/model_240000_inference.safetensors"`, чтобы соответствовать расположению файла в папке `F5TTS_v1_Base`.
878
- - Путь к `vocab.txt` остался `"hf://Misha24-10/F5-TTS_RUSSIAN/vocab.txt"`, так как вы подтвердили его наличие в корне.
879
- - Конфигурация модели осталась без изменений, так как она соответствует документации.
880
-
881
- 2. **Исправлен `NameError`**:
882
- - В блоке `app_multistyle` цикл для привязки кнопок `speech_type_insert_btns` перемещён после определения `gen_text_input_multistyle`, чтобы избежать ошибки `NameError`.
883
-
884
- ### Что делать дальше
885
- 1. **Замените `app.py`**:
886
- - Сохраните код выше как `app.py`, заменив существующий файл в вашем проекте.
887
-
888
- 2. **Очистите кэш**:
889
- - Удалите кэш Hugging Face, чтобы избежать проблем с ранее загруженными файлами:
890
- ```bash
891
- rm -rf ~/.cache/huggingface/
892
- ```
893
-
894
- 3. **Запустите приложение**:
895
- - Выполните:
896
- ```bash
897
- python app.py
898
- ```
899
- - Проверьте консоль. Ожидаемый вывод: `F5-TTS_RUSSIAN loaded successfully.`. Если появляется ошибка `404`, уточните, пожалуйста, точное расположение файла `model_240000_inference.safetensors` в репозитории (например, если он в другой подпапке).
900
-
901
- 4. **Протестируйте генерацию**:
902
- - В интерфейсе выберите язык `ru` в поле `language_input` (вкладка "Basic-TTS") или `language_chat` (вкладка "Voice-Chat").
903
- - Загрузите референсное аудио на русском языке (WAV или MP3, до 12 секунд).
904
- - Введите текст с ударениями, например: `{Regular} Прив+ет, как дел+а?`.
905
- - Нажмите "Synthesize" (или "Generate Multi-Style Speech" для мультистилевой генерации) и проверьте, генерируется ли русская речь.
906
-
907
- ### Если проблема сохраняется
908
- Если модель всё ещё не загружается или не говорит по-русски:
909
- 1. **Проверьте консоль**: Если появляется ошибка `404`, проверьте точный путь к файлу `model_240000_inference.safetensors` на [Hugging Face](https://huggingface.co/Misha24-10/F5-TTS_RUSSIAN/tree/main). Если он в другой папке, обновите путь в `RUSSIAN_TTS_MODEL_CFG`.
910
- 2. **Попробуйте другой чекпоинт**: Если `model_240000_inference.safetensors` не работает, попробуйте `model_240000.pt`:
911
- ```python
912
- RUSSIAN_TTS_MODEL_CFG = [
913
- "hf://Misha24-10/F5-TTS_RUSSIAN/F5TTS_v1_Base/model_240000.pt",
914
- "hf://Misha24-10/F5-TTS_RUSSIAN/vocab.txt",
915
- json.dumps(dict(dim=1024, depth=22, heads=16, ff_mult=2, text_dim=512, conv_layers=4)),
916
- ]
917
- ```
918
- 3. **Проверьте язык**: Убедитесь, что в интерфейсе выбран `ru`. Для отладки добавьте в функцию `infer` перед `if language == "ru":`:
919
- ```python
920
- print(f"Language selected: {language}, using model: {'F5-TTS_RUSSIAN' if language == 'ru' else model}")
921
- ```
922
- Проверьте, что выводится в консоли.
923
- 4. **Проверьте референсное аудио**: Убедитесь, что аудио на русском языке.
924
-
925
- ### Дополнительно
926
- - **Ударения**: Для лучшего качества русской речи добавляйте ударения в текст (например, `молок+о`). Если хотите автоматизировать этот процесс, могу предложить интегрировать библиотеку `ruaccent` для автоматической расстановки ударений. Напишите, если это нужно.
927
- - **Логи**: Если ошибка сохраняется, предоставьте новый лог консоли, а также:
928
- - Какой текст вы вводите.
929
- - Какое референсное аудио используете (на русском или нет).
930
- - Какой язык выбран в интерфейсе.
931
- - На каком языке генерируется аудио.
932
-
933
- Если всё сработает, дайте знать, чтобы я мог подтвердить, что проблема решена!
 
 
1
  import gc
2
  import json
3
  import re
 
868
  if not USING_SPACES:
869
  main()
870
  else:
871
+ app.queue().launch()