F5-TTS-THAI

โมเดลหลัก : SWivid/F5-TTS

Github : https://github.com/SWivid/F5-TTS

ชุดข้อมูลที่นำไปเทรน

  • Porameht/processed-voice-th-169k

  • Common Voice

  • จำนวน

    • 200,000 เสียง
    • ภาษาไทย ประมาณ 190 ชั่วโมง
    • ภาษาอังกฤษ ประมาณ 40 ชัวโมง
  • ขนาดโมเดลล่าสุด

    • 600,000 Steps
  • ภาษาที่รองรับ: ไทย และ อังกฤษ.

  • การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง

การใช้งาน

Github : https://github.com/VYNCX/F5-TTS-THAI

git clone https://github.com/VYNCX/F5-TTS-THAI.git
cd F5-TTS-THAI
python -m venv venv
call venv/scripts/activate
pip install git+https://github.com/VYNCX/F5-TTS-THAI.git

#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU
pip install torch==2.3.0+cu118 torchaudio==2.3.0+cu118 --extra-index-url https://download.pytorch.org/whl/cu118

สามารถรันไฟล์ app-webui.bat เพื่อใช้งานได้ หรือ

  python src/f5_tts/f5_tts_webui.py

ฝึกอบรม และ Finetune

ใช้งานบน Google Colab Finetune หรือ

  • ติดตั้ง
  cd F5-TTS-THAI
  pip install -e .
  • เปิด Gradio
  f5-tts_finetune-gradio

ตัวอย่างเสียง

  • เสียงต้นแบบ
    • ข้อความคำพูด : ฉันเดินทางไปเที่ยวที่จังหวัดเชียงใหม่ในช่วงฤดูหนาวเพื่อสัมผัสอากาศเย็นสบาย
  • เสียงที่สร้างขึ้น
    • Seed : 4213936761049775187
  • ภาษาอังกฤษกับคำภาษาไทย
  • เสียงต้นแบบ
    • ข้อความคำพูด : When there is not enough fuel pressure, the engine may not start.
  • เสียงที่สร้างขึ้น
    • ข้อความ : Today I went to the market and bought some "ข้าวเหนียวหมูปิ้ง" before heading to the park for a picnic.
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for VIZINTZOR/F5-TTS-THAI

Base model

SWivid/F5-TTS
Finetuned
(39)
this model

Dataset used to train VIZINTZOR/F5-TTS-THAI

Collection including VIZINTZOR/F5-TTS-THAI