VIZINTZOR
/

F5-TTS-THAI

Model card Files Files and versions Community

F5-TTS-THAI

โมเดลหลัก : SWivid/F5-TTS

Github : https://github.com/SWivid/F5-TTS

ชุดข้อมูลที่นำไปเทรน

Porameht/processed-voice-th-169k
Common Voice
จำนวน
- 200,000 เสียง
- ภาษาไทย ประมาณ 190 ชั่วโมง
- ภาษาอังกฤษ ประมาณ 40 ชัวโมง
ขนาดโมเดลล่าสุด
- 600,000 Steps
ภาษาที่รองรับ: ไทย และ อังกฤษ.
การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง

การใช้งาน

Github : https://github.com/VYNCX/F5-TTS-THAI

git clone https://github.com/VYNCX/F5-TTS-THAI.git
cd F5-TTS-THAI
python -m venv venv
call venv/scripts/activate
pip install git+https://github.com/VYNCX/F5-TTS-THAI.git

#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU
pip install torch==2.3.0+cu118 torchaudio==2.3.0+cu118 --extra-index-url https://download.pytorch.org/whl/cu118

สามารถรันไฟล์ app-webui.bat เพื่อใช้งานได้ หรือ

  python src/f5_tts/f5_tts_webui.py

ฝึกอบรม และ Finetune

ใช้งานบน Google Colab Finetune หรือ

ติดตั้ง

  cd F5-TTS-THAI
  pip install -e .

เปิด Gradio

  f5-tts_finetune-gradio

ตัวอย่างเสียง

เสียงต้นแบบ
- ข้อความคำพูด : ฉันเดินทางไปเที่ยวที่จังหวัดเชียงใหม่ในช่วงฤดูหนาวเพื่อสัมผัสอากาศเย็นสบาย
เสียงที่สร้างขึ้น
- Seed : 4213936761049775187
ภาษาอังกฤษกับคำภาษาไทย
เสียงต้นแบบ
- ข้อความคำพูด : When there is not enough fuel pressure, the engine may not start.
เสียงที่สร้างขึ้น
- ข้อความ : Today I went to the market and bought some "ข้าวเหนียวหมูปิ้ง" before heading to the park for a picnic.

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for VIZINTZOR/F5-TTS-THAI

Base model

SWivid/F5-TTS

Finetuned

(39)

this model

Dataset used to train VIZINTZOR/F5-TTS-THAI

Collection including VIZINTZOR/F5-TTS-THAI

F5-TTS

1 item • Updated Mar 15