về cách train

by HOANGTANTRONG1 - opened 13 days ago

13 days ago

cho mình hỏi, do mình newbie về mảng này , cũng chưa tìm hiểu gì nhiều , nhưng theo mình hiểu có phải nếu theo guide trên github của bạn thì mình có thể clone được 1 giọng theo ref audio mà mình cung cấp phải không, và mình càng cung cấp nhiều ref audio thì nó có giọng càng chuẩn hay sao..mình cảm ơn

hynt

Owner 13 days ago

Bro cần train thêm nhiều giọng để model có thể cloning đa dạng các giọng chưa biết hơn
Model hiện tại này của mình chất lượng voice cloning ở mức khá nhé

HOANGTANTRONG1

13 days ago

mình cảm ơn, về dataset thì ví dụ 1 file mp4 thì tên mp4 với tên txt phải tương đương nhau đúng kh nhỉ, mình có cần lowercase hết ở file txt không

hynt

Owner 12 days ago

Các audio cho huấn luyện model AI thường ở dạng .wav, mono, int16 nhé bro
Việc lowercase nói riêng hay tiền xử lý dữ liệu text nói chung còn phụ thuộc:
- Nếu Pretrained được train ở đa dạng kết hợp lowercase, ký tự số, ngày tháng ở dạng chuẩn => nên finetuning theo dữ liệu như pretrained ?

HOANGTANTRONG1

12 days ago

okay, tui sẽ thử chạy trước để biết nó như thế nào

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

Your need to confirm your account before you can post a new comment.

· Sign up or log in to comment