về cách train
#7
by
HOANGTANTRONG1
- opened
cho mình hỏi, do mình newbie về mảng này , cũng chưa tìm hiểu gì nhiều , nhưng theo mình hiểu có phải nếu theo guide trên github của bạn thì mình có thể clone được 1 giọng theo ref audio mà mình cung cấp phải không, và mình càng cung cấp nhiều ref audio thì nó có giọng càng chuẩn hay sao..mình cảm ơn
- Bro cần train thêm nhiều giọng để model có thể cloning đa dạng các giọng chưa biết hơn
- Model hiện tại này của mình chất lượng voice cloning ở mức khá nhé
mình cảm ơn, về dataset thì ví dụ 1 file mp4 thì tên mp4 với tên txt phải tương đương nhau đúng kh nhỉ, mình có cần lowercase hết ở file txt không
- Các audio cho huấn luyện model AI thường ở dạng .wav, mono, int16 nhé bro
- Việc lowercase nói riêng hay tiền xử lý dữ liệu text nói chung còn phụ thuộc:
- Nếu Pretrained được train ở đa dạng kết hợp lowercase, ký tự số, ngày tháng ở dạng chuẩn => nên finetuning theo dữ liệu như pretrained ?
okay, tui sẽ thử chạy trước để biết nó như thế nào