về cách train

#7
by HOANGTANTRONG1 - opened

cho mình hỏi, do mình newbie về mảng này , cũng chưa tìm hiểu gì nhiều , nhưng theo mình hiểu có phải nếu theo guide trên github của bạn thì mình có thể clone được 1 giọng theo ref audio mà mình cung cấp phải không, và mình càng cung cấp nhiều ref audio thì nó có giọng càng chuẩn hay sao..mình cảm ơn

  1. Bro cần train thêm nhiều giọng để model có thể cloning đa dạng các giọng chưa biết hơn
  2. Model hiện tại này của mình chất lượng voice cloning ở mức khá nhé

mình cảm ơn, về dataset thì ví dụ 1 file mp4 thì tên mp4 với tên txt phải tương đương nhau đúng kh nhỉ, mình có cần lowercase hết ở file txt không

  1. Các audio cho huấn luyện model AI thường ở dạng .wav, mono, int16 nhé bro
  2. Việc lowercase nói riêng hay tiền xử lý dữ liệu text nói chung còn phụ thuộc:
    • Nếu Pretrained được train ở đa dạng kết hợp lowercase, ký tự số, ngày tháng ở dạng chuẩn => nên finetuning theo dữ liệu như pretrained ?

okay, tui sẽ thử chạy trước để biết nó như thế nào

Your need to confirm your account before you can post a new comment.

Sign up or log in to comment