RVC NgNgNgan
License
In accordance with the terms of the CC-BY-NC-SA-4.0 license, the use of my checkpoints and any audio output generated by them for commercial purposes is strictly prohibited. This includes, but is not limited to:
- online and offline voice cloning as a service
- online and offline text-to-speech as a service
- content creation for monetization on social media platforms
Căn cứ vào các điều khoản của giấp phép CC-BY-NC-SA-4.0, việc sử dụng các checkpoints này và bất kỳ đầu ra âm thanh nào được tạo bởi chúng đều bị nghiêm cấm sử dụng cho mục đích thương mại. Điều này bao gồm, nhưng không giới hạn ở:
- các dịch vụ nhân bản giọng nói trực tuyến và ngoại tuyến
- các dịch vụ chuyển văn bản thành giọng nói trực tuyến và ngoại tuyến
- tạo nội dung để kiếm tiền trên các nền tảng mạng xã hội
What is RVC?
original: https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
i trained using this fork: https://github.com/IAHispano/Applio
Final result:
- checkpoint: https://huggingface.co/doof-ferb/rvc-ngngngan/blob/main/ckpt/nguyenngocngan_e160_s168480.pth
- index: https://huggingface.co/doof-ferb/rvc-ngngngan/blob/main/idx/added_IVF256_Flat_nprobe_1_nguyenngocngan_v2.index
About this repo
- Vietnamese M.C. Nguyễn Ngọc Ngạn
- data scraping code: https://github.com/phineas-pta/speech-synthesis-ngngngan
- 6h30min audio at 48 kHz + RMVPE pitch extraction = 16.1 GiB disk space
- batch size = 8 ⇒ 1 epoch = 1053 steps
- train locally from scratch, ≈ 10’30” per epoch
- train 300 epochs, save ckpt every 5 epoch, select ckpt at 160th epoch
- i haven’t tested all the models 1 by 1
Model tree for doof-ferb/rvc-ngngngan
Base model
lj1995/VoiceConversionWebUI