TTS-GPT-SoVITS

Running

App Files Files Community

lijiacai commited on Jun 2, 2024

Commit

7eba1ae

1 Parent(s): 6e54490

fix

Browse files

Files changed (5) hide show

__pycache__/main.cpython-39.pyc +0 -0
__pycache__/model.cpython-39.pyc +0 -0
__pycache__/test_.cpython-39.pyc +0 -0
demo.py +0 -44
main.py +50 -5

__pycache__/main.cpython-39.pyc DELETED Viewed

Binary file (2.12 kB)

__pycache__/model.cpython-39.pyc DELETED Viewed

Binary file (21 kB)

__pycache__/test_.cpython-39.pyc DELETED Viewed

Binary file (436 Bytes)

demo.py DELETED Viewed

@@ -1,44 +0,0 @@
-import gradio as gr
-from enum import Enum
-from model import text_to_speech
-description = """
-## [接口文档](/docs)
-## 功能：
-- 零样本文本到语音（TTS）： 输入 5 秒的声音样本，即刻体验文本到语音转换。
-- 少样本 TTS： 仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。
-- 跨语言支持： 支持与训练数据集不同语言的推理，目前支持英语、日语和中文。
-"""
-class Demo:
-    title = "text to speech"
-    description = description
-    @property
-    def app(self):
-        with gr.Blocks() as demo:
-            self.layout()
-        return demo
-    def layout(self):
-        with gr.Row():
-            gr.Markdown()
-        with gr.Row():
-            with gr.Column(scale=2):
-                with gr.Row():
-                    self.text = gr.Textbox(label="请输入需要转换的文本")
-                with gr.Row():
-                    self.voice = gr.Dropdown(
-                        ["新闻小说主播-女士", "温柔女士"], value="新闻小说主播-女士", label="选择音色")
-            with gr.Column(scale=2):
-                self.audio = gr.Audio(label="转换后的音频", type="filepath", scale=3)
-        with gr.Row():
-            self.button = gr.Button()
-if __name__ == "__main__":
-    Demo().app.launch(share=True, server_port=40000, server_name="0.0.0.0")

main.py CHANGED Viewed

@@ -1,14 +1,23 @@
 from fastapi import FastAPI, Body, File, Form, UploadFile, Response, Request
 from fastapi.responses import FileResponse, StreamingResponse
 from fastapi.staticfiles import StaticFiles
-import gradio as  gr
 import os
 from enum import Enum
 import uvicorn
 import time
 from model import Language, DefaultVoice, text_to_speech
-from demo import  Demo
-app = FastAPI(title=Demo.title, description=Demo.description)
 @app.middleware("http")
@@ -22,7 +31,6 @@ async def add_process_time_header(request: Request, call_next):
 app.mount("/static", StaticFiles(directory="static"), name="static")
 @app.post("/tts")
 async def tts(
         voice: DefaultVoice = Form("新闻女士"),
@@ -38,8 +46,45 @@ async def tts(
         audio_content = audio_file.read()
     return Response(audio_content,  headers=headers)
 gr.mount_gradio_app(app, Demo().app, path="/")
 if __name__ == '__main__':
     uvicorn.run(app="main:app", port=int(7860), host="0.0.0.0")

 from fastapi import FastAPI, Body, File, Form, UploadFile, Response, Request
 from fastapi.responses import FileResponse, StreamingResponse
 from fastapi.staticfiles import StaticFiles
+import gradio as gr
 import os
 from enum import Enum
 import uvicorn
 import time
 from model import Language, DefaultVoice, text_to_speech
+description = """
+## [接口文档](/docs)
+## 功能：
+- 零样本文本到语音（TTS）： 输入 5 秒的声音样本，即刻体验文本到语音转换。
+- 少样本 TTS： 仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。
+- 跨语言支持： 支持与训练数据集不同语言的推理，目前支持英语、日语和中文。
+"""
+app = FastAPI(title="text to speech", description=description)
 @app.middleware("http")
 app.mount("/static", StaticFiles(directory="static"), name="static")
 @app.post("/tts")
 async def tts(
         voice: DefaultVoice = Form("新闻女士"),
         audio_content = audio_file.read()
     return Response(audio_content,  headers=headers)
+class Demo:
+    title = "text to speech"
+    description = description
+    @property
+    def app(self):
+        with gr.Blocks() as demo:
+            self.layout()
+            self.event()
+        return demo
+    def click_run_button(self, voice, text):
+        wav_path = text_to_speech(voice=voice, text=text)
+        return wav_path
+    def event(self):
+        self.button.click(self.click_run_button, inputs=[
+                          self.voice, self.text], outputs=[self.audio])
+    def layout(self):
+        with gr.Row():
+            gr.Markdown(value=self.description)
+        with gr.Row():
+            with gr.Column(scale=2):
+                with gr.Row():
+                    self.text = gr.Textbox(label="请输入需要转换的文本")
+                with gr.Row():
+                    self.voice = gr.Dropdown(
+                        ["新闻小说主播-女士", "温柔女士"],
+                        label="选择音色")
+            with gr.Column(scale=2):
+                self.audio = gr.Audio(label="转换后的音频", type="filepath", scale=3)
+        with gr.Row():
+            self.button = gr.Button()
 gr.mount_gradio_app(app, Demo().app, path="/")
 if __name__ == '__main__':
     uvicorn.run(app="main:app", port=int(7860), host="0.0.0.0")