Spaces:

GAS17
/

vi

Sleeping

App Files Files Community

GAS17 commited on 23 days ago

Commit

29bf2a5

verified ·

1 Parent(s): 508223d

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -30

app.py CHANGED Viewed

@@ -3,7 +3,6 @@ import requests
 import os
 from dotenv import load_dotenv
 from datetime import datetime, timedelta
-from flask import Flask, jsonify
 # Cargar variables de entorno desde el archivo .env
 load_dotenv()
@@ -11,7 +10,7 @@ load_dotenv()
 # Constantes para el script
 CHUNK_SIZE = 1024  # Tamaño de los chunks para leer/escribir a la vez
 XI_API_KEY = os.getenv("XI_API_KEY")  # Tu clave API para autenticación
-VOICE_ID = os.getenv("VOICE_ID")  # ID del modelo de voz a utilizar
 # Diccionario para almacenar la información de uso
 usage_data = {
@@ -23,18 +22,6 @@ usage_data = {
 MESSAGE_LIMIT = 145
 TIME_LIMIT = timedelta(hours=2)
-# Crear la aplicación Flask
-app = Flask(__name__)
-@app.route('/reset_usage', methods=['POST'])
-def reset_usage():
-    global usage_data
-    usage_data = {
-        'message_count': 0,
-        'last_reset': datetime.now()
-    }
-    return jsonify({"success": "Usage reset."}), 200
 def text_to_speech(text, style):
     global usage_data
     current_time = datetime.now()
@@ -48,55 +35,53 @@ def text_to_speech(text, style):
     # Verificar si se ha alcanzado el límite de mensajes
     if usage_data['message_count'] >= MESSAGE_LIMIT:
-        return "Error: Límite de mensajes alcanzado. Intenta nuevamente en 2 horas."
     # URL para la solicitud de la API de Text-to-Speech
     tts_url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}/stream"
-    # Encabezados para la solicitud de la API, incluida la clave API para autenticación
     headers = {
         "Accept": "application/json",
         "xi-api-key": XI_API_KEY
     }
-    # Datos de carga útil para la solicitud de la API, incluidos los ajustes de texto y voz
     data = {
         "text": text,
         "model_id": "eleven_multilingual_v2",
         "voice_settings": {
             "stability": 0.5,
             "similarity_boost": 0.8,
-            "style": style,  # Usar el valor de estilo proporcionado por el usuario
             "use_speaker_boost": True
         }
     }
-    # Realizar la solicitud POST a la API de TTS con encabezados y datos, habilitando la respuesta en streaming
     response = requests.post(tts_url, headers=headers, json=data, stream=True)
     # Verificar si la solicitud fue exitosa
     if response.ok:
-        # Crear un archivo temporal para guardar el audio
         output_path = "output.mp3"
         with open(output_path, "wb") as f:
-            # Leer la respuesta en chunks y escribir en el archivo
             for chunk in response.iter_content(chunk_size=CHUNK_SIZE):
                 f.write(chunk)
-        # Incrementar el contador de mensajes
         usage_data['message_count'] += 1
         return output_path
     else:
-        return f"Error: {response.text}"
-# Crear una interfaz de Gradio para la entrada de texto y la generación de audio
 iface = gr.Interface(
     fn=text_to_speech,
-    inputs=[gr.Textbox(label="Texto"), gr.Slider(minimum=0, maximum=1, step=0.1, label="Style")],  # Añadir barra para style
-    outputs="audio",
-    title="",
-    description=""
 )
-# Ejecutar la interfaz
 if __name__ == "__main__":
-    iface.launch()

 import os
 from dotenv import load_dotenv
 from datetime import datetime, timedelta
 # Cargar variables de entorno desde el archivo .env
 load_dotenv()
 # Constantes para el script
 CHUNK_SIZE = 1024  # Tamaño de los chunks para leer/escribir a la vez
 XI_API_KEY = os.getenv("XI_API_KEY")  # Tu clave API para autenticación
+VOICE_ID = os.getenv("VOICE_ID")      # ID del modelo de voz a utilizar
 # Diccionario para almacenar la información de uso
 usage_data = {
 MESSAGE_LIMIT = 145
 TIME_LIMIT = timedelta(hours=2)
 def text_to_speech(text, style):
     global usage_data
     current_time = datetime.now()
     # Verificar si se ha alcanzado el límite de mensajes
     if usage_data['message_count'] >= MESSAGE_LIMIT:
+        return None  # Limite alcanzado, no se produce audio
     # URL para la solicitud de la API de Text-to-Speech
     tts_url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}/stream"
+    # Encabezados para la solicitud de la API
     headers = {
         "Accept": "application/json",
         "xi-api-key": XI_API_KEY
     }
+    # Datos de carga útil para la solicitud de la API
     data = {
         "text": text,
         "model_id": "eleven_multilingual_v2",
         "voice_settings": {
             "stability": 0.5,
             "similarity_boost": 0.8,
+            "style": style,
             "use_speaker_boost": True
         }
     }
+    # Realizar la solicitud POST
     response = requests.post(tts_url, headers=headers, json=data, stream=True)
     # Verificar si la solicitud fue exitosa
     if response.ok:
         output_path = "output.mp3"
         with open(output_path, "wb") as f:
             for chunk in response.iter_content(chunk_size=CHUNK_SIZE):
                 f.write(chunk)
         usage_data['message_count'] += 1
         return output_path
     else:
+        return None  # Si falla, tampoco generes audio
 iface = gr.Interface(
     fn=text_to_speech,
+    inputs=[
+        gr.Textbox(label="Texto"),
+        gr.Slider(minimum=0, maximum=1, step=0.1, label="Style")
+    ],
+    outputs=gr.Audio(type="filepath"),
+    title="Text to Speech ElevenLabs",
+    description="Convierte texto a voz usando ElevenLabs. Elige el 'Style' con el slider."
 )
 if __name__ == "__main__":
+    iface.launch(share=True)