Spaces:

HugoZeballos
/

ASR_RAPA_NUI_SEAMLESS

Sleeping

HugoZeballos commited on Jan 20

Commit

7a53a06

verified ·

1 Parent(s): c3eb679

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,6 +19,10 @@ repo_name = "HugoZeballos/rapa_nui_asr_2"  # Ajusta al nombre de tu modelo en Hu
 processor = Speech2TextProcessor.from_pretrained(repo_name)
 model = Speech2TextForConditionalGeneration.from_pretrained(repo_name).to(device)
 def transcribe(audio_path):
     audio, sr = librosa.load(audio_path, sr=16000)
     inputs = processor(audio, sampling_rate=sr, return_tensors="pt", padding="longest").to("cuda")
@@ -27,13 +31,15 @@ def transcribe(audio_path):
         predicted_ids = model.generate(inputs["input_features"], attention_mask=inputs["attention_mask"])
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)[0]
     return transcription
-# Crear interfaz Gradio
 interface = gr.Interface(
-    fn=transcribe,
-    inputs=gr.Audio(source="upload", type="filepath"),
-    outputs="text",
-    title="Transcriptor ASR Rapa Nui"
 )
-interface.launch()

 processor = Speech2TextProcessor.from_pretrained(repo_name)
 model = Speech2TextForConditionalGeneration.from_pretrained(repo_name).to(device)
+# Cambiar `source` a una configuración válida o eliminarlo
+inputs = gr.Audio(type="filepath")
+outputs = gr.Textbox(label="Transcripción")
 def transcribe(audio_path):
     audio, sr = librosa.load(audio_path, sr=16000)
     inputs = processor(audio, sampling_rate=sr, return_tensors="pt", padding="longest").to("cuda")
         predicted_ids = model.generate(inputs["input_features"], attention_mask=inputs["attention_mask"])
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)[0]
     return transcription
+# Crear interfaz
 interface = gr.Interface(
+    fn=transcribe_audio,
+    inputs=inputs,
+    outputs=outputs,
+    title="ASR Demo"
 )
+# Ejecutar la app
+if __name__ == "__main__":
+    interface.launch()