wedyanessam commited on
Commit
1ed541f
·
verified ·
1 Parent(s): 36fe92a

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +9 -2
app.py CHANGED
@@ -1,10 +1,19 @@
1
  import sys
2
  import os
3
  sys.path.append(os.path.abspath("."))
 
4
  import gradio as gr
5
  from pathlib import Path
6
  import argparse
7
 
 
 
 
 
 
 
 
 
8
  from STT.sst import speech_to_text
9
  from LLM.llm import generate_reply
10
  from TTS_X.tts import generate_voice
@@ -43,7 +52,6 @@ def generate_video(image_path, audio_path, prompt, output_dir="./output"):
43
  )
44
  return main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
45
 
46
-
47
  def full_pipeline(user_audio, user_image):
48
  # 1. تحويل الصوت إلى نص
49
  user_text = speech_to_text(user_audio)
@@ -64,7 +72,6 @@ def full_pipeline(user_audio, user_image):
64
 
65
  return user_text, reply, reply_audio_path, video_path
66
 
67
-
68
  # واجهة Gradio
69
  with gr.Blocks(title="🧠 صوتك يحرك صورة!") as demo:
70
  gr.Markdown("## 🎤➡️💬➡️🔊➡️📽️ من صوتك إلى فيديو متكلم!")
 
1
  import sys
2
  import os
3
  sys.path.append(os.path.abspath("."))
4
+
5
  import gradio as gr
6
  from pathlib import Path
7
  import argparse
8
 
9
+ # تحميل النماذج تلقائيًا إذا ما كانت موجودة
10
+ from download_all_models import maybe_download_model
11
+
12
+ maybe_download_model("Wan-AI/Wan2.1-I2V-14B-720P", "./models/Wan2.1-I2V-14B-720P")
13
+ maybe_download_model("facebook/wav2vec2-base-960h", "./models/wav2vec2-base-960h")
14
+ maybe_download_model("acvlab/FantasyTalking", "./models/fantasytalking_model")
15
+
16
+ # استيراد بقية الأشياء
17
  from STT.sst import speech_to_text
18
  from LLM.llm import generate_reply
19
  from TTS_X.tts import generate_voice
 
52
  )
53
  return main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
54
 
 
55
  def full_pipeline(user_audio, user_image):
56
  # 1. تحويل الصوت إلى نص
57
  user_text = speech_to_text(user_audio)
 
72
 
73
  return user_text, reply, reply_audio_path, video_path
74
 
 
75
  # واجهة Gradio
76
  with gr.Blocks(title="🧠 صوتك يحرك صورة!") as demo:
77
  gr.Markdown("## 🎤➡️💬➡️🔊➡️📽️ من صوتك إلى فيديو متكلم!")