Spaces:

wedyanessam
/

Real_Time_Interactive_Avatar_v2

Runtime error

App Files Files Community

wedyanessam commited on May 28

Commit

fa13218

verified ·

1 Parent(s): 1743a16

Update app.py

Browse files

Files changed (1) hide show

app.py +25 -31

app.py CHANGED Viewed

@@ -1,11 +1,24 @@
 import subprocess
 import os
 import sys
 from pathlib import Path
 import argparse
 import gradio as gr
-# ✅ تحميل الموديلات لو ما كانت موجودة
 if not os.path.exists("./models/fantasytalking_model.ckpt"):
     print("🛠️ جاري تحميل النماذج عبر download_models.py ...")
     subprocess.run(["python", "download_models.py"])
@@ -19,22 +32,22 @@ from LLM.llm import generate_reply
 from TTS_X.tts import generate_voice
 from FantasyTalking.infer import load_models, main
-# ✅ إعداد ثوابت الموديل
 args_template = argparse.Namespace(
     fantasytalking_model_path="./models/fantasytalking_model.ckpt",
     wav2vec_model_dir="./models/wav2vec2-base-960h",
-    wan_model_dir="./models/Wan2.1-I2V-14B-720P",  # نقدر نشيله لو تبغي لاحقًا
     image_path="",
     audio_path="",
     prompt="",
     output_dir="./output",
-    image_size=384,  # ⬅️ قللنا حجم الصورة
     audio_scale=1.0,
-    prompt_cfg_scale=3.0,  # ⬅️ أقل شوية
-    audio_cfg_scale=3.0,
-    max_num_frames=36,  # ⬅️ قللنا عدد الفريمات
-    inference_steps=8,  # ⬅️ قللنا خطوات التوليد
-    fps=20,  # ⬅️ أقل شوية عشان التوليد أسرع
     num_persistent_param_in_dit=None,
     seed=1111
 )
@@ -44,14 +57,8 @@ print("🚀 جاري تحميل FantasyTalking و Wav2Vec...")
 pipe, fantasytalking, wav2vec_processor, wav2vec = load_models(args_template)
 print("✅ تم التحميل!")
-# ✅ توليد الفيديو - مع طباعة Debug
 def generate_video(image_path, audio_path, prompt, output_dir="./output"):
-    print(f"[🎨] generate_video() بدأ التشغيل")
-    print(f"[📁] image_path: {image_path}")
-    print(f"[📁] audio_path: {audio_path}")
-    print(f"[💬] prompt: {prompt}")
-    print(f"[📁] output_dir: {output_dir}")
     args = argparse.Namespace(
         **vars(args_template),
         image_path=image_path,
@@ -59,28 +66,18 @@ def generate_video(image_path, audio_path, prompt, output_dir="./output"):
         prompt=prompt,
         output_dir=output_dir
     )
-    video_path = main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
-    print(f"[✅] generate_video() انتهى، الفيديو محفوظ هنا: {video_path}")
-    return video_path
-# ✅ خط الأنابيب الكامل - مع طباعة Debug
 def full_pipeline(user_audio, user_image):
-    print("[🚀] full_pipeline() بدأ التشغيل")
-    print(f"[🔊] ملف الصوت المُدخل: {user_audio}")
-    print(f"[🖼️] ملف الصورة المُدخلة: {user_image}")
     print("🎤 تحويل الصوت إلى نص...")
     user_text = speech_to_text(user_audio)
-    print(f"[📝] النص المستخرج من الصوت: {user_text}")
     print("💬 توليد الرد...")
     reply = generate_reply(user_text)
-    print(f"[🤖] الرد المُولد: {reply}")
     print("🔊 تحويل الرد إلى صوت...")
     reply_audio_path = generate_voice(reply)
-    print(f"[🔊] مسار الصوت المُولد: {reply_audio_path}")
     print("📽️ توليد الفيديو...")
     Path("./output").mkdir(parents=True, exist_ok=True)
@@ -90,7 +87,6 @@ def full_pipeline(user_audio, user_image):
         prompt=reply
     )
-    print(f"[✅] full_pipeline() انتهى، الفيديو النهائي هنا: {video_path}")
     return user_text, reply, reply_audio_path, video_path
 # ✅ واجهة Gradio
@@ -114,5 +110,3 @@ with gr.Blocks(title="🧠 صوتك يحرك صورة!") as demo:
               outputs=[user_text, reply_text, reply_audio, video_output])
 demo.launch(inbrowser=True, share=True)

 import subprocess
 import os
 import sys
+import shutil
 from pathlib import Path
 import argparse
 import gradio as gr
+# ✅ التنظيف أولاً: فقط للمجلدات المؤقتة
+folders_to_delete = ["./output", "./__pycache__", "./.cache", "./temp"]
+for folder in folders_to_delete:
+    if os.path.exists(folder):
+        print(f"🗑️ حذف {folder}")
+        shutil.rmtree(folder)
+# ✅ طباعة حالة الذاكرة
+import psutil
+mem = psutil.virtual_memory()
+print(f"🔍 RAM المستخدمة: {mem.used / 1e9:.2f} GB / {mem.total / 1e9:.2f} GB")
+# ✅ تحميل الموديلات إذا ما كانت موجودة
 if not os.path.exists("./models/fantasytalking_model.ckpt"):
     print("🛠️ جاري تحميل النماذج عبر download_models.py ...")
     subprocess.run(["python", "download_models.py"])
 from TTS_X.tts import generate_voice
 from FantasyTalking.infer import load_models, main
+# ✅ ثابتات النموذج
 args_template = argparse.Namespace(
     fantasytalking_model_path="./models/fantasytalking_model.ckpt",
     wav2vec_model_dir="./models/wav2vec2-base-960h",
+    wan_model_dir="./models/Wan2.1-I2V-14B-720P",
     image_path="",
     audio_path="",
     prompt="",
     output_dir="./output",
+    image_size=512,
     audio_scale=1.0,
+    prompt_cfg_scale=5.0,
+    audio_cfg_scale=5.0,
+    max_num_frames=81,
+    inference_steps=20,
+    fps=23,
     num_persistent_param_in_dit=None,
     seed=1111
 )
 pipe, fantasytalking, wav2vec_processor, wav2vec = load_models(args_template)
 print("✅ تم التحميل!")
+# ✅ توليد فيديو
 def generate_video(image_path, audio_path, prompt, output_dir="./output"):
     args = argparse.Namespace(
         **vars(args_template),
         image_path=image_path,
         prompt=prompt,
         output_dir=output_dir
     )
+    return main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
+# ✅ خط الأنابيب الكامل
 def full_pipeline(user_audio, user_image):
     print("🎤 تحويل الصوت إلى نص...")
     user_text = speech_to_text(user_audio)
     print("💬 توليد الرد...")
     reply = generate_reply(user_text)
     print("🔊 تحويل الرد إلى صوت...")
     reply_audio_path = generate_voice(reply)
     print("📽️ توليد الفيديو...")
     Path("./output").mkdir(parents=True, exist_ok=True)
         prompt=reply
     )
     return user_text, reply, reply_audio_path, video_path
 # ✅ واجهة Gradio
               outputs=[user_text, reply_text, reply_audio, video_output])
 demo.launch(inbrowser=True, share=True)