Spaces:

wadmjada
/

kao-to-bunsho-ai

Runtime error

App Files Files Community

wadmjada commited on Jul 14

Commit

a263833

verified ·

1 Parent(s): 33640cb

Update app.py

Browse files

Files changed (1) hide show

app.py +69 -102

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 # ===================================================================
 #
-#   【最終修正版v2】AIペルソナ選択式 Gradioアプリ (環境自動判定対応)
 #
 # ===================================================================
@@ -26,40 +26,32 @@ warnings.filterwarnings("ignore")
 # --- グローバル変数 ---
 MODELS_CACHE = {}
-CURRENT_MODEL_NAME = None
-FINAL_MODEL = None
 TOKENIZER = None
 CLIP_MODEL = None
 CLIP_PROCESSOR = None
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 # ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
-# ★★★ エラー修正箇所 ★★★
-# ★★★ 実行環境を自動で判定し、モデルへのパスを正しく設定します ★★★
 # ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
 if 'SPACE_ID' in os.environ:
     print("✅ Hugging Face Spaces環境で実行中")
-    # Hugging Face Spacesでは、アップロードされたファイルはルートにあります
-    DRIVE_BASE_PATH = '.'
-    IS_COLAB = False
 else:
     try:
         from google.colab import drive
         print("\n🔗 Googleドライブをマウントします...")
         drive.mount('/content/drive', force_remount=True)
-        DRIVE_BASE_PATH = '/content/drive/MyDrive'
-        IS_COLAB = True
         print("✅ Google Colab環境で実行中")
     except ImportError:
         print("⚠️ ローカル環境として実行します。'./models'フォルダにモデルを配置してください。")
-        # ローカルPCで実行する場合、このコードと同じ階層に'models'フォルダを作成し、
-        # その中に`final_model_`で始まるフォルダ群を配置してください。
-        DRIVE_BASE_PATH = './models'
-        IS_COLAB = False
 print(f"🖥️ 使用デバイス: {DEVICE}")
-print(f"📂 モデルデータの検索パス: {DRIVE_BASE_PATH}")
 # --- モデル定義 ---
 class MultimodalModel(nn.Module):
@@ -98,78 +90,63 @@ class MultimodalModel(nn.Module):
 # --- モデルロード関連の関数 ---
 @torch.no_grad()
-def get_available_models():
-    """利用可能なモデルのリストを取得"""
     try:
-        if not os.path.exists(DRIVE_BASE_PATH):
-            logger.warning(f"モデルディレクトリが存在しません: {DRIVE_BASE_PATH}")
-            return []
-        model_paths = glob.glob(os.path.join(DRIVE_BASE_PATH, "final_model_*"))
-        if not model_paths:
-            logger.warning(f"モデルファイルが見つかりません: {DRIVE_BASE_PATH}に final_model_* がありません。")
-            return []
-        model_names = sorted([os.path.basename(p).replace("final_model_", "").replace("_", " ") for p in model_paths])
-        return model_names
-    except Exception as e:
-        logger.error(f"モデル検索エラー: {e}")
-        return []
-@torch.no_grad()
-def load_model_and_dependencies(person_name):
-    """全ての依存モデルと指定された人物モデルをロード"""
-    global FINAL_MODEL, CURRENT_MODEL_NAME, TOKENIZER, CLIP_MODEL, CLIP_PROCESSOR
-    try:
-        # --- 共通モデル（Tokenizer, CLIP）の初期化 ---
         if TOKENIZER is None:
             logger.info("📝 Tokenizerをロード中...")
             TOKENIZER = AutoTokenizer.from_pretrained("rinna/nekomata-7b-instruction", trust_remote_code=True)
-            if TOKENIZER.pad_token is None:
-                TOKENIZER.pad_token = TOKENIZER.eos_token
             logger.info("✅ Tokenizerのロード完了")
-        if CLIP_MODEL is None or CLIP_PROCESSOR is None:
             logger.info("📷 CLIP画像エンコーダーをロード中...")
             CLIP_MODEL = CLIPModel.from_pretrained("openai/clip-vit-large-patch14").to(DEVICE)
             CLIP_PROCESSOR = CLIPProcessor.from_pretrained("openai/clip-vit-large-patch14")
             logger.info("✅ CLIPモデルのロード完了")
-        # --- ペルソナモデルのロード ---
-        if person_name == CURRENT_MODEL_NAME and FINAL_MODEL is not None:
-            logger.info(f"✅ モデル「{person_name}」は既にロード済みです。")
             return True
-        logger.info(f"🔄 モデル「{person_name}」をロード中...")
         if person_name in MODELS_CACHE:
             FINAL_MODEL = MODELS_CACHE[person_name]
-            CURRENT_MODEL_NAME = person_name
-            logger.info(f"✅ キャッシュからモデル「{person_name}」をロードしました。")
             return True
-        quantization_config = BitsAndBytesConfig(
-            load_in_4bit=True,
-            bnb_4bit_quant_type="nf4",
-            bnb_4bit_compute_dtype=torch.bfloat16,
-            bnb_4bit_use_double_quant=True
-        )
-        base_model = AutoModelForCausalLM.from_pretrained(
-            "rinna/nekomata-7b-instruction",
-            quantization_config=quantization_config,
-            torch_dtype=torch.bfloat16,
-            trust_remote_code=True,
-            device_map="auto"
-        )
-        adapter_path = os.path.join(DRIVE_BASE_PATH, f"final_model_{person_name.replace(' ', '_')}")
         if not os.path.exists(adapter_path):
             logger.error(f"モデルパスが存在しません: {adapter_path}")
             return False
-        peft_model = PeftModel.from_pretrained(base_model, adapter_path)
         face_emb_dim = 768
         model = MultimodalModel(peft_model, face_emb_dim)
@@ -177,7 +154,7 @@ def load_model_and_dependencies(person_name):
         injector_path = os.path.join(adapter_path, "face_injector.pth")
         if os.path.exists(injector_path):
             model.face_injector.load_state_dict(torch.load(injector_path, map_location=DEVICE))
-            logger.info("✅ face_injectorの重みをロードしました。")
         else:
             logger.warning(f"⚠️ face_injectorの重みファイルが見つかりません: {injector_path}")
             return False
@@ -185,12 +162,11 @@ def load_model_and_dependencies(person_name):
         model.eval()
         FINAL_MODEL = model
         MODELS_CACHE[person_name] = model
-        CURRENT_MODEL_NAME = person_name
-        logger.info(f"✅ モデル「{person_name}」のロード完了。")
         return True
     except Exception as e:
-        logger.error(f"モデルロードおよび依存関係の初期化エラー: {e}")
         traceback.print_exc()
         return False
@@ -198,18 +174,14 @@ def load_model_and_dependencies(person_name):
 def predict(person_name, image, instruction, max_len, temp, top_p, progress=gr.Progress()):
     """メイン予測関数"""
     try:
-        progress(0, desc="🔄 AI人格モデルの準備中...")
-        if person_name is None:
-            return "❌ エラー: まず「AI人格」を選択してください。"
-        if image is None:
-            return "❌ エラー: 画像をアップロードしてください。"
-        if not instruction.strip():
-            return "❌ エラー: 指示（プロンプト）を入力してください。"
-        if not load_model_and_dependencies(person_name):
-            return f"❌ エラー: モデル「{person_name}」のロードに失敗しました。"
-        progress(0.3, desc="🖼️ 画像を解析中...")
         pil_image = image.convert("RGB")
         with torch.no_grad():
@@ -240,7 +212,7 @@ def predict(person_name, image, instruction, max_len, temp, top_p, progress=gr.P
         return assistant_response
     except Exception as e:
-        error_msg = f"❌ 予測エラー: {str(e)}"
         logger.error(error_msg)
         traceback.print_exc()
         return error_msg
@@ -254,15 +226,11 @@ def create_gradio_interface():
         if not available_models:
             with gr.Blocks(title="エラー") as demo:
                 gr.Markdown("# ❌ 起動エラー: モデルが見つかりません")
-                gr.Markdown(f"AI人格のモデルデータ（`final_model_`で始まるフォルダ）が見つかりませんでした。\n\n**プログラムが探した場所:** `{os.path.abspath(DRIVE_BASE_PATH)}`\n\nこの場所にモデルデータを正しく配置してください。")
             return demo
-        custom_css = """
-        .gradio-container { max-width: 1200px !important; margin: auto; }
-        .gr-button { background: linear-gradient(45deg, #667eea, #764ba2) !important; border: none !important; color: white !important; font-weight: bold !important; border-radius: 10px !important; padding: 15px 30px !important; }
-        .header-text { text-align: center; padding: 20px; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); color: white; border-radius: 15px; margin-bottom: 20px; }
-        """
         with gr.Blocks(css=custom_css, title="AIペルソナ文章生成") as demo:
             gr.HTML("""
             <div class="header-text">
@@ -289,7 +257,7 @@ def create_gradio_interface():
                     gr.Markdown("### 📝 STEP 2: 生成結果")
                     text_output = gr.Textbox(label="生成された文章", lines=20, interactive=False, placeholder="ここに生成された文章が表示されます...", show_copy_button=True)
-            gr.Markdown("--- \n ### 💡 ヒント\n- **画像**: 顔がはっきり写った写真を使用してください\n- **指示**: 具体的で明確な指示を与えると良い結果が得られます\n- **設定**: 創造性を上げると面白い文章、下げると安定した文章が生成されます")
             submit_btn.click(
                 fn=predict,
@@ -304,15 +272,14 @@ def create_gradio_interface():
         traceback.print_exc()
         return None
-# --- メイン実行 ---
-def main():
-    logger.info("🌟 アプリケーション開始")
-    demo = create_gradio_interface()
-    if demo:
-        logger.info("🌐 Gradioアプリケーションを起動します...")
-        # Hugging Face Spacesではshare=Trueは不要で、自動的に公開されます
-        demo.launch(debug=False)
 if __name__ == "__main__":
-    main()

 # ===================================================================
 #
+#   【最終版v3】AIペルソナ選択式 Gradioアプリ (メモリ効率化・安定版)
 #
 # ===================================================================
 # --- グローバル変数 ---
 MODELS_CACHE = {}
+CURRENT_PERSONA = None
+BASE_MODEL = None  # ベースモデルをグローバルに保持
 TOKENIZER = None
 CLIP_MODEL = None
 CLIP_PROCESSOR = None
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 # ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
+# ★★★ 環境判定とパス設定 ★★★
 # ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
 if 'SPACE_ID' in os.environ:
     print("✅ Hugging Face Spaces環境で実行中")
+    MODEL_BASE_PATH = '.'  # スペースのルートディレクトリ
 else:
     try:
         from google.colab import drive
         print("\n🔗 Googleドライブをマウントします...")
         drive.mount('/content/drive', force_remount=True)
+        MODEL_BASE_PATH = '/content/drive/MyDrive'
         print("✅ Google Colab環境で実行中")
     except ImportError:
         print("⚠️ ローカル環境として実行します。'./models'フォルダにモデルを配置してください。")
+        MODEL_BASE_PATH = './models'
 print(f"🖥️ 使用デバイス: {DEVICE}")
+print(f"📂 モデルデータの検索パス: {MODEL_BASE_PATH}")
 # --- モデル定義 ---
 class MultimodalModel(nn.Module):
 # --- モデルロード関連の関数 ---
 @torch.no_grad()
+def initialize_core_models():
+    """アプリ起動時に一度だけ、重いモデルをロードする"""
+    global BASE_MODEL, TOKENIZER, CLIP_MODEL, CLIP_PROCESSOR
     try:
+        if BASE_MODEL is None:
+            logger.info("🔄 [初回起動] ベースLLMをロード中... (時間がかかります)")
+            quantization_config = BitsAndBytesConfig(
+                load_in_4bit=True, bnb_4bit_quant_type="nf4",
+                bnb_4bit_compute_dtype=torch.bfloat16, bnb_4bit_use_double_quant=True
+            )
+            BASE_MODEL = AutoModelForCausalLM.from_pretrained(
+                "rinna/nekomata-7b-instruction",
+                quantization_config=quantization_config, torch_dtype=torch.bfloat16,
+                trust_remote_code=True, device_map="auto"
+            )
+            logger.info("✅ ベースLLMのロード完了")
         if TOKENIZER is None:
             logger.info("📝 Tokenizerをロード中...")
             TOKENIZER = AutoTokenizer.from_pretrained("rinna/nekomata-7b-instruction", trust_remote_code=True)
+            TOKENIZER.pad_token = TOKENIZER.eos_token
             logger.info("✅ Tokenizerのロード完了")
+        if CLIP_MODEL is None:
             logger.info("📷 CLIP画像エンコーダーをロード中...")
             CLIP_MODEL = CLIPModel.from_pretrained("openai/clip-vit-large-patch14").to(DEVICE)
             CLIP_PROCESSOR = CLIPProcessor.from_pretrained("openai/clip-vit-large-patch14")
             logger.info("✅ CLIPモデルのロード完了")
+        return True
+    except Exception as e:
+        logger.error(f"コアモデルの初期化エラー: {e}")
+        traceback.print_exc()
+        return False
+@torch.no_grad()
+def load_persona_model(person_name, progress=gr.Progress()):
+    """指定されたAI人格（アダプター）をロードする"""
+    global FINAL_MODEL, CURRENT_PERSONA
+    try:
+        progress(0.1, desc=f"🔄 AI人格「{person_name}」を準備中...")
+        if person_name == CURRENT_PERSONA and FINAL_MODEL is not None:
+            logger.info(f"✅ AI人格「{person_name}」は既に準備完了です。")
             return True
         if person_name in MODELS_CACHE:
             FINAL_MODEL = MODELS_CACHE[person_name]
+            CURRENT_PERSONA = person_name
+            logger.info(f"✅ キャッシュからAI人格「{person_name}」をロードしました。")
             return True
+        adapter_path = os.path.join(MODEL_BASE_PATH, f"final_model_{person_name.replace(' ', '_')}")
         if not os.path.exists(adapter_path):
             logger.error(f"モデルパスが存在しません: {adapter_path}")
             return False
+        logger.info(f"🧠 アダプターをロード中: {adapter_path}")
+        peft_model = PeftModel.from_pretrained(BASE_MODEL, adapter_path)
         face_emb_dim = 768
         model = MultimodalModel(peft_model, face_emb_dim)
         injector_path = os.path.join(adapter_path, "face_injector.pth")
         if os.path.exists(injector_path):
             model.face_injector.load_state_dict(torch.load(injector_path, map_location=DEVICE))
+            logger.info("✅ 顔特徴インジェクターの重みをロードしました。")
         else:
             logger.warning(f"⚠️ face_injectorの重みファイルが見つかりません: {injector_path}")
             return False
         model.eval()
         FINAL_MODEL = model
         MODELS_CACHE[person_name] = model
+        CURRENT_PERSONA = person_name
+        logger.info(f"✅ AI人格「{person_name}」の準備完了。")
         return True
     except Exception as e:
+        logger.error(f"AI人格のロードエラー: {e}")
         traceback.print_exc()
         return False
 def predict(person_name, image, instruction, max_len, temp, top_p, progress=gr.Progress()):
     """メイン予測関数"""
     try:
+        if person_name is None: return "❌ エラー: まず「AI人格」を選択してください。"
+        if image is None: return "❌ エラー: 画像をアップロードしてください。"
+        if not instruction.strip(): return "❌ エラー: 指示（プロンプト）を入力してください。"
+        if not load_persona_model(person_name, progress):
+            return f"❌ エラー: AI人格「{person_name}」のロードに失敗しました。"
+        progress(0.4, desc="🖼️ 顔の雰囲気を分析中...")
         pil_image = image.convert("RGB")
         with torch.no_grad():
         return assistant_response
     except Exception as e:
+        error_msg = f"❌ 予測中にエラーが発生しました: {str(e)}"
         logger.error(error_msg)
         traceback.print_exc()
         return error_msg
         if not available_models:
             with gr.Blocks(title="エラー") as demo:
                 gr.Markdown("# ❌ 起動エラー: モデルが見つかりません")
+                gr.Markdown(f"AI人格のモデルデータ（`final_model_`で始まるフォルダ）が見つかりませんでした。\n\n**プログラムが探した場所:** `{os.path.abspath(MODEL_BASE_PATH)}`\n\nこの場所にモデルデータを正しく配置してください。")
             return demo
+        custom_css = "..." # (CSSは省略)
         with gr.Blocks(css=custom_css, title="AIペルソナ文章生成") as demo:
             gr.HTML("""
             <div class="header-text">
                     gr.Markdown("### 📝 STEP 2: 生成結果")
                     text_output = gr.Textbox(label="生成された文章", lines=20, interactive=False, placeholder="ここに生成された文章が表示されます...", show_copy_button=True)
+            demo.load(lambda: "✅ アプリ準備完了！AI人格を選択して開始してください。", [], text_output)
             submit_btn.click(
                 fn=predict,
         traceback.print_exc()
         return None
+# --- メイン実行ブロック ---
 if __name__ == "__main__":
+    logger.info("🌟 アプリケーション起動プロセス開始")
+    if initialize_core_models():
+        demo = create_gradio_interface()
+        if demo:
+            logger.info("🌐 Gradioアプリケーションを起動します...")
+            demo.launch(debug=False) # share=TrueはHugging Face Spacesでは不要
+    else:
+        logger.error("❌ コアモデルの初期化に失敗したため、アプリを起動できません。")