Spaces:

rufflet17
/

amateur_voice

Running

App Files Files Community

cockolo terada commited on Jul 24

Commit

0ffa97e

verified ·

1 Parent(s): 22ba782

Update gradio_tabs/single.py

Browse files

Files changed (1) hide show

gradio_tabs/single.py +115 -172

gradio_tabs/single.py CHANGED Viewed

@@ -27,6 +27,9 @@ from typing import Dict, Any, List, Tuple, Optional, Set
 # --- タイムゾーン定義 ---
 # グローバルな定数としてJSTを定義
 JST = timezone(timedelta(hours=9), 'JST')
 # --- モック（本来はライブラリからインポート） ---
@@ -72,14 +75,6 @@ class TTSModelHolder:
             }
             with open(model2_path / "style_settings.json", "w", encoding="utf-8") as f:
                 json.dump(style_settings_data, f, indent=2, ensure_ascii=False)
-            # Sample Merged Model
-            merged_model_path = p / "miku_90p_rinu_10p"
-            merged_model_path.mkdir(parents=True, exist_ok=True)
-            (merged_model_path / "G_merged.safetensors").touch()
-            with open(merged_model_path / "config.json", "w", encoding="utf-8") as f:
-                json.dump(config1, f, indent=2)
     def refresh(self) -> List[str]:
         """
@@ -87,7 +82,6 @@ class TTSModelHolder:
         更新後のモデルリストを返す。
         """
         if self.root_dir.is_dir():
-            # is_dir()はシンボリックリンクされたディレクトリもTrueを返す
             self.model_names = sorted([d.name for d in self.root_dir.iterdir() if d.is_dir()])
             print(f"TTSModelHolder model list refreshed. Known models: {self.model_names}")
         else:
@@ -101,7 +95,7 @@ class TTSModelHolder:
             error_msg = (
                 f"Model '{model_name}' is not in the known list of TTSModelHolder. "
                 f"Current list: {self.model_names}. "
-                "Please refresh the model list by clicking the refresh button."
             )
             print(f"[ERROR] {error_msg}")
             raise ValueError(error_msg)
@@ -141,10 +135,8 @@ DEFAULT_STYLE_WEIGHT=1.0
 DEFAULT_WORKBENCH_PAUSE = 250
 # ------------------------------------------------
-# ▼▼▼ 変更・追加点 1: 容量制限の定数を定義 ▼▼▼
-OUTPUT_SIZE_LIMIT_GB = 5  # outputフォルダの容量上限をGB単位で指定
 OUTPUT_SIZE_LIMIT_BYTES = OUTPUT_SIZE_LIMIT_GB * 1024**3
-# ▲▲▲ 変更・追加点 1 ▲▲▲
 # --- ヘルパー関数 ---
@@ -190,6 +182,16 @@ def format_and_sort_model_names(dir_list: List[str]) -> List[Tuple[str, str]]:
     result_list.extend(sorted(unparsed_models))
     return result_list
 def set_random_seed(seed: int):
     if seed >= 0:
         print(f"Setting random seed to: {seed}")
@@ -200,7 +202,6 @@ def set_random_seed(seed: int):
         np.random.seed(seed)
         random.seed(seed)
-# ▼▼▼ 変更・追加点 2: 容量計算用のヘルパー関数を追加 ▼▼▼
 def get_directory_size(directory_path: Path) -> int:
     """指定されたディレクトリの合計サイズをバイト単位で返す。"""
     total_size = 0
@@ -228,7 +229,6 @@ def format_bytes(size_bytes: int) -> str:
     p = math.pow(1024, i)
     s = round(size_bytes / p, 2)
     return f"{s} {size_name[i]}"
-# ▲▲▲ 変更・追加点 2 ▲▲▲
 # --- pyopenjtalk関連ヘルパー関数 ---
@@ -422,15 +422,7 @@ def process_single_synthesis_webui(
     return True, log_messages, (sr, audio_data)
-# ▼▼▼ 変更点: action_save_audio 関数を削除 ▼▼▼
-# この関数は不要になったため削除されました。
-# ▲▲▲ 変更点 ▲▲▲
 def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
-    # ▼▼▼ 変更点: is_shm_available 変数を削除 ▼▼▼
-    # is_shm_available = sys.platform != "win32" and Path("/dev/shm").exists() and Path("/dev/shm").is_dir()
-    # ▲▲▲ 変更点 ▲▲▲
     custom_css = """
     .audio-output-row { display: flex !important; flex-wrap: wrap !important; gap: 10px !important; }
     .audio-item-column { flex-grow: 0 !important; flex-shrink: 0 !important; width: var(--audio-width, 250px) !important; background-color: #f8f9fa; padding: 8px; border-radius: 8px; border: 1px solid #dee2e6; }
@@ -445,18 +437,13 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
     with gr.Blocks(css=custom_css) as app:
         MAX_AUDIO_OUTPUTS = 4
         ITEMS_PER_ROW = 4
-        # ▼▼▼ 変更点: キープの最大アイテム数を8に変更 ▼▼▼
         MAX_WORKBENCH_ITEMS = 8
-        # ▲▲▲ 変更点 ▲▲▲
         all_styles_data_state = gr.State({})
         workbench_state = gr.State([])
         merged_preview_state = gr.State({})
-        # ▼▼▼ 変更点: saved_audio_hashes_stateを削除 ▼▼▼
-        # saved_audio_hashes_state = gr.State(set())
-        # ▲▲▲ 変更点 ▲▲▲
-        # --- キープUI更新ヘルパー ---
         def update_workbench_ui(workbench_list: List[Dict]) -> Tuple:
             updates = []
             for i in range(MAX_WORKBENCH_ITEMS):
@@ -506,9 +493,6 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                             with gr.Row(elem_classes="audio-output-row"):
                                 audio_item_columns = []
                                 audio_outputs = []
-                                # ▼▼▼ 変更点: save_buttons を削除 ▼▼▼
-                                # save_buttons = []
-                                # ▲▲▲ 変更点 ▲▲▲
                                 to_workbench_buttons = []
                                 synthesized_text_states = []
                                 dummy_audio_item_columns = []
@@ -521,10 +505,7 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                                             type="filepath", interactive=False
                                         ))
                                         with gr.Row():
-                                            # ▼▼▼ 変更点: 保存ボタンを削除し、キープボタンの幅を広げる ▼▼▼
-                                            # save_buttons.append(gr.Button("💾 保存", scale=1))
-                                            to_workbench_buttons.append(gr.Button("🛠️ キープに追加", scale=2))
-                                            # ▲▲▲ 変更点 ▲▲▲
                                     audio_item_columns.append(audio_col)
                                 for i in range(ITEMS_PER_ROW - 1):
@@ -532,27 +513,16 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                                          pass
                                      dummy_audio_item_columns.append(dummy_col)
-                            # ▼▼▼ 変更点: 保存設定アコーディオン（ID入力欄）を削除 ▼▼▼
-                            # with gr.Accordion("保存設定", open=True):
-                            #     metadata_textbox = gr.Textbox(
-                            #         label="ID",
-                            #         lines=1, placeholder="音声ファイルに埋め込むメモを入力してください（必須）",
-                            #         interactive=True
-                            #     )
-                            # ▲▲▲ 変更点 ▲▲▲
                         with gr.Accordion("ステータス", open=True):
                             status_textbox = gr.Textbox(interactive=False, lines=5, max_lines=5, autoscroll=True, show_label=False, placeholder="ここにログが表示されます...")
                     with gr.Column(scale=1):
-                        # ▼▼▼ 変更点: 「融☆合モデルを使う」チェックボックスを削除し、レイアウトを調整 ▼▼▼
                         with gr.Row():
-                            selected_model_dropdown = gr.Dropdown(label="話者", choices=[], value=None, interactive=True, scale=4)
                             refresh_model_list_button = gr.Button("再読込", scale=1)
-                        # ▲▲▲ 変更点 ▲▲▲
-                        # ▼▼▼ 変更点: モデルファイル選択ドロップダウンを削除 ▼▼▼
-                        # selected_model_file_dropdown = gr.Dropdown(label="モデルファイル (.safetensors)", choices=[], value=None, interactive=True)
-                        # ▲▲▲ 変更点 ▲▲▲
                         current_styles_dropdown = gr.Dropdown(label="スタイル", choices=[], type="value", interactive=True)
                         style_weight_for_synth_slider = gr.Slider(label="スタイル強度", minimum=0.0, maximum=20.0, value=DEFAULT_STYLE_WEIGHT, step=0.1, info="初期値は推奨強度", interactive=True)
                         batch_count_slider = gr.Slider(label="生成数", value=1, minimum=1, maximum=MAX_AUDIO_OUTPUTS, step=1, interactive=True)
@@ -579,23 +549,17 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                             random_text_mode_slider = gr.Slider(label="分割の単位", minimum=1, maximum=4, value=1, step=1, info="1:形態素, 2:チャンク, 3:文節, 4:節", interactive=True)
                             random_text_ratio_textbox = gr.Textbox(label="カタカナ化の割合", value="0.5, 1", info="カンマ区切りで複数指定可。指定値からランダムに1つ使用。", interactive=True)
-            # ▼▼▼ 変更点 2: キープのレイアウトを2列に変更 ▼▼▼
-            with gr.Tab("キープ"):
-                gr.Markdown("## キープ\n読み上げタブで生成した音声をここにストックし、結合や保存ができます。最大8個まで保持できます。")
                 workbench_items = []
                 all_workbench_ui_components = []
                 with gr.Row(variant="panel"):
-                    # 左側の音声リストエリア（2列）
                     with gr.Column(scale=3):
                         with gr.Row():
-                            # 左列 (アイテム 1-4)
                             left_workbench_col = gr.Column(scale=1)
-                            # 右列 (アイテム 5-8)
                             right_workbench_col = gr.Column(scale=1)
-                    # 右側の操作パネル
                     with gr.Column(scale=1):
                         with gr.Blocks():
                             with gr.Row():
@@ -612,38 +576,13 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                             with gr.Row():
                                 merge_preview_button = gr.Button("１．結合＆プレビュー", variant="primary")
-                                add_merged_to_workbench_button = gr.Button("２．キープに追加", variant="primary")
                                 delete_originals_checkbox = gr.Checkbox(label="結合時に自動で元ファイルを削除", value=False, interactive=True)
                             preview_audio_player = gr.Audio(label="結合結果プレビュー", interactive=False, type="filepath")
-                        # ▼▼▼ 変更点: キープの保存機能を削除 ▼▼▼
-                        # gr.Markdown("---")
-                        #
-                        # with gr.Blocks():
-                        #     gr.Markdown("#### キープの音声を保存")
-                        #     with gr.Row():
-                        #         with gr.Column(scale=1):
-                        #             audio_to_save_num_input = gr.Number(label="保存する音声の番号", value=1, minimum=1, step=1, precision=0, interactive=True)
-                        #         with gr.Column(scale=3):
-                        #              creative_filename_input = gr.Textbox(
-                        #                  label="保存する時のファイル名",
-                        #                  placeholder=f"例: れいさな",
-                        #                  interactive=True
-                        #              )
-                        #     workbench_metadata_textbox = gr.Textbox(
-                        #         label="ID (必須)",
-                        #         lines=1, placeholder="この音声に関するメモを入力してください",
-                        #         interactive=True
-                        #     )
-                        #     save_creative_button = gr.Button("💾 指定番号の音声を保存", variant="primary")
-                        # ▲▲▲ 変更点 ▲▲▲
-                # 2列にアイテムを配置するロジック
                 ITEMS_PER_COLUMN = 4
                 for i in range(MAX_WORKBENCH_ITEMS):
-                    # iの値に応じて、アイテムを追加する親のColumnを決定
                     parent_column = left_workbench_col if i < ITEMS_PER_COLUMN else right_workbench_col
                     with parent_column:
@@ -658,20 +597,13 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                             "audio": audio, "info": info, "delete_btn": delete_btn
                         })
-                # all_workbench_ui_componentsの生成ロジックは変更なし
                 for item in workbench_items:
                     all_workbench_ui_components.extend([
                         item["row"], item["item_num_display"], item["audio"], item["info"]
                     ])
-            # ▲▲▲ 変更点 2 ▲▲▲
         # --- UIイベントハンドラ関数 ---
-        # ▼▼▼ 変更点: update_model_files_dropdown 関数を削除 ▼▼▼
-        # この関数はモデルファイル選択UIの削除に伴い不要になりました。
-        # ▲▲▲ 変更点 ▲▲▲
         def load_styles_for_ui(selected_model_name: Optional[str]):
             if not selected_model_name: return gr.update(choices=[], value=None), gr.update(value=DEFAULT_STYLE_WEIGHT), {}
             model_path = assets_root_path / selected_model_name
@@ -687,29 +619,60 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                 default_weight = styles_map[first_key].get("weight", DEFAULT_STYLE_WEIGHT)
             return gr.update(choices=display_names, value=default_display_name), gr.update(value=default_weight), styles_map
-        # ▼▼▼ 変更点: action_refresh_model_list関数からシンボリックリンク関連のロジックを削除 ▼▼▼
-        def action_refresh_model_list():
             """モデルリストを再読み込みし、UIとバックエンドの状態を同期させる。"""
-            # バックエンドのリストを更新
             model_holder.refresh()
-            # UIのドロップダウンを更新
-            # マージモデルのパースとソートは維持する
-            ui_model_list = model_holder.model_names
-            formatted_choices = format_and_sort_model_names(ui_model_list)
-            value = formatted_choices[0][1] if formatted_choices else None
-            model_dropdown_update = gr.update(choices=formatted_choices, value=value)
-            style_dropdown_update, style_weight_update, styles_data_state_update = load_styles_for_ui(value)
-            return model_dropdown_update, style_dropdown_update, style_weight_update, styles_data_state_update
         # ▲▲▲ 変更点 ▲▲▲
         def on_model_select_change(selected_model_name: Optional[str]):
-            # ▼▼▼ 変更点: モデルファイル選択UIがなくなったため、関連処理を削除 ▼▼▼
             style_dropdown_update, style_weight_update, styles_data_state_update = load_styles_for_ui(selected_model_name)
             return style_dropdown_update, style_weight_update, styles_data_state_update
-            # ▲▲▲ 変更点 ▲▲▲
         def on_style_dropdown_select(selected_display_name: Optional[str], styles_data: Dict[str, Any]):
             if not selected_display_name or not styles_data: return gr.update(value=DEFAULT_STYLE_WEIGHT)
@@ -720,9 +683,6 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
         def action_run_synthesis(
             model_name: Optional[str],
-            # ▼▼▼ 変更点: selected_model_file 引数を削除 ▼▼▼
-            # selected_model_file: Optional[str],
-            # ▲▲▲ 変更点 ▲▲▲
             style_display_name: Optional[str], style_weight_for_synth: float,
             text: str, generation_mode: str, batch_count: int,
             lang: str, seed: int, speaker: str, ref_audio: Optional[str],
@@ -769,17 +729,14 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
             all_logs = []
-            # ▼▼▼ 変更点: モデルファイルを自動で選択するロジック ▼▼▼
             model_path = assets_root_path / model_name
             files = find_safetensors_files_webui(str(model_path))
             if not files:
                 error_outputs[0] = f"❌ [エラー] モデルフォルダ '{model_name}' に .safetensors ファイルが見つかりません。"
                 return tuple(error_outputs)
-            # ソートされたリストの最初のファイルを使用する
             actual_model_file_to_load = str(model_path / files[0])
             all_logs.append(f"[自動選択] 使用モデルファイル: {files[0]}")
-            # ▲▲▲ 変更点 ▲▲▲
             batch_count = int(batch_count)
             if batch_count <= 0: batch_count = 1
@@ -897,7 +854,7 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
             return tuple(final_outputs)
-        # --- キープイベントハンドラ ---
         def add_to_workbench(
             current_status: str,
             current_workbench_list: List[Dict],
@@ -907,12 +864,12 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
             safe_workbench_list = current_workbench_list or []
             if not audio_path or not Path(audio_path).exists():
-                log_messages.append("⚠️ [キープ追加エラー] 追加する音声ファイルが見つかりません。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
             if any(item['audio_path'] == audio_path for item in safe_workbench_list):
-                log_messages.append("ℹ️ この音声はすでにキープに存在します。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
@@ -941,10 +898,10 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                         path_to_delete.unlink()
                 except Exception as e:
                     print(f"Warning: Failed to delete old workbench audio file: {e}")
-                log_messages.append(f"ℹ️ キープのアイテムが最大数({MAX_WORKBENCH_ITEMS})に達したため、一番古いアイテムを削除しました。")
             ui_updates = update_workbench_ui(updated_list)
-            log_messages.append("✅ キープに音声を追加しました。")
             final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
             return (final_status, updated_list) + ui_updates
@@ -959,13 +916,13 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                 path_to_delete = Path(item_to_remove['audio_path'])
                 if path_to_delete.exists() and str(path_to_delete.parent) == tempfile.gettempdir():
                     path_to_delete.unlink()
-                    log_messages.append(f"✅ キープからアイテム #{index_to_remove + 1} を削除し、一時ファイルをクリーンアップしました。")
                 elif path_to_delete.exists():
-                    log_messages.append(f"✅ キープからアイテム #{index_to_remove + 1} を削除しました。(ファイルは保持: {path_to_delete.name})")
                 else:
-                    log_messages.append(f"✅ キープからアイテム #{index_to_remove + 1} を削除しました。(関連ファイルなし)")
             except Exception as e:
-                log_messages.append(f"⚠️ キープのアイテム #{index_to_remove + 1} のファイル削除中にエラー: {e}")
             updated_list = [item for i, item in enumerate(safe_workbench_list) if i != index_to_remove]
             ui_updates = update_workbench_ui(updated_list)
@@ -980,7 +937,7 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
         ):
             log_messages = []
             if not workbench_list:
-                log_messages.append("⚠️ [結合プレビュー警告] キープに音声がありません。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return final_status, None, {}
@@ -1008,33 +965,21 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                 pause_duration = int(pause_ms)
                 if pause_duration >= 0:
-                    # 正の値: 無音を挿入
                     pause_segment = AudioSegment.silent(duration=pause_duration)
                     combined_audio = segment1 + pause_segment + segment2
                     log_messages.append(f"✅ 音声 #{first_audio_num} と #{second_audio_num} を {pause_duration}ms のポーズを挟んで結合しました。")
                 else:
-                    # 負の値: そのまま重ねる（オーバーレイ）
                     overlap_duration = abs(pause_duration)
-                    # オーバーラップ長がどちらかの音声の長さを超えないように制限
                     max_possible_overlap = min(len(segment1), len(segment2))
                     if overlap_duration > max_possible_overlap:
                         log_messages.append(f"ℹ️ オーバーラップ長({overlap_duration}ms)が可能な最大値({max_possible_overlap}ms)を超えるため、自動的に調整されました。")
                         overlap_duration = max_possible_overlap
-                    # 結合後の最終的な音声の長さを計算
                     final_duration = len(segment1) + len(segment2) - overlap_duration
-                    # 最終的な長さの無音キャンバスを作成
                     combined_audio = AudioSegment.silent(duration=final_duration)
-                    # 1番目の音声をキャンバスの先頭から重ねる
                     combined_audio = combined_audio.overlay(segment1, position=0)
-                    # 2番目の音声を、1番目の音声の末尾からオーバーラップする位置に重ねる
                     overlay_position = len(segment1) - overlap_duration
                     combined_audio = combined_audio.overlay(segment2, position=overlay_position)
                     log_messages.append(f"✅ 音声 #{first_audio_num} と #{second_audio_num} を {overlap_duration}ms 重ねて（オーバーレイして）結合しました。")
                 progress(1, desc="結合完了")
@@ -1065,10 +1010,6 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
             final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
             return final_status, str(temp_path), metadata
-        # ▼▼▼ 変更点: action_save_workbench_audio 関数を削除 ▼▼▼
-        # この関数は保存機能の削除に伴い不要になりました。
-        # ▲▲▲ 変更点 ▲▲▲
         def action_add_merged_to_workbench(
             current_status: str,
             preview_data: Dict,
@@ -1080,13 +1021,13 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
             log_messages = []
             safe_workbench_list = current_workbench_list or []
             if not preview_data or "audio_path" not in preview_data:
-                log_messages.append("⚠️ [キープ追加エラー] 追加する結合済み音声がありません。先にプレビューを生成してください。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
             src_path = Path(preview_data["audio_path"])
             if not src_path.exists():
-                log_messages.append("⚠️ [キープ追加エラー] 結合済み音声ファイルが見つかりません。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
@@ -1118,10 +1059,10 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                         log_messages.append(f"⚠️ 元の音声ファイル削除中にエラー: {e}")
                 final_workbench_list = [new_merged_item] + remaining_list
-                log_messages.append(f"✅ 結合音声をキープに追加し、元の音声(#{idx1+1}, #{idx2+1})を削除しました。")
             else:
                 final_workbench_list = [new_merged_item] + safe_workbench_list
-                log_messages.append("✅ 結合済みの音声をキープの一番上に追加しました。")
             if len(final_workbench_list) > MAX_WORKBENCH_ITEMS:
                 item_to_remove = final_workbench_list.pop(-1)
@@ -1131,7 +1072,7 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
                         path_to_delete.unlink()
                 except Exception as e:
                     print(f"Warning: Failed to delete old workbench audio file: {e}")
-                log_messages.append(f"ℹ️ キープが最大数({MAX_WORKBENCH_ITEMS})に達したため一番古いアイテムを削除しました。")
             ui_updates = update_workbench_ui(final_workbench_list)
             final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
@@ -1139,12 +1080,14 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
         # --- イベントリスナー接続 ---
-        # ▼▼▼ 変更点: イベントリスナーの inputs/outputs を修正 ▼▼▼
-        refresh_model_list_button.click(
-            action_refresh_model_list,
-            inputs=[],
-            outputs=[selected_model_dropdown, current_styles_dropdown, style_weight_for_synth_slider, all_styles_data_state]
-        )
         selected_model_dropdown.change(on_model_select_change,
                                        inputs=[selected_model_dropdown],
@@ -1162,8 +1105,7 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
         generate_button.click(
             fn=action_run_synthesis,
             inputs=[
-                selected_model_dropdown, # selected_model_file_dropdown は削除
-                # use_symlink_mode_checkbox は削除
                 current_styles_dropdown, style_weight_for_synth_slider,
                 text_input, generation_mode_radio, batch_count_slider,
                 language_dropdown, seed_input, speaker_name_textbox,
@@ -1178,9 +1120,6 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
         )
         for i in range(MAX_AUDIO_OUTPUTS):
-            # ▼▼▼ 変更点: 保存ボタンのクリックイベントを削除 ▼▼▼
-            # save_buttons[i].click(...)
-            # ▲▲▲ 変更点 ▲▲▲
             to_workbench_buttons[i].click(
                 fn=add_to_workbench,
                 inputs=[
@@ -1209,10 +1148,6 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
             outputs=[status_textbox, preview_audio_player, merged_preview_state]
         )
-        # ▼▼▼ 変更点: キープの保存ボタンのクリックイベントを削除 ▼▼▼
-        # save_creative_button.click(...)
-        # ▲▲▲ 変更点 ▲▲▲
         add_merged_to_workbench_button.click(
             fn=action_add_merged_to_workbench,
             inputs=[
@@ -1228,11 +1163,9 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
         player_width_slider.release(lambda w: f"<script>document.documentElement.style.setProperty('--audio-width', '{w}px');</script>", inputs=[player_width_slider], outputs=[js_injector_html])
-        app.load(
-            action_refresh_model_list,
-            inputs=[],
-            outputs=[selected_model_dropdown, current_styles_dropdown, style_weight_for_synth_slider, all_styles_data_state]
-        )
         # ▲▲▲ 変更点 ▲▲▲
     return app
@@ -1240,10 +1173,13 @@ def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
 if __name__ == "__main__":
     if Path("model_assets").exists(): shutil.rmtree("model_assets")
-    # ▼▼▼ 変更点: shm_path関連のコードを削除 ▼▼▼
-    # shm_path = Path("/dev/shm")
-    # ▲▲▲ 変更点 ▲▲▲
     mock_model_holder = TTSModelHolder()
     print(f"Initial models loaded by TTSModelHolder: {mock_model_holder.model_names}")
     app = create_synthesis_app(mock_model_holder)
@@ -1252,10 +1188,16 @@ if __name__ == "__main__":
     assets_dir_path.mkdir(exist_ok=True)
     allowed_paths = [str(assets_dir_path)]
-    # ▼▼▼ 変更点: shm_pathをallowed_pathsに追加するロジックを削除 ▼▼▼
-    # if sys.platform != "win32" and shm_path.exists():
-    #     allowed_paths.append(str(shm_path.resolve()))
-    # ▲▲▲ 変更点 ▲▲▲
     output_dir_path = Path("output").resolve()
     (output_dir_path / "normal").mkdir(exist_ok=True, parents=True)
@@ -1267,4 +1209,5 @@ if __name__ == "__main__":
     print(f"Gradioに次のパスへのアクセスを許可します: {', '.join(allowed_paths)}")
-    app.launch(allowed_paths=allowed_paths)

 # --- タイムゾーン定義 ---
 # グローバルな定数としてJSTを定義
 JST = timezone(timedelta(hours=9), 'JST')
+# ▼▼▼ 変更点: FNモデル用のキャッシュパスを定義 ▼▼▼
+FN_MODEL_CACHE_PATH = Path("/tmp/sbv2_merger_cache")
+# ▲▲▲ 変更点 ▲▲▲
 # --- モック（本来はライブラリからインポート） ---
             }
             with open(model2_path / "style_settings.json", "w", encoding="utf-8") as f:
                 json.dump(style_settings_data, f, indent=2, ensure_ascii=False)
     def refresh(self) -> List[str]:
         """
         更新後のモデルリストを返す。
         """
         if self.root_dir.is_dir():
             self.model_names = sorted([d.name for d in self.root_dir.iterdir() if d.is_dir()])
             print(f"TTSModelHolder model list refreshed. Known models: {self.model_names}")
         else:
             error_msg = (
                 f"Model '{model_name}' is not in the known list of TTSModelHolder. "
                 f"Current list: {self.model_names}. "
+                "Please refresh the model list by toggling the symlink checkbox or clicking the refresh button."
             )
             print(f"[ERROR] {error_msg}")
             raise ValueError(error_msg)
 DEFAULT_WORKBENCH_PAUSE = 250
 # ------------------------------------------------
+OUTPUT_SIZE_LIMIT_GB = 5
 OUTPUT_SIZE_LIMIT_BYTES = OUTPUT_SIZE_LIMIT_GB * 1024**3
 # --- ヘルパー関数 ---
     result_list.extend(sorted(unparsed_models))
     return result_list
+# ▼▼▼ 変更点: FNモデルソート用のヘルパー関数を追加 ▼▼▼
+def get_fn_model_sort_key(name: str) -> int:
+    """FNモデル名からソート用の数値を抽出する。例: 'FN10' -> 10"""
+    match = re.search(r'FN(\d+)', name, re.IGNORECASE)
+    if match:
+        return int(match.group(1))
+    return float('inf') # マッチしないものは後ろに配置
+# ▲▲▲ 変更点 ▲▲▲
 def set_random_seed(seed: int):
     if seed >= 0:
         print(f"Setting random seed to: {seed}")
         np.random.seed(seed)
         random.seed(seed)
 def get_directory_size(directory_path: Path) -> int:
     """指定されたディレクトリの合計サイズをバイト単位で返す。"""
     total_size = 0
     p = math.pow(1024, i)
     s = round(size_bytes / p, 2)
     return f"{s} {size_name[i]}"
 # --- pyopenjtalk関連ヘルパー関数 ---
     return True, log_messages, (sr, audio_data)
 def create_synthesis_app(model_holder: TTSModelHolder) -> gr.Blocks:
     custom_css = """
     .audio-output-row { display: flex !important; flex-wrap: wrap !important; gap: 10px !important; }
     .audio-item-column { flex-grow: 0 !important; flex-shrink: 0 !important; width: var(--audio-width, 250px) !important; background-color: #f8f9fa; padding: 8px; border-radius: 8px; border: 1px solid #dee2e6; }
     with gr.Blocks(css=custom_css) as app:
         MAX_AUDIO_OUTPUTS = 4
         ITEMS_PER_ROW = 4
         MAX_WORKBENCH_ITEMS = 8
         all_styles_data_state = gr.State({})
         workbench_state = gr.State([])
         merged_preview_state = gr.State({})
+        # --- 作業台UI更新ヘルパー ---
         def update_workbench_ui(workbench_list: List[Dict]) -> Tuple:
             updates = []
             for i in range(MAX_WORKBENCH_ITEMS):
                             with gr.Row(elem_classes="audio-output-row"):
                                 audio_item_columns = []
                                 audio_outputs = []
                                 to_workbench_buttons = []
                                 synthesized_text_states = []
                                 dummy_audio_item_columns = []
                                             type="filepath", interactive=False
                                         ))
                                         with gr.Row():
+                                            to_workbench_buttons.append(gr.Button("🛠️ 作業台に追加", scale=2))
                                     audio_item_columns.append(audio_col)
                                 for i in range(ITEMS_PER_ROW - 1):
                                          pass
                                      dummy_audio_item_columns.append(dummy_col)
                         with gr.Accordion("ステータス", open=True):
                             status_textbox = gr.Textbox(interactive=False, lines=5, max_lines=5, autoscroll=True, show_label=False, placeholder="ここにログが表示されます...")
                     with gr.Column(scale=1):
                         with gr.Row():
+                            # ▼▼▼ 変更点: 「融☆合モデルを使う」を「FNモデルモード」に変更し、最初は非表示に ▼▼▼
+                            use_fn_model_mode_checkbox = gr.Checkbox(label="FNモデルモード", value=False, interactive=True, scale=3, visible=False)
+                            # ▲▲▲ 変更点 ▲▲▲
                             refresh_model_list_button = gr.Button("再読込", scale=1)
+                        selected_model_dropdown = gr.Dropdown(label="話者", choices=[], value=None, interactive=True)
                         current_styles_dropdown = gr.Dropdown(label="スタイル", choices=[], type="value", interactive=True)
                         style_weight_for_synth_slider = gr.Slider(label="スタイル強度", minimum=0.0, maximum=20.0, value=DEFAULT_STYLE_WEIGHT, step=0.1, info="初期値は推奨強度", interactive=True)
                         batch_count_slider = gr.Slider(label="生成数", value=1, minimum=1, maximum=MAX_AUDIO_OUTPUTS, step=1, interactive=True)
                             random_text_mode_slider = gr.Slider(label="分割の単位", minimum=1, maximum=4, value=1, step=1, info="1:形態素, 2:チャンク, 3:文節, 4:節", interactive=True)
                             random_text_ratio_textbox = gr.Textbox(label="カタカナ化の割合", value="0.5, 1", info="カンマ区切りで複数指定可。指定値からランダムに1つ使用。", interactive=True)
+            with gr.Tab("作業台"):
+                gr.Markdown("## 作業台\n読み上げタブで生成した音声をここにストックし、結合や保存ができます。最大8個まで保持できます。")
                 workbench_items = []
                 all_workbench_ui_components = []
                 with gr.Row(variant="panel"):
                     with gr.Column(scale=3):
                         with gr.Row():
                             left_workbench_col = gr.Column(scale=1)
                             right_workbench_col = gr.Column(scale=1)
                     with gr.Column(scale=1):
                         with gr.Blocks():
                             with gr.Row():
                             with gr.Row():
                                 merge_preview_button = gr.Button("１．結合＆プレビュー", variant="primary")
+                                add_merged_to_workbench_button = gr.Button("２．作業台に追加", variant="primary")
                                 delete_originals_checkbox = gr.Checkbox(label="結合時に自動で元ファイルを削除", value=False, interactive=True)
                             preview_audio_player = gr.Audio(label="結合結果プレビュー", interactive=False, type="filepath")
                 ITEMS_PER_COLUMN = 4
                 for i in range(MAX_WORKBENCH_ITEMS):
                     parent_column = left_workbench_col if i < ITEMS_PER_COLUMN else right_workbench_col
                     with parent_column:
                             "audio": audio, "info": info, "delete_btn": delete_btn
                         })
                 for item in workbench_items:
                     all_workbench_ui_components.extend([
                         item["row"], item["item_num_display"], item["audio"], item["info"]
                     ])
         # --- UIイベントハンドラ関数 ---
         def load_styles_for_ui(selected_model_name: Optional[str]):
             if not selected_model_name: return gr.update(choices=[], value=None), gr.update(value=DEFAULT_STYLE_WEIGHT), {}
             model_path = assets_root_path / selected_model_name
                 default_weight = styles_map[first_key].get("weight", DEFAULT_STYLE_WEIGHT)
             return gr.update(choices=display_names, value=default_display_name), gr.update(value=default_weight), styles_map
+        # ▼▼▼ 変更点: FNモデルモードに対応したモデルリスト更新関数 ▼▼▼
+        def action_refresh_model_list(use_fn_model_mode: bool):
             """モデルリストを再読み込みし、UIとバックエンドの状態を同期させる。"""
+            # 既存のシンボリックリンクをクリア
+            if assets_root_path.exists():
+                for item in assets_root_path.iterdir():
+                    if item.is_symlink():
+                        try:
+                            item.unlink()
+                        except OSError as e:
+                            print(f"Failed to remove symlink {item}: {e}")
+            # FNモデルキャッシュパスからFNモデルを探し、シンボリックリンクを作成
+            fn_models_found = []
+            if FN_MODEL_CACHE_PATH.exists() and FN_MODEL_CACHE_PATH.is_dir():
+                for item in FN_MODEL_CACHE_PATH.iterdir():
+                    if item.is_dir() and re.fullmatch(r'FN\d+', item.name, re.IGNORECASE):
+                        fn_models_found.append(item.name)
+                        target_link = assets_root_path / item.name
+                        if not target_link.exists():
+                            try:
+                                os.symlink(item, target_link)
+                            except OSError as e:
+                                print(f"Warning: Could not create symlink for {item.name}: {e}")
+            fn_mode_checkbox_update = gr.update(visible=bool(fn_models_found))
+            # バックエンドのモデルリストを更新
             model_holder.refresh()
+            model_dropdown_update = gr.update(choices=[], value=None)
+            if use_fn_model_mode and fn_models_found:
+                # FNモデルモードの場合: FNモデルを数値でソートして表示
+                sorted_fn_models = sorted(fn_models_found, key=get_fn_model_sort_key)
+                value = sorted_fn_models[0] if sorted_fn_models else None
+                model_dropdown_update = gr.update(choices=sorted_fn_models, value=value)
+            else:
+                # 通常モードの場合: 通常モデルとマージモデルを表示
+                ui_model_list = [p.name for p in assets_root_path.iterdir() if p.is_dir() and not p.is_symlink()]
+                formatted_choices = format_and_sort_model_names(ui_model_list)
+                value = formatted_choices[0][1] if formatted_choices else None
+                model_dropdown_update = gr.update(choices=formatted_choices, value=value)
+            # 選択されたモデルに基づいてスタイルUIを更新
+            selected_model_for_style = model_dropdown_update.value
+            style_dropdown_update, style_weight_update, styles_data_state_update = load_styles_for_ui(selected_model_for_style)
+            return fn_mode_checkbox_update, model_dropdown_update, style_dropdown_update, style_weight_update, styles_data_state_update
         # ▲▲▲ 変更点 ▲▲▲
         def on_model_select_change(selected_model_name: Optional[str]):
             style_dropdown_update, style_weight_update, styles_data_state_update = load_styles_for_ui(selected_model_name)
             return style_dropdown_update, style_weight_update, styles_data_state_update
         def on_style_dropdown_select(selected_display_name: Optional[str], styles_data: Dict[str, Any]):
             if not selected_display_name or not styles_data: return gr.update(value=DEFAULT_STYLE_WEIGHT)
         def action_run_synthesis(
             model_name: Optional[str],
             style_display_name: Optional[str], style_weight_for_synth: float,
             text: str, generation_mode: str, batch_count: int,
             lang: str, seed: int, speaker: str, ref_audio: Optional[str],
             all_logs = []
             model_path = assets_root_path / model_name
             files = find_safetensors_files_webui(str(model_path))
             if not files:
                 error_outputs[0] = f"❌ [エラー] モデルフォルダ '{model_name}' に .safetensors ファイルが見つかりません。"
                 return tuple(error_outputs)
             actual_model_file_to_load = str(model_path / files[0])
             all_logs.append(f"[自動選択] 使用モデルファイル: {files[0]}")
             batch_count = int(batch_count)
             if batch_count <= 0: batch_count = 1
             return tuple(final_outputs)
+        # --- 作業台イベントハンドラ ---
         def add_to_workbench(
             current_status: str,
             current_workbench_list: List[Dict],
             safe_workbench_list = current_workbench_list or []
             if not audio_path or not Path(audio_path).exists():
+                log_messages.append("⚠️ [作業台追加エラー] 追加する音声ファイルが見つかりません。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
             if any(item['audio_path'] == audio_path for item in safe_workbench_list):
+                log_messages.append("ℹ️ この音声はすでに作業台に存在します。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
                         path_to_delete.unlink()
                 except Exception as e:
                     print(f"Warning: Failed to delete old workbench audio file: {e}")
+                log_messages.append(f"ℹ️ 作業台のアイテムが最大数({MAX_WORKBENCH_ITEMS})に達したため、一番古いアイテムを削除しました。")
             ui_updates = update_workbench_ui(updated_list)
+            log_messages.append("✅ 作業台に音声を追加しました。")
             final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
             return (final_status, updated_list) + ui_updates
                 path_to_delete = Path(item_to_remove['audio_path'])
                 if path_to_delete.exists() and str(path_to_delete.parent) == tempfile.gettempdir():
                     path_to_delete.unlink()
+                    log_messages.append(f"✅ 作業台からアイテム #{index_to_remove + 1} を削除し、一時ファイルをクリーンアップしました。")
                 elif path_to_delete.exists():
+                    log_messages.append(f"✅ 作業台からアイテム #{index_to_remove + 1} を削除しました。(ファイルは保持: {path_to_delete.name})")
                 else:
+                    log_messages.append(f"✅ 作業台からアイテム #{index_to_remove + 1} を削除しました。(関連ファイルなし)")
             except Exception as e:
+                log_messages.append(f"⚠️ 作業台のアイテム #{index_to_remove + 1} のファイル削除中にエラー: {e}")
             updated_list = [item for i, item in enumerate(safe_workbench_list) if i != index_to_remove]
             ui_updates = update_workbench_ui(updated_list)
         ):
             log_messages = []
             if not workbench_list:
+                log_messages.append("⚠️ [結合プレビュー警告] 作業台に音声がありません。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return final_status, None, {}
                 pause_duration = int(pause_ms)
                 if pause_duration >= 0:
                     pause_segment = AudioSegment.silent(duration=pause_duration)
                     combined_audio = segment1 + pause_segment + segment2
                     log_messages.append(f"✅ 音声 #{first_audio_num} と #{second_audio_num} を {pause_duration}ms のポーズを挟んで結合しました。")
                 else:
                     overlap_duration = abs(pause_duration)
                     max_possible_overlap = min(len(segment1), len(segment2))
                     if overlap_duration > max_possible_overlap:
                         log_messages.append(f"ℹ️ オーバーラップ長({overlap_duration}ms)が可能な最大値({max_possible_overlap}ms)を超えるため、自動的に調整されました。")
                         overlap_duration = max_possible_overlap
                     final_duration = len(segment1) + len(segment2) - overlap_duration
                     combined_audio = AudioSegment.silent(duration=final_duration)
                     combined_audio = combined_audio.overlay(segment1, position=0)
                     overlay_position = len(segment1) - overlap_duration
                     combined_audio = combined_audio.overlay(segment2, position=overlay_position)
                     log_messages.append(f"✅ 音声 #{first_audio_num} と #{second_audio_num} を {overlap_duration}ms 重ねて（オーバーレイして）結合しました。")
                 progress(1, desc="結合完了")
             final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
             return final_status, str(temp_path), metadata
         def action_add_merged_to_workbench(
             current_status: str,
             preview_data: Dict,
             log_messages = []
             safe_workbench_list = current_workbench_list or []
             if not preview_data or "audio_path" not in preview_data:
+                log_messages.append("⚠️ [作業台追加エラー] 追加する結合済み音声がありません。先にプレビューを生成してください。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
             src_path = Path(preview_data["audio_path"])
             if not src_path.exists():
+                log_messages.append("⚠️ [作業台追加エラー] 結合済み音声ファイルが見つかりません。")
                 final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
                 return (final_status, safe_workbench_list) + update_workbench_ui(safe_workbench_list)
                         log_messages.append(f"⚠️ 元の音声ファイル削除中にエラー: {e}")
                 final_workbench_list = [new_merged_item] + remaining_list
+                log_messages.append(f"✅ 結合音声を作業台に追加し、元の音声(#{idx1+1}, #{idx2+1})を削除しました。")
             else:
                 final_workbench_list = [new_merged_item] + safe_workbench_list
+                log_messages.append("✅ 結合済みの音声を作業台の一番上に追加しました。")
             if len(final_workbench_list) > MAX_WORKBENCH_ITEMS:
                 item_to_remove = final_workbench_list.pop(-1)
                         path_to_delete.unlink()
                 except Exception as e:
                     print(f"Warning: Failed to delete old workbench audio file: {e}")
+                log_messages.append(f"ℹ️ 作業台が最大数({MAX_WORKBENCH_ITEMS})に達したため一番古いアイテムを削除しました。")
             ui_updates = update_workbench_ui(final_workbench_list)
             final_status = (current_status + "\n" + "\n".join(log_messages)).strip()
         # --- イベントリスナー接続 ---
+        # ▼▼▼ 変更点: FNモデルモードに対応したイベントリスナーの定義 ▼▼▼
+        refresh_triggers = [refresh_model_list_button.click, use_fn_model_mode_checkbox.change]
+        outputs_for_refresh = [use_fn_model_mode_checkbox, selected_model_dropdown, current_styles_dropdown, style_weight_for_synth_slider, all_styles_data_state]
+        for trigger in refresh_triggers:
+            trigger(action_refresh_model_list,
+                    inputs=[use_fn_model_mode_checkbox],
+                    outputs=outputs_for_refresh)
         selected_model_dropdown.change(on_model_select_change,
                                        inputs=[selected_model_dropdown],
         generate_button.click(
             fn=action_run_synthesis,
             inputs=[
+                selected_model_dropdown,
                 current_styles_dropdown, style_weight_for_synth_slider,
                 text_input, generation_mode_radio, batch_count_slider,
                 language_dropdown, seed_input, speaker_name_textbox,
         )
         for i in range(MAX_AUDIO_OUTPUTS):
             to_workbench_buttons[i].click(
                 fn=add_to_workbench,
                 inputs=[
             outputs=[status_textbox, preview_audio_player, merged_preview_state]
         )
         add_merged_to_workbench_button.click(
             fn=action_add_merged_to_workbench,
             inputs=[
         player_width_slider.release(lambda w: f"<script>document.documentElement.style.setProperty('--audio-width', '{w}px');</script>", inputs=[player_width_slider], outputs=[js_injector_html])
+        app.load(action_refresh_model_list,
+                 inputs=[use_fn_model_mode_checkbox],
+                 outputs=outputs_for_refresh)
         # ▲▲▲ 変更点 ▲▲▲
     return app
 if __name__ == "__main__":
     if Path("model_assets").exists(): shutil.rmtree("model_assets")
+    # ▼▼▼ 変更点: FNモデルキャッシュパスの作成とGradioへの許可 ▼▼▲
+    # モックFNモデルを作成してテスト
+    FN_MODEL_CACHE_PATH.mkdir(exist_ok=True, parents=True)
+    (FN_MODEL_CACHE_PATH / "FN1").mkdir(exist_ok=True)
+    (FN_MODEL_CACHE_PATH / "FN10").mkdir(exist_ok=True)
+    (FN_MODEL_CACHE_PATH / "FN2").mkdir(exist_ok=True)
     mock_model_holder = TTSModelHolder()
     print(f"Initial models loaded by TTSModelHolder: {mock_model_holder.model_names}")
     app = create_synthesis_app(mock_model_holder)
     assets_dir_path.mkdir(exist_ok=True)
     allowed_paths = [str(assets_dir_path)]
+    # FNモデルのキャッシュパスへのアクセスを許可
+    if FN_MODEL_CACHE_PATH.exists() and FN_MODEL_CACHE_PATH.is_dir():
+        allowed_paths.append(str(FN_MODEL_CACHE_PATH.resolve()))
+    else:
+        try:
+            FN_MODEL_CACHE_PATH.mkdir(exist_ok=True, parents=True)
+            allowed_paths.append(str(FN_MODEL_CACHE_PATH.resolve()))
+            print(f"Created FN model cache directory at: {FN_MODEL_CACHE_PATH}")
+        except OSError as e:
+            print(f"Could not create FN model cache directory at {FN_MODEL_CACHE_PATH}: {e}")
     output_dir_path = Path("output").resolve()
     (output_dir_path / "normal").mkdir(exist_ok=True, parents=True)
     print(f"Gradioに次のパスへのアクセスを許可します: {', '.join(allowed_paths)}")
+    app.launch(allowed_paths=allowed_paths)
+    # ▲▲▲ 変更点 ▲▲▲