Spaces:

Soul-AILab
/

SoulX-Podcast-1.7B

Running on Zero

tiamojames commited on 20 days ago

Commit

1c338bc

verified ·

1 Parent(s): 4a6400b

Upload folder using huggingface_hub

Files changed (1) hide show

soulxpodcast/utils/dataloader.py CHANGED Viewed

@@ -123,7 +123,7 @@ class PodcastDataset(Dataset):
                 prompt_text_ids = self.text_tokenizer.encode(prompt_text)
                 prompt_text_ids_list.append(prompt_text_ids)
                 if use_dialect_prompt:
-                    import pdb; pdb.set_trace()
                     dialect_prompt_text = normalize_text(data["dialect_prompt_text"][spk_idx])
                     dialect_prompt_text = f"{SPK_DICT[spk_idx]}{TEXT_START}{dialect_prompt_text}{TEXT_END}{AUDIO_START}"
                     dialect_prompt_text_ids = self.text_tokenizer.encode(dialect_prompt_text)

                 prompt_text_ids = self.text_tokenizer.encode(prompt_text)
                 prompt_text_ids_list.append(prompt_text_ids)
                 if use_dialect_prompt:
+                    # import pdb; pdb.set_trace()
                     dialect_prompt_text = normalize_text(data["dialect_prompt_text"][spk_idx])
                     dialect_prompt_text = f"{SPK_DICT[spk_idx]}{TEXT_START}{dialect_prompt_text}{TEXT_END}{AUDIO_START}"
                     dialect_prompt_text_ids = self.text_tokenizer.encode(dialect_prompt_text)