Respair commited on Jan 29

Commit

6742cf9

verified ·

1 Parent(s): 35e3d3e

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +2 -0
vocos/.github/workflows/pypi-release.yml +26 -0
vocos/.gitignore +164 -0
vocos/LICENSE +21 -0
vocos/README.md +124 -0
vocos/configs/vocos-encodec.yaml +86 -0
vocos/configs/vocos-imdct.yaml +86 -0
vocos/configs/vocos-resnet.yaml +86 -0
vocos/configs/vocos.yaml +90 -0
vocos/configs/vocos24.yaml +90 -0
vocos/data/filelist.train +3 -0
vocos/data/filelist.val +500 -0
vocos/data/filelist2.train +3 -0
vocos/logs/lightning_logs/version_24/config.yaml +152 -0
vocos/logs/lightning_logs/version_24/events.out.tfevents.1738102892.104-171-202-79 +3 -0
vocos/logs/lightning_logs/version_24/hparams.yaml +10 -0
vocos/logs/lightning_logs/version_25/checkpoints/last.ckpt +3 -0
vocos/logs/lightning_logs/version_25/checkpoints/vocos_checkpoint_epoch=0_step=16634_val_loss=6.2461.ckpt +3 -0
vocos/logs/lightning_logs/version_25/checkpoints/vocos_checkpoint_epoch=1_step=33268_val_loss=5.4846.ckpt +3 -0
vocos/logs/lightning_logs/version_25/config.yaml +152 -0
vocos/logs/lightning_logs/version_25/events.out.tfevents.1738103019.104-171-202-79 +3 -0
vocos/logs/lightning_logs/version_25/hparams.yaml +10 -0
vocos/logs/lightning_logs/version_26/checkpoints/last.ckpt +3 -0
vocos/logs/lightning_logs/version_26/checkpoints/vocos_checkpoint_epoch=0_step=16634_val_loss=6.8451.ckpt +3 -0
vocos/logs/lightning_logs/version_26/config.yaml +152 -0
vocos/logs/lightning_logs/version_26/events.out.tfevents.1738103077.104-171-202-79 +3 -0
vocos/logs/lightning_logs/version_26/hparams.yaml +10 -0
vocos/logs/lightning_logs/version_27/checkpoints/last.ckpt +3 -0
vocos/logs/lightning_logs/version_27/checkpoints/vocos_checkpoint_epoch=0_step=16634_val_loss=6.0317.ckpt +3 -0
vocos/logs/lightning_logs/version_27/config.yaml +152 -0
vocos/logs/lightning_logs/version_27/events.out.tfevents.1738146591.104-171-202-79 +3 -0
vocos/logs/lightning_logs/version_27/hparams.yaml +10 -0
vocos/logs/lightning_logs/version_28/config.yaml +152 -0
vocos/logs/lightning_logs/version_28/events.out.tfevents.1738155430.104-171-202-79 +3 -0
vocos/logs/lightning_logs/version_28/hparams.yaml +10 -0
vocos/metrics/UTMOS.py +223 -0
vocos/metrics/__pycache__/UTMOS.cpython-311.pyc +0 -0
vocos/metrics/__pycache__/periodicity.cpython-311.pyc +0 -0
vocos/metrics/epoch=3-step=7459.ckpt +3 -0
vocos/metrics/periodicity.py +105 -0
vocos/metrics/wav2vec_small.pt +3 -0
vocos/notebooks/Bark+Vocos.ipynb +264 -0
vocos/requirements-train.txt +8 -0
vocos/requirements.txt +8 -0
vocos/setup.py +39 -0
vocos/train.py +6 -0
vocos/vocos/__init__.py +4 -0
vocos/vocos/__pycache__/__init__.cpython-311.pyc +0 -0
vocos/vocos/__pycache__/dataset.cpython-311.pyc +0 -0
vocos/vocos/__pycache__/discriminators.cpython-311.pyc +0 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+vocos/data/filelist.train filter=lfs diff=lfs merge=lfs -text
+vocos/data/filelist2.train filter=lfs diff=lfs merge=lfs -text

vocos/.github/workflows/pypi-release.yml ADDED Viewed

	@@ -0,0 +1,26 @@

+name: Publish Python package
+on:
+  release:
+    types: [published]
+jobs:
+  publish:
+    runs-on: ubuntu-latest
+    steps:
+    - uses: actions/checkout@v3
+    - name: Set up Python
+      uses: actions/setup-python@v4
+      with:
+        python-version: "3.x"
+    - name: Install pypa/setuptools
+      run: >-
+        python -m
+        pip install wheel
+    - name: Build a binary wheel
+      run: >-
+        python setup.py sdist bdist_wheel
+    - name: Publish to PyPI
+      uses: pypa/gh-action-pypi-publish@release/v1
+      with:
+        password: ${{ secrets.PYPI_API_TOKEN }}

vocos/.gitignore ADDED Viewed

	@@ -0,0 +1,164 @@

+# Byte-compiled / optimized / DLL files
+__pycache__/
+*.py[cod]
+*$py.class
+# C extensions
+*.so
+# Distribution / packaging
+.Python
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+wheels/
+share/python-wheels/
+*.egg-info/
+.installed.cfg
+*.egg
+MANIFEST
+# PyInstaller
+#  Usually these files are written by a python script from a template
+#  before PyInstaller builds the exe, so as to inject date/other infos into it.
+*.manifest
+*.spec
+# Installer logs
+pip-log.txt
+pip-delete-this-directory.txt
+# Unit test / coverage reports
+htmlcov/
+.tox/
+.nox/
+.coverage
+.coverage.*
+.cache
+nosetests.xml
+coverage.xml
+*.cover
+*.py,cover
+.hypothesis/
+.pytest_cache/
+cover/
+# Translations
+*.mo
+*.pot
+# Django stuff:
+*.log
+local_settings.py
+db.sqlite3
+db.sqlite3-journal
+# Flask stuff:
+instance/
+.webassets-cache
+# Scrapy stuff:
+.scrapy
+# Sphinx documentation
+docs/_build/
+# PyBuilder
+.pybuilder/
+target/
+# Jupyter Notebook
+.ipynb_checkpoints
+# IPython
+profile_default/
+ipython_config.py
+# pyenv
+#   For a library or package, you might want to ignore these files since the code is
+#   intended to run in multiple environments; otherwise, check them in:
+# .python-version
+# pipenv
+#   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
+#   However, in case of collaboration, if having platform-specific dependencies or dependencies
+#   having no cross-platform support, pipenv may install dependencies that don't work, or not
+#   install all needed dependencies.
+#Pipfile.lock
+# poetry
+#   Similar to Pipfile.lock, it is generally recommended to include poetry.lock in version control.
+#   This is especially recommended for binary packages to ensure reproducibility, and is more
+#   commonly ignored for libraries.
+#   https://python-poetry.org/docs/basic-usage/#commit-your-poetrylock-file-to-version-control
+#poetry.lock
+# pdm
+#   Similar to Pipfile.lock, it is generally recommended to include pdm.lock in version control.
+#pdm.lock
+#   pdm stores project-wide configurations in .pdm.toml, but it is recommended to not include it
+#   in version control.
+#   https://pdm.fming.dev/#use-with-ide
+.pdm.toml
+# PEP 582; used by e.g. github.com/David-OConnor/pyflow and github.com/pdm-project/pdm
+__pypackages__/
+# Celery stuff
+celerybeat-schedule
+celerybeat.pid
+# SageMath parsed files
+*.sage.py
+# Environments
+.env
+.venv
+env/
+venv/
+ENV/
+env.bak/
+venv.bak/
+# Spyder project settings
+.spyderproject
+.spyproject
+# Rope project settings
+.ropeproject
+# mkdocs documentation
+/site
+# mypy
+.mypy_cache/
+.dmypy.json
+dmypy.json
+# Pyre type checker
+.pyre/
+# pytype static type analyzer
+.pytype/
+# Cython debug symbols
+cython_debug/
+# PyCharm
+#  JetBrains specific template is maintained in a separate JetBrains.gitignore that can
+#  be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
+#  and can be added to the global gitignore or merged into this file.  For a more nuclear
+#  option (not recommended) you can uncomment the following to ignore the entire idea folder.
+.idea/
+logs/
+*.pt
+*.ckpt

vocos/LICENSE ADDED Viewed

	@@ -0,0 +1,21 @@

+MIT License
+Copyright (c) 2023 Charactr Inc.
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.

vocos/README.md ADDED Viewed

	@@ -0,0 +1,124 @@

+# Vocos: Closing the gap between time-domain and Fourier-based neural vocoders for high-quality audio synthesis
+[Audio samples](https://gemelo-ai.github.io/vocos/) |
+Paper [[abs]](https://arxiv.org/abs/2306.00814) [[pdf]](https://arxiv.org/pdf/2306.00814.pdf)
+Vocos is a fast neural vocoder designed to synthesize audio waveforms from acoustic features. Trained using a Generative
+Adversarial Network (GAN) objective, Vocos can generate waveforms in a single forward pass. Unlike other typical
+GAN-based vocoders, Vocos does not model audio samples in the time domain. Instead, it generates spectral
+coefficients, facilitating rapid audio reconstruction through inverse Fourier transform.
+## Installation
+To use Vocos only in inference mode, install it using:
+```bash
+pip install vocos
+```
+If you wish to train the model, install it with additional dependencies:
+```bash
+pip install vocos[train]
+```
+## Usage
+### Reconstruct audio from mel-spectrogram
+```python
+import torch
+from vocos import Vocos
+vocos = Vocos.from_pretrained("charactr/vocos-mel-24khz")
+mel = torch.randn(1, 100, 256)  # B, C, T
+audio = vocos.decode(mel)
+```
+Copy-synthesis from a file:
+```python
+import torchaudio
+y, sr = torchaudio.load(YOUR_AUDIO_FILE)
+if y.size(0) > 1:  # mix to mono
+    y = y.mean(dim=0, keepdim=True)
+y = torchaudio.functional.resample(y, orig_freq=sr, new_freq=24000)
+y_hat = vocos(y)
+```
+### Reconstruct audio from EnCodec tokens
+Additionally, you need to provide a `bandwidth_id` which corresponds to the embedding for bandwidth from the
+list: `[1.5, 3.0, 6.0, 12.0]`.
+```python
+vocos = Vocos.from_pretrained("charactr/vocos-encodec-24khz")
+audio_tokens = torch.randint(low=0, high=1024, size=(8, 200))  # 8 codeboooks, 200 frames
+features = vocos.codes_to_features(audio_tokens)
+bandwidth_id = torch.tensor([2])  # 6 kbps
+audio = vocos.decode(features, bandwidth_id=bandwidth_id)
+```
+Copy-synthesis from a file: It extracts and quantizes features with EnCodec, then reconstructs them with Vocos in a
+single forward pass.
+```python
+y, sr = torchaudio.load(YOUR_AUDIO_FILE)
+if y.size(0) > 1:  # mix to mono
+    y = y.mean(dim=0, keepdim=True)
+y = torchaudio.functional.resample(y, orig_freq=sr, new_freq=24000)
+y_hat = vocos(y, bandwidth_id=bandwidth_id)
+```
+### Integrate with 🐶 [Bark](https://github.com/suno-ai/bark) text-to-audio model
+See [example notebook](notebooks%2FBark%2BVocos.ipynb).
+## Pre-trained models
+| Model Name                                                                          | Dataset       | Training Iterations | Parameters
+|-------------------------------------------------------------------------------------|---------------|-------------------|------------|
+| [charactr/vocos-mel-24khz](https://huggingface.co/charactr/vocos-mel-24khz)         | LibriTTS      | 1M                | 13.5M
+| [charactr/vocos-encodec-24khz](https://huggingface.co/charactr/vocos-encodec-24khz) | DNS Challenge | 2M                | 7.9M
+## Training
+Prepare a filelist of audio files for the training and validation set:
+```bash
+find $TRAIN_DATASET_DIR -name *.wav > filelist.train
+find $VAL_DATASET_DIR -name *.wav > filelist.val
+```
+Fill a config file, e.g. [vocos.yaml](configs%2Fvocos.yaml), with your filelist paths and start training with:
+```bash
+python train.py -c configs/vocos.yaml
+```
+Refer to [Pytorch Lightning documentation](https://lightning.ai/docs/pytorch/stable/) for details about customizing the
+training pipeline.
+## Citation
+If this code contributes to your research, please cite our work:
+```
+@article{siuzdak2023vocos,
+  title={Vocos: Closing the gap between time-domain and Fourier-based neural vocoders for high-quality audio synthesis},
+  author={Siuzdak, Hubert},
+  journal={arXiv preprint arXiv:2306.00814},
+  year={2023}
+}
+```
+## License
+The code in this repository is released under the MIT license as found in the
+[LICENSE](LICENSE) file.

vocos/configs/vocos-encodec.yaml ADDED Viewed

	@@ -0,0 +1,86 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: ???
+      sampling_rate: 24000
+      num_samples: 24000
+      batch_size: 16
+      num_workers: 8
+    val_params:
+      filelist_path: ???
+      sampling_rate: 24000
+      num_samples: 24000
+      batch_size: 16
+      num_workers: 8
+model:
+  class_path: vocos.experiment.VocosEncodecExp
+  init_args:
+    sample_rate: 24000
+    initial_learning_rate: 5e-4
+    mel_loss_coeff: 45
+    mrd_loss_coeff: 1.0
+    num_warmup_steps: 0 # Optimizers warmup steps
+    pretrain_mel_steps: 0  # 0 means GAN objective from the first iteration
+    # automatic evaluation
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+    feature_extractor:
+      class_path: vocos.feature_extractors.EncodecFeatures
+      init_args:
+        encodec_model: encodec_24khz
+        bandwidths: [1.5, 3.0, 6.0, 12.0]
+        train_codebooks: false
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 128
+        dim: 384
+        intermediate_dim: 1152
+        num_layers: 8
+        adanorm_num_embeddings: 4  # len(bandwidths)
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 384
+        n_fft: 1280
+        hop_length: 320
+        padding: same
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+  callbacks:
+    - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    - class_path: pytorch_lightning.callbacks.ModelSummary
+      init_args:
+        max_depth: 2
+    - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+      init_args:
+        monitor: val_loss
+        filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+        save_top_k: 3
+        save_last: true
+    - class_path: vocos.helpers.GradNormCallback
+  # Lightning calculates max_steps across all optimizer steps (rather than number of batches)
+  # This equals to 1M steps per generator and 1M per discriminator
+  max_steps: 2000000
+  # You might want to limit val batches when evaluating all the metrics, as they are time-consuming
+  limit_val_batches: 100
+  accelerator: gpu
+  strategy: ddp
+  devices: [0]
+  log_every_n_steps: 100

vocos/configs/vocos-imdct.yaml ADDED Viewed

	@@ -0,0 +1,86 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: ???
+      sampling_rate: 24000
+      num_samples: 16384
+      batch_size: 16
+      num_workers: 8
+    val_params:
+      filelist_path: ???
+      sampling_rate: 24000
+      num_samples: 48384
+      batch_size: 16
+      num_workers: 8
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    sample_rate: 24000
+    initial_learning_rate: 5e-4
+    mel_loss_coeff: 45
+    mrd_loss_coeff: 0.1
+    num_warmup_steps: 0 # Optimizers warmup steps
+    pretrain_mel_steps: 0  # 0 means GAN objective from the first iteration
+    # automatic evaluation
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 24000
+        n_fft: 1024
+        hop_length: 256
+        n_mels: 100
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 100
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+    head:
+      class_path: vocos.heads.IMDCTCosHead
+      init_args:
+        dim: 512
+        mdct_frame_len: 512  # mel-spec hop_length * 2
+        padding: center
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+  callbacks:
+    - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    - class_path: pytorch_lightning.callbacks.ModelSummary
+      init_args:
+        max_depth: 2
+    - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+      init_args:
+        monitor: val_loss
+        filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+        save_top_k: 3
+        save_last: true
+    - class_path: vocos.helpers.GradNormCallback
+  # Lightning calculates max_steps across all optimizer steps (rather than number of batches)
+  # This equals to 1M steps per generator and 1M per discriminator
+  max_steps: 2000000
+  # You might want to limit val batches when evaluating all the metrics, as they are time-consuming
+  limit_val_batches: 100
+  accelerator: gpu
+  strategy: ddp
+  devices: [0]
+  log_every_n_steps: 100

vocos/configs/vocos-resnet.yaml ADDED Viewed

	@@ -0,0 +1,86 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: ???
+      sampling_rate: 24000
+      num_samples: 16384
+      batch_size: 16
+      num_workers: 8
+    val_params:
+      filelist_path: ???
+      sampling_rate: 24000
+      num_samples: 48384
+      batch_size: 16
+      num_workers: 8
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    sample_rate: 24000
+    initial_learning_rate: 5e-4
+    mel_loss_coeff: 45
+    mrd_loss_coeff: 0.1
+    num_warmup_steps: 0 # Optimizers warmup steps
+    pretrain_mel_steps: 0  # 0 means GAN objective from the first iteration
+    # automatic evaluation
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 24000
+        n_fft: 1024
+        hop_length: 256
+        n_mels: 100
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosResNetBackbone
+      init_args:
+        input_channels: 100
+        dim: 512
+        num_blocks: 3
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 1024
+        hop_length: 256
+        padding: center
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+  callbacks:
+    - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    - class_path: pytorch_lightning.callbacks.ModelSummary
+      init_args:
+        max_depth: 2
+    - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+      init_args:
+        monitor: val_loss
+        filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+        save_top_k: 3
+        save_last: true
+    - class_path: vocos.helpers.GradNormCallback
+  # Lightning calculates max_steps across all optimizer steps (rather than number of batches)
+  # This equals to 1M steps per generator and 1M per discriminator
+  max_steps: 2000000
+  # You might want to limit val batches when evaluating all the metrics, as they are time-consuming
+  limit_val_batches: 100
+  accelerator: gpu
+  strategy: ddp
+  devices: [0]
+  log_every_n_steps: 100

vocos/configs/vocos.yaml ADDED Viewed

	@@ -0,0 +1,90 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: "/home/ubuntu/vocos/data/filelist.train"
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 58
+      num_workers: 8
+    val_params:
+      filelist_path: "/home/ubuntu/vocos/data/filelist.val"
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 16
+      num_workers: 8
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    sample_rate: 44100
+    initial_learning_rate: 5e-4
+    mel_loss_coeff: 45
+    mrd_loss_coeff: 0.1
+    num_warmup_steps: 0 # Optimizers warmup steps
+    pretrain_mel_steps: 0  # 0 means GAN objective from the first iteration
+    # automatic evaluation
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 44100
+        n_fft: 2048
+        hop_length: 512
+        win_length: 2048
+        n_mels: 128
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 128
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 2048
+        hop_length: 512
+        padding: center
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+  callbacks:
+    - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    - class_path: pytorch_lightning.callbacks.ModelSummary
+      init_args:
+        max_depth: 2
+    - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+      init_args:
+        # every_n_train_steps: 5000
+        # filename: vocos_checkpoint_step_{step}
+        monitor: val_loss
+        filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+        save_top_k: 3
+        save_last: true
+    - class_path: vocos.helpers.GradNormCallback
+  # Lightning calculates max_steps across all optimizer steps (rather than number of batches)
+  # This equals to 1M steps per generator and 1M per discriminator
+  max_steps: 2000000
+  # You might want to limit val batches when evaluating all the metrics, as they are time-consuming
+  limit_val_batches: 50
+  accelerator: gpu
+  strategy: ddp
+  devices: [0,1]
+  log_every_n_steps: 100

vocos/configs/vocos24.yaml ADDED Viewed

	@@ -0,0 +1,90 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: "/home/ubuntu/vocos/data/filelist2.train"
+      sampling_rate: 24000
+      num_samples: 57600
+      batch_size: 64
+      num_workers: 8
+    val_params:
+      filelist_path: "/home/ubuntu/vocos/data/filelist.val"
+      sampling_rate: 24000
+      num_samples: 57600
+      batch_size: 16
+      num_workers: 8
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    sample_rate: 24000
+    initial_learning_rate: 5e-4
+    mel_loss_coeff: 45
+    mrd_loss_coeff: 0.1
+    num_warmup_steps: 0 # Optimizers warmup steps
+    pretrain_mel_steps: 0  # 0 means GAN objective from the first iteration
+    # automatic evaluation
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 24000
+        n_fft: 2048
+        hop_length: 300
+        win_length: 1200
+        n_mels: 80
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 80
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 2048
+        hop_length: 300
+        padding: center
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+  callbacks:
+    - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    - class_path: pytorch_lightning.callbacks.ModelSummary
+      init_args:
+        max_depth: 2
+    - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+      init_args:
+        # every_n_train_steps: 5000
+        # filename: vocos_checkpoint_step_{step}
+        monitor: val_loss
+        filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+        save_top_k: 3
+        save_last: true
+    - class_path: vocos.helpers.GradNormCallback
+  # Lightning calculates max_steps across all optimizer steps (rather than number of batches)
+  # This equals to 1M steps per generator and 1M per discriminator
+  max_steps: 2000000
+  # You might want to limit val batches when evaluating all the metrics, as they are time-consuming
+  limit_val_batches: 50
+  accelerator: gpu
+  strategy: ddp
+  devices: [0,1]
+  log_every_n_steps: 100

vocos/data/filelist.train ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:186a28c6524b34bcdfbbe01ed42257db16753ce1e35770385e004fb6ea7219b8
+size 150129204

vocos/data/filelist.val ADDED Viewed

	@@ -0,0 +1,500 @@

+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Gale/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_003/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_003_chunk1424.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/النوم عند قدمي الجبل/النوم عند قدمي الجبل_chunk854.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/حجرتان وصالة/حجرتان وصالة_chunk715.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/СЕМЕЙНЫЙ ЮРИСТ. Развод, алименты и раздел имущества [gp2-6PZBZmU]/СЕМЕ_speaker_SPEAKER_00/СЕМЕ_speaker_SPEAKER_00_chunk513.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أبابيل/أبابيل_chunk979.mp3
+/home/ubuntu/respair/jpn/moe/2cf01874/wav/2cf01874_1845.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Is Amazon Good For Small Business？ [x6hj-XeDKD4]/Is A_speaker_SPEAKER_05/Is A_speaker_SPEAKER_05_chunk93.wav
+/home/ubuntu/respair/data_cache/Final_Persian/رویا میرعلمی/dfe42e8c-acda-4b52-b0e6-8f02cdc9dbde/dfe42e8c-acda-4b52-b0e6-8f02cdc9dbde_chunk182.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/امیررضا علی زاده/1a762047-afb4-4b6a-a2ae-62b6e80edcbd/1a762047-afb4-4b6a-a2ae-62b6e80edcbd_chunk165.mp3
+/home/ubuntu/respair/jpn/moe/917feebd/wav/917feebd_2750.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ЛОГОПЕД. Развитие речи, постановка звуков, массаж и подрезание уздечки [ra3U7s-VZzI]/ЛОГО_speaker_SPEAKER_03/ЛОГО_speaker_SPEAKER_03_chunk183.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/НАСКОЛЬКО ТЫ МУЖИК？ Про барбершопы, лысые яйца и давление общества [y2CUqJKfAY8]/НАСК_speaker_SPEAKER_05/НАСК_speaker_SPEAKER_05_chunk414.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/mayu/mayu_cgss/mayu_cgss_card_100270/mayu_cgss_voice_100270_2_03.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_13604.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Сарко Де Рази - Украденный свет/Сарк_speaker_SPEAKER_00/Сарк_speaker_SPEAKER_00_chunk277.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/نون/نون_chunk636.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Муратов – что происходит с Россией [z1C01Gc9w-w]/Мура_speaker_SPEAKER_01/Мура_speaker_SPEAKER_01_chunk410.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Laezel/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_003/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_003_chunk866.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_expresso/Ylacombe_Expresso_audio_3273_P3.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/اليهودي والفتاة العربية/اليهودي والفتاة العربية_chunk1513.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/علامات الحب السبعة/علامات الحب السبعة_chunk560.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Василий Головачев - Спасатели Веера 1 - Посланник_part_002/Васи_speaker_SPEAKER_01/Васи_speaker_SPEAKER_01_chunk455.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/هدا صدر/7bdf73a0-1db6-413c-a363-4e0f55aa4433/7bdf73a0-1db6-413c-a363-4e0f55aa4433_chunk103.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/ranko/ranko_mobamas/ranko_mobamasu_0018/ranko_mobamasu_0018_chunk72.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/امرأة في مكان آخر/امرأة في مكان آخر_chunk1577.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/sakurai_takahiro/Sakurai_Takahiro_01/Sakurai_Takahiro_01_chunk1470.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/قميص تكويه إمرأتان/قميص تكويه إمرأتان_chunk801.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/امیرمحمد صمصامی/5ad3f710-83cd-4775-9ec4-b72e514bebfc/5ad3f710-83cd-4775-9ec4-b72e514bebfc_chunk162.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/ruski_mix/Становясь волшебницей (1-13 серия) [Dreamcast] [BD 1080] -185087421_456245995 audio only/Стан_speaker_SPEAKER_07/Стан_speaker_SPEAKER_07_chunk946.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/ranko/ranko_cgss/ranko_card_200796/ranko_voice_200796_4_02.wav
+/home/ubuntu/respair/data_cache/Final_Persian/آیلار محمدی/5e44498f-d33b-46ae-b18b-dfd841a4b949/5e44498f-d33b-46ae-b18b-dfd841a4b949_chunk362.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/whispering_chunks/ASMR - ANNUAL EAR CLEANING [Hk9dtOkOPro]/ASMR - ANNUAL EAR CLEANING [Hk9dtOkOPro]_chunk262.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/ru_youtube/ru_youtube_dataset_audio_2010.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/طرق سرية للجموح/طرق سرية للجموح_chunk203.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/لیلا ولی پور/6437de3d-b9ae-4c82-a00e-991a14e3731b/6437de3d-b9ae-4c82-a00e-991a14e3731b_chunk82.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Thinking Twice： Revenge of the Tipping Point with Malcolm Gladwell [l2tCLI29S4k]/Thin_speaker_SPEAKER_04/Thin_speaker_SPEAKER_04_chunk410.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/تقتلني أو أكتبها/تقتلني أو أكتبها_chunk32.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_002/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_002_chunk1446.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/امیررضا علی زاده/6dfaaafb-65c5-4dbe-b908-40bc822d74bc/6dfaaafb-65c5-4dbe-b908-40bc822d74bc_chunk401.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/دفتر الغربة/دفتر الغربة_chunk1173.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Валерий Цуркан - Пять веков туда и обратно/Вале_speaker_SPEAKER_02/Вале_speaker_SPEAKER_02_chunk218.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/shiki/shiki_cgss/shiki_card_100101/shiki_voice_100101_2_05.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Анна Джейн_08/Анна Джейн_08_chunk276.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/فاطمه ساعدی/f658ca03-a5ef-4ee5-91e9-541c82206bd3/f658ca03-a5ef-4ee5-91e9-541c82206bd3_chunk305.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ЖИЗНЬ С ШИЗОФРЕНИЕЙ-2. Aline in Wonderland. Принудительная госпитализация [iTysDG98Tw8]/ЖИЗН_speaker_SPEAKER_01/ЖИЗН_speaker_SPEAKER_01_chunk530.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/ساعد باقری/99aaa9f7-ad53-449d-94d0-506c4557c240/99aaa9f7-ad53-449d-94d0-506c4557c240_chunk369.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/اللعبة/اللعبة_chunk265.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Тодд_P_44_Samye yarkie zvYozdy/Тодд_P_44_Samye yarkie zvYozdy_chunk16.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/سندريلات مسقط/سندريلات مسقط_chunk229.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/ب‍ی‍ژن ارژن/54c54f7a-36c5-45be-97a3-47f5fb2e74b2/54c54f7a-36c5-45be-97a3-47f5fb2e74b2_chunk9.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Вадим Ечеистов - В тумане/Вади_speaker_SPEAKER_00/Вади_speaker_SPEAKER_00_chunk729.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/ещенепознер – до и во время войны ⧸ before and during the war [mh-7jvePXF4]/ещен_speaker_SPEAKER_09/ещен_speaker_SPEAKER_09_chunk405.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Composure Voice Lines (Disco Elysium) [88ib4sPXm2Q]/Composure Voice Lines (Disco Elysium) [88ib4sPXm2Q]_chunk962.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/بیتا خداداد/633ebac7-ba61-491c-8941-cbc0946f708d/633ebac7-ba61-491c-8941-cbc0946f708d_chunk144.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Inland Empire Voice Lines (Disco Elysium) [qY45lCTGmKc]/Inland Empire Voice Lines (Disco Elysium) [qY45lCTGmKc]_chunk1892.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/مونا فرجاد/b2f3bae3-15fc-43ed-8d2e-2fa8eb65e55e/b2f3bae3-15fc-43ed-8d2e-2fa8eb65e55e_chunk40.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/پویا پورهمدانی/6d7aa3f8-764c-4020-967f-d795940c405c/6d7aa3f8-764c-4020-967f-d795940c405c_chunk595.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/shinichiro_miki/Shinichiro_Miki__02/Shinichiro_Miki__02_chunk1525.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_002/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_002_chunk1519.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/إيفوريا/إيفوريا_chunk1570.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Astrion/BG3 Voice Lines： Astarion (part 2) [yZaGVMN9zGM]/BG3 Voice Lines： Astarion (part 2) [yZaGVMN9zGM]_chunk4878.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/سیاوش رستمی/9334a34f-dc29-4c00-81ec-51ee8f63d45f/9334a34f-dc29-4c00-81ec-51ee8f63d45f_chunk173.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Тодд_P_70_Samye yarkie zvYozdy/Тодд_P_70_Samye yarkie zvYozdy_chunk28.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/طارىء/طارىء_chunk753.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/arisu/arisu_mobamasu/2_arisu__0002_(Vocals)/2_arisu__0002_(Vocals)_chunk31.wav
+/home/ubuntu/respair/jpn/moe/cc948b89/wav/cc948b89_1994.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ظلال الكولوسيوم/ظلال الكولوسيوم_chunk126.mp3
+/home/ubuntu/respair/jpn/moe/b8b5fe66/wav/b8b5fe66_0999.wav
+/home/ubuntu/respair/data_cache/Final_Persian/سحر چوبدار/2d00c6fb-d3d8-4b60-a90f-ffdb45c8e3e5/2d00c6fb-d3d8-4b60-a90f-ffdb45c8e3e5_chunk6.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_podcast/Ylacombe_podcast_audio_1325_P2.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/010/S010_F_0022.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/لأنها استثناء/لأنها استثناء_chunk873.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/رسائل الأحزان في فلسفة الجمال والحب/رسائل الأحزان في فلسفة الجمال والحب_chunk856.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/22khz/22khz/audiobook_rus_dataset_22khz_audio_5777.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Election 2024： Are Identity Politics Holding Us Back？ Coleman Hughes vs. Alicia Garza [3G0_0WRV7KM]/Elec_speaker_SPEAKER_00/Elec_speaker_SPEAKER_00_chunk105.wav
+/home/ubuntu/respair/data_cache/Final_Persian/پژمان ابوالقاسمی/dc3e4253-0d7d-43a5-9fc1-ec500f633a21/dc3e4253-0d7d-43a5-9fc1-ec500f633a21_chunk270.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/محیا ساعدی/64717f7d-20a3-4993-8422-c34b24f20815/64717f7d-20a3-4993-8422-c34b24f20815_chunk135.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/ru_youtube/ru_youtube_dataset_audio_1704.wav
+/home/ubuntu/respair/jpn/moe/773a4156/wav/773a4156_2111.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/علي السوري/علي السوري_chunk527.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/سارا فیض/46f33750-c90b-4237-863c-2f557965e990/46f33750-c90b-4237-863c-2f557965e990_chunk144.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/قميص تكويه إمرأتان/قميص تكويه إمرأتان_chunk935.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/frame_turner/КУКОЯКА ‒ ОТВЕТ ИНСТАСАМКЕ, ПОЧЕМУ МЫ ТЕРЯЕМ ДРУЗЕЙ И ПЫТАЕМСЯ ЗАСЛУЖИТЬ ЛЮБОВЬ [6xa3X9ztHXQ]/КУКО_speaker_SPEAKER_02/КУКО_speaker_SPEAKER_02_chunk301.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/Karen/karen_cgss/karen_cgss_card_200463/karen_cgss_voice_200463_1_06.wav
+/home/ubuntu/respair/data_cache/Final_Persian/احمد پوری/6fec69f8-4c30-4061-a516-025768b09302/6fec69f8-4c30-4061-a516-025768b09302_chunk443.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/مریم محبوب/b3d13507-b03f-41c8-ace2-62f47fd9077f/b3d13507-b03f-41c8-ace2-62f47fd9077f_chunk395.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/شيروفوبيا/شيروفوبيا_chunk730.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/نون/نون_chunk1170.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Джек Лондон - Конец сказки/Джек_speaker_SPEAKER_00/Джек_speaker_SPEAKER_00_chunk37.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Патрик Несс - Поступь Хаоса_part_002/Патр_speaker_SPEAKER_00/Патр_speaker_SPEAKER_00_chunk50.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/#Debate： Are Men Finished and Should We Help Them？ Richard Reeves vs. Hanna Rosin [FlT5clM4WfA]/#Deb_speaker_SPEAKER_02/#Deb_speaker_SPEAKER_02_chunk18.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/sawashiro_miyuki/Sawashiro_Miyuki_03/Sawashiro_Miyuki_03_chunk1018.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Кейт Лаумер - Король города/Кейт_speaker_SPEAKER_02/Кейт_speaker_SPEAKER_02_chunk1248.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/شهيا كفراق/شهيا كفراق_chunk801.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أبابيل/أبابيل_chunk1144.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Костюченко – история современной России ⧸ вДудь [CobxH2gH4pM]/Кост_speaker_SPEAKER_05/Кост_speaker_SPEAKER_05_chunk2022.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/رضا عمرانی/f9c885e4-adf2-41f5-9d1f-e795f9a11fcc/f9c885e4-adf2-41f5-9d1f-e795f9a11fcc_chunk260.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/#1 АВТОТРЁП. Первые отношения, первый поцелуй, первый секс и личные границы [3wGtRRPTJOc]/#1 А_speaker_SPEAKER_02/#1 А_speaker_SPEAKER_02_chunk162.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/فریناز ثریا/d0cc8097-cbae-428f-a050-270596451802/d0cc8097-cbae-428f-a050-270596451802_chunk198.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Анна Джейн_12/Анна Джейн_12_chunk220.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أسيرة الحب/أسيرة الحب_chunk1310.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/irina/dataset_Yakutenko_Irina_10h_44100_16bit_mono/dataset_Yakutenko_Irina_10h_44100_16bit_mono_chunk5336.wav
+/home/ubuntu/respair/data_cache/Final_Persian/مهرانه امروانی/56697d4e-f417-4872-b1c5-b5186a9989be/56697d4e-f417-4872-b1c5-b5186a9989be_chunk24.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Алексей Калугин - Лабиринт 3 - Мир без солнца_part_000/Алек_speaker_SPEAKER_00/Алек_speaker_SPEAKER_00_chunk13.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/ساعد باقری/fd0ac02c-34f6-4ffc-a9bf-7c1baa2f95f6/fd0ac02c-34f6-4ffc-a9bf-7c1baa2f95f6_chunk721.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/frame_turner/MORGENSHTERN ‒  ЛИЗА, ГАЛЛЮЦИНАЦИИ, ДЕТСКИЕ ТРАВМЫ, ПРИЧИНА РАЗВОДА И СЕКРЕТ УСПЕХА [g1nVX1oPxHE]/MORG_speaker_SPEAKER_11/MORG_speaker_SPEAKER_11_chunk682.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/chiwa_saito/Chiwa_Saito_01/Chiwa_Saito_01_chunk1988_chunks/chunk_1.wav
+/home/ubuntu/respair/data_cache/Final_Persian/لیلا ولی پور/c2887b5a-e92a-46b5-8934-9c537c8d121f/c2887b5a-e92a-46b5-8934-9c537c8d121f_chunk150.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/سمعة شریفة/سمعة شریفة_chunk207.mp3
+/home/ubuntu/respair/jpn/moe/84be23bd/wav/84be23bd_0099.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Харлан Эллисон - Бегство к звёздам/Харл_speaker_SPEAKER_00/Харл_speaker_SPEAKER_00_chunk295.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/نزهة مارشال/نزهة مارشال_chunk918.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Debate： Are DEI Mandates for University Faculties a Bad Idea？ [eKay5lcv7Ic]/Deba_speaker_SPEAKER_03/Deba_speaker_SPEAKER_03_chunk37.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Маша Гессен – стыдные вопросы про Америку ⧸ вДудь [Q0oRii7zV9A]/Маша_speaker_SPEAKER_01/Маша_speaker_SPEAKER_01_chunk1001.mp3
+/home/ubuntu/respair/jpn/moe/9febd2ae/wav/9febd2ae_0483.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Брайдер Юрий - Против течения/Брай_speaker_SPEAKER_00/Брай_speaker_SPEAKER_00_chunk414.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/BG3 Voice Lines： Jaheira [r7HxfsGG0zo]/BG3 Voice Lines： Jaheira [r7HxfsGG0zo]_chunk4152.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/BG3 Voice Lines： Minsc [5wO9k1rgRcY]/BG3 Voice Lines： Minsc [5wO9k1rgRcY]_chunk121.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/بهار کاتوزی/eb02fc7d-bdfb-45a0-99ff-62bc5e1c0035/eb02fc7d-bdfb-45a0-99ff-62bc5e1c0035_chunk300.mp3
+/home/ubuntu/respair/jpn/moe/773a4156/wav/773a4156_0261.wav
+/home/ubuntu/respair/jpn/moe/8b6e7173/wav/8b6e7173_0839.wav
+/home/ubuntu/respair/jpn/moe/8b6e7173/wav/8b6e7173_1981.wav
+/home/ubuntu/respair/data_cache/Final_Persian/رضا عمرانی/c77d9712-8a2e-4b82-b096-7dca3886d08c/c77d9712-8a2e-4b82-b096-7dca3886d08c_chunk51.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/003/S003_F_0219.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/НУТРИЦИОЛОГ Мария Кардакова. Кето диета, питание на ГВ и дисбактериоз [790CGV-gcRg]/НУТР_speaker_SPEAKER_02/НУТР_speaker_SPEAKER_02_chunk151.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Gale/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_002/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_002_chunk3413.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Is Legalizing Marijuana a Mistake？ Live Debate [v_U4CxB0MlA]/Is L_speaker_SPEAKER_12/Is L_speaker_SPEAKER_12_chunk129.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/МАРКЕТОЛОГ. Личный бренд, продвижение в соцсетях и инфопродукты [b-nbsSigkKo]/МАРК_speaker_SPEAKER_01/МАРК_speaker_SPEAKER_01_chunk154_chunks/МАРК_speaker_SPEAKER_01_chunk154_chunk_2.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/اعظم حبیبی/8bf4e08c-28b4-4781-8b72-6ce2d8cdb714/8bf4e08c-28b4-4781-8b72-6ce2d8cdb714_chunk30.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/سمعة شریفة/سمعة شریفة_chunk330.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Conceptualization Voice Lines (Disco Elysium) [4cFbMy0snYQ]/Conceptualization Voice Lines (Disco Elysium) [4cFbMy0snYQ]_chunk1161.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/مدينة الحب لا يسكنها العقلاء/مدينة الحب لا يسكنها العقلاء_chunk1150.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/بهرام ابراهیمی/97fff66d-e81e-4e91-8782-9db5118ecbc7/97fff66d-e81e-4e91-8782-9db5118ecbc7_chunk24.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_podcast/Ylacombe_podcast_audio_1636.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_expresso/Ylacombe_Expresso_audio_11326_P3.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Сьюзен Коллинз 1 - Голодные игры_part_001/Сьюз_speaker_SPEAKER_00/Сьюз_speaker_SPEAKER_00_chunk583.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Клиффорд Саймак - Кукла судьбы_part_003/Клиф_speaker_SPEAKER_05/Клиф_speaker_SPEAKER_05_chunk1632.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Does the Effective Altruism Movement Get Giving Right？ [e1e_TUbRdlA]/Does_speaker_SPEAKER_02/Does_speaker_SPEAKER_02_chunk364.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/sakura_moyu/01/01011190.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/في ديسمبر تنتهي كل الأحلام/في ديسمبر تنتهي كل الأحلام_chunk1404.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/علامات الحب السبعة/علامات الحب السبعة_chunk1041.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_6750.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Гордон - Украина, Россия, Ukraine, Russia (English subs) [in7tepc2shg]/Горд_speaker_SPEAKER_03/Горд_speaker_SPEAKER_03_chunk170.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Astrion/BG3 Voice Lines： Astarion (part 1) [THs2r-xB-Rw]_part_000/BG3 Voice Lines： Astarion (part 1) [THs2r-xB-Rw]_part_000_chunk277.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أرغبه رجلا  يا أبي/أرغبه رجلا  يا أبي_chunk302.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/nagi/nagi_cgss/nagi_chara_309/nagi_voice_309_4_13.wav
+/home/ubuntu/respair/data_cache/Final_Persian/شهرزاد عالی/4c413c0b-ed80-4d4a-95c4-21147a612d8a/4c413c0b-ed80-4d4a-95c4-21147a612d8a_chunk56.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Этногенез - Маруся 3_part_001/Этно_speaker_SPEAKER_05/Этно_speaker_SPEAKER_05_chunk295.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/ساعد باقری/b842c75e-7251-441c-852d-fc8cc5c20558/b842c75e-7251-441c-852d-fc8cc5c20558_chunk282.mp3
+/home/ubuntu/respair/jpn/moe/b8b5fe66/wav/b8b5fe66_1892.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_expresso/Ylacombe_Expresso_audio_8528_P3.wav
+/home/ubuntu/respair/data_cache/Final_Persian/اطهر کلانتری/e9d04f1c-5687-422e-8ab7-4db6e95fd8b4/e9d04f1c-5687-422e-8ab7-4db6e95fd8b4_chunk176.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/013/S013_A_0244.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/دفتر الغربة/دفتر الغربة_chunk920.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Сергей Супонев - друг всех детей ⧸ вДудь [ckyW08MpmHs]/Серг_speaker_SPEAKER_07/Серг_speaker_SPEAKER_07_chunk84.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Karlach/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_002/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_002_chunk2517.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_1754.wav
+/home/ubuntu/respair/data_cache/Final_Persian/نازنین آذرسا/3b014b6b-29ee-4ae1-846e-f889cdd2206b/3b014b6b-29ee-4ae1-846e-f889cdd2206b_chunk120.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Владимир Яценко - Старик и дети/Влад_speaker_SPEAKER_00/Влад_speaker_SPEAKER_00_chunk278.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/لأنها استثناء/لأنها استثناء_chunk347.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/frederica/fredrica_cgss/fredrica_card_100747/fredrica_voice_100747_1_11.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/يا سلمى أنا الآن وحيد  /يا سلمى أنا الآن وحيد  _chunk798.mp3
+/home/ubuntu/respair/jpn/moe/6d565f54/wav/6d565f54_1248.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/BG3 Voice Lines： Minsc [5wO9k1rgRcY]/BG3 Voice Lines： Minsc [5wO9k1rgRcY]_chunk3356.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/اشکان عقیلی پور/ef422f57-99b8-40cd-8e22-553025f09d3d/ef422f57-99b8-40cd-8e22-553025f09d3d_chunk131.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Джек Андерсон - Игра в лево-право/Джек_speaker_SPEAKER_04/Джек_speaker_SPEAKER_04_chunk4173.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/الميلاد/الميلاد_chunk595.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/Taiga/Taiga_rus_dataset_audio_5866.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Сьюзен Коллинз 1 - Голодные игры_part_001/Сьюз_speaker_SPEAKER_00/Сьюз_speaker_SPEAKER_00_chunk1319.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/sawashiro_miyuki/Sawashiro_Miyuki_03/Sawashiro_Miyuki_03_chunk752.wav
+/home/ubuntu/respair/data_cache/Final_Persian/بهراد رضازاده/5e04ac82-5ecf-4af5-976f-7fa319e5926d/5e04ac82-5ecf-4af5-976f-7fa319e5926d_chunk187.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/امیررضا علی زاده/d17ab7bd-ebb2-4442-9730-e84726cb90a4/d17ab7bd-ebb2-4442-9730-e84726cb90a4_chunk88.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ذئاب لا تغفر/ذئاب لا تغفر_chunk1130.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Karlach/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_001/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_001_chunk2549.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/عشقني عفريت من الجن/عشقني عفريت من الجن_chunk303.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Authority Voice Lines (Disco Elysium) [lsWdvLZ9Wac]/Authority Voice Lines (Disco Elysium) [lsWdvLZ9Wac]_chunk363.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/مرضیه رحماندوست/3f460bef-ebe3-4407-89ec-61d7956b8d4c/3f460bef-ebe3-4407-89ec-61d7956b8d4c_chunk204.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/فوضى الحواس/فوضى الحواس_chunk1030.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/كلب عائلة باسكرفيل/كلب عائلة باسكرفيل_chunk1217.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/АЛЕКСАНДР ПАНЧИН. Агностики, соционика и вакцины от коронавируса [PeS8Bh9vizI]/АЛЕК_speaker_SPEAKER_00/АЛЕК_speaker_SPEAKER_00_chunk452.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/ساعد باقری/a37f3bf0-3061-4cd7-a2df-446e507439dc/a37f3bf0-3061-4cd7-a2df-446e507439dc_chunk460.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/BG3 Voice Lines： Jaheira [r7HxfsGG0zo]/BG3 Voice Lines： Jaheira [r7HxfsGG0zo]_chunk6181.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/sawashiro_miyuki/Sawashiro_Miyuki_02/Sawashiro_Miyuki_02_chunk489.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/السكابندو وقصص أخرى/السكابندو وقصص أخرى_chunk225.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/حامد فعال/863f0f5f-7f71-4d7a-b286-0587b223d7bf/863f0f5f-7f71-4d7a-b286-0587b223d7bf_chunk214.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/شوق الدرويش/شوق الدرويش_chunk1194.mp3
+/home/ubuntu/respair/jpn/moe/ee093a4f/wav/ee093a4f_1537.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ЛОГОПЕД. Развитие речи, постановка звуков, массаж и подрезание уздечки [ra3U7s-VZzI]/ЛОГО_speaker_SPEAKER_00/ЛОГО_speaker_SPEAKER_00_chunk921.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/کاوه فولادی نسب/4152c4fa-1b13-4854-8e48-fb7914bdea8f/4152c4fa-1b13-4854-8e48-fb7914bdea8f_chunk100.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/سيدة في خدمتك/سيدة في خدمتك_chunk850.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/فاطمه کمالی/180ad9ff-c82a-45ff-9b34-8d62c4d142fb/180ad9ff-c82a-45ff-9b34-8d62c4d142fb_chunk343.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_podcast/Ylacombe_podcast_audio_1060_P3.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/Syuuko/Syuuko_Events_and_Card/Card_Commyuu/Work_Comyu/Work_Comyu_chunk55.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Джейн_Анна_15/Джейн_Анна_15_chunk107.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/حسین تسلیمی/f723254c-afd5-45b9-bb2d-f6e24f1d0a69/f723254c-afd5-45b9-bb2d-f6e24f1d0a69_chunk416.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/لاله اکبری/ff57cb36-b8db-4039-bd12-7c37e6011f80/ff57cb36-b8db-4039-bd12-7c37e6011f80_chunk74.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Morell, the Cryptozoologist Voice Lines (Disco Elysium) [O-ESHKnBNGo]/Morell, the Cryptozoologist Voice Lines (Disco Elysium) [O-ESHKnBNGo]_chunk355.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/بئر الحرمان/بئر الحرمان_chunk1537.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/frame_turner/MORGENSHTERN ‒  ЛИЗА, ГАЛЛЮЦИНАЦИИ, ДЕТСКИЕ ТРАВМЫ, ПРИЧИНА РАЗВОДА И СЕКРЕТ УСПЕХА [g1nVX1oPxHE]/MORG_speaker_SPEAKER_02/MORG_speaker_SPEAKER_02_chunk1023.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/إحدى عشرة دقيقة/إحدى عشرة دقيقة_chunk451.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/قدري أنت/قدري أنت_chunk36.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Джейн_Анна_04/Джейн_Анна_04_chunk118.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/shinichiro_miki/Shinichiro_Miki__01/Shinichiro_Miki__01_chunk270.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Лошак – как оставаться журналистом ⧸ Loshak – how to stay a journalist [PWt27h_scaY]/Лоша_speaker_SPEAKER_04/Лоша_speaker_SPEAKER_04_chunk299.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Debate： Is Wokeness Killing Comedy？ Live - Lou Perez vs. Michael Ian Black [J4Vb53s4I0A]/Deba_speaker_SPEAKER_06/Deba_speaker_SPEAKER_06_chunk23.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أنشودة المقهى الحزين/أ��شودة المقهى الحزين_chunk204.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/تارا تیمورزاده/ac11ca31-2fc5-498c-8c94-5bcd49a76fdb/ac11ca31-2fc5-498c-8c94-5bcd49a76fdb_chunk410.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Анна Джейн_21/Анна Джейн_21_chunk358.mp3
+/home/ubuntu/respair/jpn/moe/ad28b91b/wav/ad28b91b_2228.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/سوف أحكي عنك /سوف أحكي عنك _chunk297.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/whispering_chunks/ASMR - JANUARY 2023 - Monthly Favourites [9rv-PFYRAho]/ASMR - JANUARY 2023 - Monthly Favourites [9rv-PFYRAho]_chunk280.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Evrart Claire Voice Lines (Disco Elysium) [3fyCrwXUM3c]/Evrart Claire Voice Lines (Disco Elysium) [3fyCrwXUM3c]_chunk1318.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Karlach/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_001/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_001_chunk2221.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/004/S004_E_0006.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_001/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_001_chunk16.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Should Courts, Not Campuses, Decide Sexual Assault Cases？ [XdH7X9i5NpM]/Shou_speaker_SPEAKER_05/Shou_speaker_SPEAKER_05_chunk63_chunks/Shou_speaker_SPEAKER_05_chunk63_chunk_1.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/آرش راسخ/af8053f2-6a13-4c77-a2a4-c6b01997d6f6/af8053f2-6a13-4c77-a2a4-c6b01997d6f6_chunk509.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Алексей Калугин - Подмененный 3 - Осколки реальности_part_000/Алек_speaker_SPEAKER_03/Алек_speaker_SPEAKER_03_chunk18.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/shadow_heart/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_000/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_000_chunk2321.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/نازنین آذرسا/50c24690-436c-475c-93ec-ded918f2f09e/50c24690-436c-475c-93ec-ded918f2f09e_chunk252.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ГЕШТАЛЬТ ТЕРАПИЯ и осознанность в эмоциях. Как незакрытый гештальт переходит в невроз [_EXkjzgfCi8]/ГЕШТ_speaker_SPEAKER_02/ГЕШТ_speaker_SPEAKER_02_chunk42.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أوراق الورد/أوراق الورد_chunk440.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/СЕМЕЙНЫЙ ПСИХОЛОГ. Развод, абьюз и феминизм. Сохранять ли брак ради ребёнка？ [AeKXCnoEKSA]/СЕМЕ_speaker_SPEAKER_04/СЕМЕ_speaker_SPEAKER_04_chunk760.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/frame_turner/ЯНЧИК ‒  ГОЛОСА В ГОЛОВЕ, СТРАХ ОШИБОК, ОКР И ВЫЖИВАНИЕ В ЛЕСУ [czFc_d2tp8I]/ЯНЧИ_speaker_SPEAKER_06/ЯНЧИ_speaker_SPEAKER_06_chunk993.mp3
+/home/ubuntu/respair/jpn/moe/1a5a3db8/wav/1a5a3db8_0215.wav
+/home/ubuntu/respair/jpn/moe/6d565f54/wav/6d565f54_1467.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/shiburin/shiburin_cgss/shiburin_card_200071/shiburin_voice_200071_2_11.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Сьюзен Коллинз 1 - Голодные игры_part_002/Сьюз_speaker_SPEAKER_00/Сьюз_speaker_SPEAKER_00_chunk717.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/إيفوريا/إيفوريا_chunk1102.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Laezel/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_002/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_002_chunk37.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Global Leaders Debate Money, Truth, and Power [ygW1PsuaipY]/Glob_speaker_SPEAKER_07/Glob_speaker_SPEAKER_07_chunk34.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/حسناء في المستنقع/حسناء في المستنقع_chunk709.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/صياد النسيم/صياد النسيم_chunk1384.mp3
+/home/ubuntu/respair/jpn/moe/5d68aedf/wav/5d68aedf_1891.wav
+/home/ubuntu/respair/data_cache/Final_Persian/اشکان عقیلی پور/642bad82-6b0b-474d-b989-b0508cb76adf/642bad82-6b0b-474d-b989-b0508cb76adf_chunk83.mp3
+/home/ubuntu/respair/jpn/moe/5d68aedf/wav/5d68aedf_1025.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/شوق الدرويش/شوق الدرويش_chunk504.mp3
+/home/ubuntu/respair/jpn/moe/df6c208e/wav/df6c208e_1504.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/العذراء والشعر الأبيض/العذراء والشعر الأبيض_chunk186.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/گلاره عباسی/bb4764d9-a6bb-44e5-b80d-05033943ea22/bb4764d9-a6bb-44e5-b80d-05033943ea22_chunk25.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Astrion/BG3 Voice Lines： Astarion (part 1) [THs2r-xB-Rw]_part_001/BG3 Voice Lines： Astarion (part 1) [THs2r-xB-Rw]_part_001_chunk15.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/أيام فاتت/أيام فاتت_chunk669.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/گلچهر دامغانی/ed978bcb-b73c-43b9-8feb-eedb63c9a006/ed978bcb-b73c-43b9-8feb-eedb63c9a006_chunk951.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/مرضیه رحماندوست/a0e913cd-32e4-4410-a613-196de8204050/a0e913cd-32e4-4410-a613-196de8204050_chunk12.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/001/S001_F_0129.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/shadow_heart/BG3 Voice Lines： Shadowheart (part 2) [PoureCLZNxg]/BG3 Voice Lines： Shadowheart (part 2) [PoureCLZNxg]_chunk2395.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ЖИЗНЬ С ШИЗОФРЕНИЕЙ-2. Aline in Wonderland. Принудительная госпитализация [iTysDG98Tw8]/ЖИЗН_speaker_SPEAKER_01/ЖИЗН_speaker_SPEAKER_01_chunk699.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/شقایق خاکی پور/d8ade414-0f5a-4333-a9f5-89895d617e4a/d8ade414-0f5a-4333-a9f5-89895d617e4a_chunk631.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ДОКТОР УТИН. Кофе и сердце, что такое инфаркт, как правильно измерять давление [uXgDhDdDW2g]/ДОКТ_speaker_SPEAKER_04/ДОКТ_speaker_SPEAKER_04_chunk129.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ПОДРОСТОК о СЕКСЕ. Надо ли родителям разговаривать с детьми？ Проблемы в школах [Wo3ZqS01R2w]/ПОДР_speaker_SPEAKER_04/ПОДР_speaker_SPEAKER_04_chunk121.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/سايكو 2/سايكو 2_chunk494.mp3
+/home/ubuntu/respair/jpn/moe/9febd2ae/wav/9febd2ae_0753.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/horie_yui/Horie_Yui_02/Horie_Yui_02_chunk184.wav
+/home/ubuntu/respair/jpn/moe/449d5a0a/wav/449d5a0a_0949.wav
+/home/ubuntu/respair/jpn/moe/95c3bdd8/wav/95c3bdd8_0871.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/لكنك لن تعرفي/لكنك لن تعرفي_chunk650.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Степанова_41/Степанова_41_chunk1.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/شیكولاتة بیضاء/شیكولاتة بیضاء_chunk402.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/Kanade/Kanade_voice_home_shinaido_room/kanade_card_200580/kanade_voice_200580_6_05.wav
+/home/ubuntu/respair/data_cache/Final_Persian/نازنین آذرسا/b3aa3650-ab3d-4fef-8c43-76abac9ee044/b3aa3650-ab3d-4fef-8c43-76abac9ee044_chunk148.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ДОКТОР УТИН. Кофе и сердце, что такое инфаркт, как правильно измерять давление [uXgDhDdDW2g]/ДОКТ_speaker_SPEAKER_02/ДОКТ_speaker_SPEAKER_02_chunk451.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Степанова_40/Степанова_40_chunk43.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/مصطفی هرآیینی/e4cc5f9b-523f-49d4-88a3-e432c19fdadb/e4cc5f9b-523f-49d4-88a3-e432c19fdadb_chunk105.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Should Courts, Not Campuses, Decide Sexual Assault Cases？ [XdH7X9i5NpM]/Shou_speaker_SPEAKER_05/Shou_speaker_SPEAKER_05_chunk58.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/sakura_moyu/05/05000390.wav
+/home/ubuntu/respair/jpn/moe/1cc3c6c0/wav/1cc3c6c0_0223.wav
+/home/ubuntu/respair/jpn/moe/cbe5080e/wav/cbe5080e_0793.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/سيدة في خدمتك/سيدة في خدمتك_chunk999.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Agree-to-Disagree： Is True Love a Myth？ [78PXedWyBAA]/Agre_speaker_SPEAKER_02/Agre_speaker_SPEAKER_02_chunk27.wav
+/home/ubuntu/respair/jpn/moe/bc778ddb/wav/bc778ddb_0956.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ما تخبئه لنا النجوم/ما تخبئه لنا النجوم_chunk570.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/شهین دخت نجف زاده/d65e3143-dd32-4720-816f-7cbd92fd8bac/d65e3143-dd32-4720-816f-7cbd92fd8bac_chunk98.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/راضیه هاشمی/4d542086-331f-4f79-902f-9e27e5e5217d/4d542086-331f-4f79-902f-9e27e5e5217d_chunk439.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/شیكولاتة بیضاء/شیكولاتة بیضاء_chunk471.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Composure Voice Lines (Disco Elysium) [88ib4sPXm2Q]/Composure Voice Lines (Disco Elysium) [88ib4sPXm2Q]_chunk346.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/22khz/22khz/audiobook_rus_dataset_22khz_audio_12940.wav
+/home/ubuntu/respair/data_cache/Final_Persian/نرگس رحیمیان/acf1cb92-a813-4580-bf54-1544bd24410d/acf1cb92-a813-4580-bf54-1544bd24410d_chunk878.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/minami/minami_cgss/minami_card_201307/minami_voice_201307_2_02.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/بيت ح دد/بيت ح دد_chunk821.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/shinichiro_miki/Shinichiro_Miki_03/Shinichiro_Miki_03_chunk2211.wav
+/home/ubuntu/respair/data_cache/Final_Persian/مهبد قناعت پیشه/8542aeb6-372a-4dfe-970c-c8376bf2a8b6/8542aeb6-372a-4dfe-970c-c8376bf2a8b6_chunk43.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ردني إليك/ردني إليك_chunk365.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Shivers Voice Lines (Disco Elysium) [PgHIM3M1Al4]/Shivers Voice Lines (Disco Elysium) [PgHIM3M1Al4]_chunk1312.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/تقتلني أو أكتبها/تقتلني أو أكتبها_chunk1142.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/004/S004_C_0070.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/shadow_heart/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_001/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_001_chunk894.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/صفا آقاجانی/59968192-7770-4c9f-83ac-83ab686d5649/59968192-7770-4c9f-83ac-83ab686d5649_chunk111.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/مارال نوحی/98447c9c-684c-4043-8f67-95c2d8977053/98447c9c-684c-4043-8f67-95c2d8977053_chunk176.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/پژمان ابوالقاسمی/08226e7f-f4dc-4ba7-a71a-fd526e8572e2/08226e7f-f4dc-4ba7-a71a-fd526e8572e2_chunk717.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Debate： Is the FDA Too Cautious？ [FSkyfsTL_xw]/Deba_speaker_SPEAKER_03/Deba_speaker_SPEAKER_03_chunk90.wav
+/home/ubuntu/respair/data_cache/Final_Persian/یاسر دعاگو/c2baaef2-faaa-4110-903e-1c5e422a13b1/c2baaef2-faaa-4110-903e-1c5e422a13b1_chunk658.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/باريس بلا ايفل/باريس بلا ايفل_chunk592.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Сергей Павин - Лавка песочных часов/Серг_speaker_SPEAKER_00/Серг_speaker_SPEAKER_00_chunk139.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/Taiga/Taiga_rus_dataset_audio_7198.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/بلاد الطاخ طاخ/بلاد الطاخ طاخ_chunk1234.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/شقایق خاکی پور/d528184f-99d0-4136-99a1-3eab3c4a4166/d528184f-99d0-4136-99a1-3eab3c4a4166_chunk161.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Степанова_16/Степанова_16_chunk39.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/لن أنسى/لن أنسى_chunk540.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/frame_turner/ЯНЧИК ‒  ГОЛОСА В ГОЛОВЕ, СТРАХ ОШИБОК, ОКР И ВЫЖИВАНИЕ В ЛЕСУ [czFc_d2tp8I]/ЯНЧИ_speaker_SPEAKER_07/ЯНЧИ_speaker_SPEAKER_07_chunk94.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/sakura_moyu/01/01014470.wav
+/home/ubuntu/respair/data_cache/Final_Persian/بابک مینایی/a519dfd7-140c-4537-bd63-8b71bb70845b/a519dfd7-140c-4537-bd63-8b71bb70845b_chunk114.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/رقصة المرمر/رقصة المرمر_chunk1366.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/سأقذف نفسي أمامك/سأقذف نفسي أمامك_chunk722.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/Taiga/Taiga_rus_dataset_audio_3655.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/خبايا العرب/خبايا العرب_chunk1176.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Клиффорд Саймак - Кукла судьбы_part_003/Клиф_speaker_SPEAKER_05/Клиф_speaker_SPEAKER_05_chunk1177.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/سألقاك هناك/سألقاك هناك_chunk1101.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Glava_03/Glava_03_chunk562.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_6555.wav
+/home/ubuntu/respair/data_cache/Final_Persian/تارا تیمورزاده/ad22083b-b26c-4b6e-9908-3faefdbc298f/ad22083b-b26c-4b6e-9908-3faefdbc298f_chunk364.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/ranko/ranko_cgss/ranko_card_200097/ranko_voice_200097_1_09.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/ولد قليل الأدب/ولد قليل الأدب_chunk1820.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Laezel/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_003/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_003_chunk344.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/shadow_heart/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_001/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_001_chunk631.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/محمد امرایی/0f6832d4-b027-4fba-bcd6-5ef85242bd99/0f6832d4-b027-4fba-bcd6-5ef85242bd99_chunk230.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أنا سنية و أنت شيعي/أنا سنية و أنت شيعي_chunk641.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ПЕРИНАТАЛЬНЫЙ ПСИХОЛОГ. Про тикающие часики, ЭКО и аборты. Как пережить потерю ребенка [qhxe6nZ4p4E]/ПЕРИ_speaker_SPEAKER_02/ПЕРИ_speaker_SPEAKER_02_chunk844.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/22khz/22khz/audiobook_rus_dataset_22khz_audio_7589.wav
+/home/ubuntu/respair/data_cache/Final_Persian/مهدی صفری/48094592-83d7-4ced-a375-29a7f1a348fe/48094592-83d7-4ced-a375-29a7f1a348fe_chunk260.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/الیاس گرجی/9e40cee4-7270-44f9-8264-052106027a01/9e40cee4-7270-44f9-8264-052106027a01_chunk81.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Лошак – как оставаться журналистом ⧸ Loshak – how to stay a journalist [PWt27h_scaY]/Лоша_speaker_SPEAKER_03/Лоша_speaker_SPEAKER_03_chunk238.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Jean Vicquemare Voice Lines (Disco Elysium) [z_7OvqdkmKI]/Jean Vicquemare Voice Lines (Disco Elysium) [z_7OvqdkmKI]_chunk54.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/اللعبة/اللعبة_chunk520.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/السكابندو وقصص أخرى/السكابندو وقصص أخرى_chunk1226.mp3
+/home/ubuntu/respair/jpn/moe/46d6bf83/wav/46d6bf83_1389.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/قصص الكتب الخمسة/قصص الكتب الخمسة_chunk253.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/یاسر دعاگو/33a8dea0-1d4c-4e08-9097-3f3906a7b488/33a8dea0-1d4c-4e08-9097-3f3906a7b488_chunk370.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/sawashiro_miyuki/Sawashiro_Miyuki_02/Sawashiro_Miyuki_02_chunk1671.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Karlach/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_001/BG3 Voice Lines： Karlach [Enn8zDfS6Es]_part_001_chunk211.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/فاطمه کمالی/9046daac-a4ae-4879-b7a0-1f99a8ea757f/9046daac-a4ae-4879-b7a0-1f99a8ea757f_chunk11.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/إفطار عند تيفاني/إفطار عند تيفاني_chunk1416.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Neha, the Novelty Dicemaker Voice Lines (Disco Elysium) [bSZCBFjQOfo]/Neha, the Novelty Dicemaker Voice Lines (Disco Elysium) [bSZCBFjQOfo]_chunk209.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/saori/merged_vocals_chunk678.wav
+/home/ubuntu/respair/jpn/moe/00163dc9/wav/00163dc9_1552.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Кеннет Балмер - Страна которой нет на карте/Кенн_speaker_SPEAKER_01/Кенн_speaker_SPEAKER_01_chunk3664.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/آزاده رادمهر/f431b0f5-133a-406f-b8a6-cb42c507ca5d/f431b0f5-133a-406f-b8a6-cb42c507ca5d_chunk134.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Пол Бэттейджер - Ледяной ад/Пол _speaker_SPEAKER_01/Пол _speaker_SPEAKER_01_chunk564.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/راما قویدل/944535f5-bf56-441d-805a-a48f6fddfc60/944535f5-bf56-441d-805a-a48f6fddfc60_chunk95.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/رضا عمرانی/f2eb7ae4-7e24-45ba-8912-abe6273107bb/f2eb7ae4-7e24-45ba-8912-abe6273107bb_chunk430.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Unresolved： The Iran Threat [rdRcyieKBVE]/Unre_speaker_SPEAKER_08/Unre_speaker_SPEAKER_08_chunk156.wav
+/home/ubuntu/respair/data_cache/Final_Persian/مرضیه رحماندوست/981c9d9c-0da8-449c-b826-5ba6ea45311d/981c9d9c-0da8-449c-b826-5ba6ea45311d_chunk135.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_15398.wav
+/home/ubuntu/respair/data_cache/Final_Persian/یاسین ولی نژاد/a6df8917-be49-4e7f-a52a-3e69b65fdeb6/a6df8917-be49-4e7f-a52a-3e69b65fdeb6_chunk14_chunks/a6df8917-be49-4e7f-a52a-3e69b65fdeb6_chunk14_chunk_3.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/ليثيوم/ليثيوم_chunk735.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Анна Джейн_19/Анна Джейн_19_chunk8.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Laezel/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_002/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_002_chunk1108.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/frame_turner/MARCELO MIRACLES - 200.000.000 НА ОДЕЖДЕ, МАГАЗИН В ПАРИЖЕ, ПРОДАЖА ТРАВЫ И МИФЫ О ПСИХОЛОГАХ [C9d8v1bv8Sw]/MARC_speaker_SPEAKER_09/MARC_speaker_SPEAKER_09_chunk245.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Брэндон Сандерсон - Стоп-кадр/Брэн_speaker_SPEAKER_01/Брэн_speaker_SPEAKER_01_chunk353.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/یاشار ابراهیمی/e7181295-35ad-4953-a64d-de56a2cdd063/e7181295-35ad-4953-a64d-de56a2cdd063_chunk171.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_17443.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/بره الدنيا/بره الدنيا_chunk386.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/shadow_heart/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_001/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_001_chunk837.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/رفقاء الليل/رفقاء الليل_chunk494.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/مكتوب/مكتوب_chunk468.mp3
+/home/ubuntu/respair/jpn/moe/18460462/wav/18460462_2321.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ولك العودة/ولك العودة_chunk825.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Этногенез - Маруся 3_part_003/Этно_speaker_SPEAKER_02/Этно_speaker_SPEAKER_02_chunk1223.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/malady/Baldur's Gate 3 Voice Lines： The Narrator [BcdezgUEnLM]/Baldur's Gate 3 Voice Lines： The Narrator [BcdezgUEnLM]_chunk868.mp3
+/home/ubuntu/respair/jpn/moe/8b6e7173/wav/8b6e7173_0246.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/إليك قلبي/إليك قلبي_chunk818.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Артем Каменистый - Практикантка_part_003/Арте_speaker_SPEAKER_00/Арте_speaker_SPEAKER_00_chunk0.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/22khz/22khz/audiobook_rus_dataset_22khz_audio_982.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/روح/روح_chunk867.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/پویا پورهمدانی/01d03ce5-d53e-4dad-bf21-78afca9f0183/01d03ce5-d53e-4dad-bf21-78afca9f0183_chunk361.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/fumika/fumika_cgss/fumika_card_200282/fumika_voice_200282_2_09.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/مطلوب حبيب/مطلوب حبيب_chunk937.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Laezel/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_000/BG3 Voice Lines： Lae'zel [q-Z-9hfSirg]_part_000_chunk1623.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/shadow_heart/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_002/BG3 Voice Lines： Shadowheart (part 1) [u95hd47w8pM]_part_002_chunk616.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/أكوان/أكوان_chunk12.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_16020.wav
+/home/ubuntu/respair/data_cache/Final_Persian/ونوس صفری/5e65388c-dd61-4f0c-a7c2-af511dc4b401/5e65388c-dd61-4f0c-a7c2-af511dc4b401_chunk0_chunks/5e65388c-dd61-4f0c-a7c2-af511dc4b401_chunk0_chunk_3.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/شهرزاد عالی/c332cbcf-3eee-4f81-a168-2f3c032dfa4f/c332cbcf-3eee-4f81-a168-2f3c032dfa4f_chunk142.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/sakurai_takahiro/Sakurai_Takahiro_02/Sakurai_Takahiro_02_chunk1544.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Debate： Will AI Kill the Future of the Creative Arts？ Jonathan Taplin vs. Rebecca Fiebrink [J5cz-v0j3D0]/Deba_speaker_SPEAKER_00/Deba_speaker_SPEAKER_00_chunk90.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/usamin/usamin_mobamas/usamin_mobamasu_0007/usamin_mobamasu_0007_chunk15.wav
+/home/ubuntu/respair/data_cache/Final_Persian/ساعد باقری/b240e95c-208a-4bb9-8e14-ef924efa9047/b240e95c-208a-4bb9-8e14-ef924efa9047_chunk431.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/009/S009_A_0055.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Клиффорд Саймак - Кукла судьбы_part_002/Клиф_speaker_SPEAKER_04/Клиф_speaker_SPEAKER_04_chunk69.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/МАРКЕТОЛОГ. Личный бренд, продвижение в соцсетях и инфопродукты [b-nbsSigkKo]/МАРК_speaker_SPEAKER_01/МАРК_speaker_SPEAKER_01_chunk194.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_8349.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_expresso/Ylacombe_Expresso_audio_10948_P3.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/shinichiro_miki/Shinichiro_Miki_03/Shinichiro_Miki_03_chunk2008.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Брайдер Юрий - Против течения/Брай_speaker_SPEAKER_00/Брай_speaker_SPEAKER_00_chunk92.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/Syuuko/Syuuko_Mobamas/Syuko Voice/【モバマス】[シンデレラドリーム]塩見周子【ボイス集】 - Niconico Video/【モバマス】[シンデレラドリーム]塩見周子【ボイス集】 - Niconico Video_chunk12.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/مجدولين/مجدولين_chunk361.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أهواك/أهواك_chunk1278.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Cuno Voice Lines (Disco Elysium) [GI3nSMhAHgU]/Cuno Voice Lines (Disco Elysium) [GI3nSMhAHgU]_chunk235.mp3
+/home/ubuntu/respair/jpn/moe/bbd90363/wav/bbd90363_1058.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_17836.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Gale/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_003/BG3 Voice Lines��� Gale [CpasYgOyyl4]_part_003_chunk3147.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Анна Джейн_18/Анна Джейн_18_chunk25.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/horie_yui/Horie_Yui_03/Horie_Yui_03_chunk582.wav
+/home/ubuntu/respair/jpn/moe/46d6bf83/wav/46d6bf83_0757.wav
+/home/ubuntu/respair/jpn/moe/8b6e7173/wav/8b6e7173_0888.wav
+/home/ubuntu/respair/data_cache/Final_Persian/مریم محبوب/7232519c-7ce3-45fb-9d4b-01fd9ddaef6e/7232519c-7ce3-45fb-9d4b-01fd9ddaef6e_chunk817.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Алексей Калугин - Лабиринт 3 - Мир без солнца_part_000/Алек_speaker_SPEAKER_00/Алек_speaker_SPEAKER_00_chunk67.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Logic Voice Lines (Disco Elysium) [01lD5K990NY]/Logic Voice Lines (Disco Elysium) [01lD5K990NY]_chunk675.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/002/S002_A_0633.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/الكرسي الهزاز/الكرسي الهزاز_chunk1063.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Debate： We Should Expand the Supreme Court [eb6o-mTZm4o]/Deba_speaker_SPEAKER_02/Deba_speaker_SPEAKER_02_chunk160.wav
+/home/ubuntu/respair/data_cache/Final_Persian/مهرداد محمدپور/7b29e20a-1fda-4c2c-897d-31024969a2ef/7b29e20a-1fda-4c2c-897d-31024969a2ef_chunk23.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/Kanade/Kanade_Events_and_Card/Kanade_Events/Monochrome_lily/Monochrome_lily_chunk245.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_003/Kim Kitsuragi Voice Lines (Disco Elyisum) [c5qHI57fkFE]_part_003_chunk180.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/الخيط الرفيع/الخيط الرفيع_chunk1325.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Egg Head Voice Lines (Disco Elysium) [jpEuRSw-R0U]/Egg Head Voice Lines (Disco Elysium) [jpEuRSw-R0U]_chunk76.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Open to Debate Mock Trial： Is Trump Guilty in the January 6th Case？ Lanny Davis vs Sara Azari [rN5klE6Ul_A]/Open_speaker_SPEAKER_00/Open_speaker_SPEAKER_00_chunk116.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Джек Андерсон - Игра в лево-право/Джек_speaker_SPEAKER_04/Джек_speaker_SPEAKER_04_chunk1898.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_1783.wav
+/home/ubuntu/respair/jpn/moe/00163dc9/wav/00163dc9_0264.wav
+/home/ubuntu/respair/data_cache/Final_Persian/رضا عمرانی/6809b0ed-aa4f-4ff2-a3e1-78825d4a7146/6809b0ed-aa4f-4ff2-a3e1-78825d4a7146_chunk325.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Сарко Де Рази - Украденный свет/Сарк_speaker_SPEAKER_00/Сарк_speaker_SPEAKER_00_chunk405.mp3
+/home/ubuntu/respair/jpn/moe/95c3bdd8/wav/95c3bdd8_2219.wav
+/home/ubuntu/respair/data_cache/Final_Persian/تینا میرکریمی/059a1c87-6624-4f75-98c8-f9f92c83fd9c/059a1c87-6624-4f75-98c8-f9f92c83fd9c_chunk238.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Парфенов - о преемнике, Серебренникове и мате ⧸ вДудь [t6i4ElZV1K0]/Парф_speaker_SPEAKER_04/Парф_speaker_SPEAKER_04_chunk83.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/عشقني عفريت من الجن/عشقني عفريت من الجن_chunk1010.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/محسن زرآبادی پور/e1013cd9-b7fc-4373-9060-404b3fff1e32/e1013cd9-b7fc-4373-9060-404b3fff1e32_chunk161.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/احسان چریکی/1cd3f6cb-2936-42dc-a5f9-f90591f00e96/1cd3f6cb-2936-42dc-a5f9-f90591f00e96_chunk85.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Gale/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_000/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_000_chunk1669.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/shinichiro_miki/Shinichiro_Miki__01/Shinichiro_Miki__01_chunk863.wav
+/home/ubuntu/respair/data_cache/Final_Persian/ساعد باقری/b842c75e-7251-441c-852d-fc8cc5c20558/b842c75e-7251-441c-852d-fc8cc5c20558_chunk800.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Этногенез - Маруся 3_part_003/Этно_speaker_SPEAKER_02/Этно_speaker_SPEAKER_02_chunk1007.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/ونوس صفری/ddcbcb63-4285-44d9-b305-700e86ae98a6/ddcbcb63-4285-44d9-b305-700e86ae98a6_chunk14_chunks/ddcbcb63-4285-44d9-b305-700e86ae98a6_chunk14_chunk_5.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Should Congress Stop Funding the War in Ukraine？ [rdtCyiKHtqE]/Shou_speaker_SPEAKER_01/Shou_speaker_SPEAKER_01_chunk12.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/МРАКОБЕСИЕ В ПСИХИАТРИИ. Ипохондрия, расстановки по Хеллингеру и холотропное дыхание [T-oKbZtgRN8]/МРАК_speaker_SPEAKER_01/МРАК_speaker_SPEAKER_01_chunk790.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/frame_turner/MORGENSHTERN ‒  ЛИЗА, ГАЛЛЮЦИНАЦИИ, ДЕТСКИЕ ТРАВМЫ, ПРИЧИНА РАЗВОДА И СЕКРЕТ УСПЕХА [g1nVX1oPxHE]/MORG_speaker_SPEAKER_02/MORG_speaker_SPEAKER_02_chunk2015.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ذاكرة الجسد/ذاكرة الجسد_chunk526.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/imas_split/mio/mio_honda_cgss/mio_honda_card_301000/mio_honda_voice_301000_1_12.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/ФАРМАЦЕВТ. Что подмешивают в БАДы？ Вакцина от коронавируса [IYPGDU8Am1I]/ФАРМ_speaker_SPEAKER_01/ФАРМ_speaker_SPEAKER_01_chunk21.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/Жизнь с БИПОЛЯРНЫМ РАССТРОЙСТВОМ. Депрессии, гипомании и смешанные фазы [aP1S8MK7lrI]/Жизн_speaker_SPEAKER_03/Жизн_speaker_SPEAKER_03_chunk199.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_podcast/Ylacombe_podcast_audio_183.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_podcast/Ylacombe_podcast_audio_810_P3.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_expresso/Ylacombe_Expresso_audio_1731_P3.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Esprit de Corps Voice Lines (Disco Elysium) [Dnzg0hMiPls]/Esprit de Corps Voice Lines (Disco Elysium) [Dnzg0hMiPls]_chunk439.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Анна Джейн_35/Анна Джейн_35_chunk203.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Fast Fashion： Shop or Stop？ [GluaE-_C0-Q]/Fast_speaker_SPEAKER_03/Fast_speaker_SPEAKER_03_chunk109.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/001/S001_C_0288.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Gale/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_001/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_001_chunk2855.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/011/S011_A_3111.wav
+/home/ubuntu/respair/jpn/soshy/Japanese/monogatari/monogatari_voices/monogatari_split/sakurai_takahiro/Sakurai_Takahiro_02/Sakurai_Takahiro_02_chunk1844.wav
+/home/ubuntu/respair/jpn/moe/917feebd/wav/917feebd_2407.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/#Debate： Is Florida Eating New York's Lunch？ Bill de Blasio vs. Reihan Salam [Poj2dDr3n-M]/#Deb_speaker_SPEAKER_07/#Deb_speaker_SPEAKER_07_chunk111.wav
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_podcast/Ylacombe_podcast_audio_2207_P2.wav
+/home/ubuntu/respair/data_cache/Final_Persian/حسن آزادی/ab1eea53-b347-42c1-8663-a4691bd04a1a/ab1eea53-b347-42c1-8663-a4691bd04a1a_chunk567.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/sakura_moyu/03/03013290.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/malady/Baldur's Gate 3 Voice Lines： The Narrator [BcdezgUEnLM]/Baldur's Gate 3 Voice Lines： The Narrator [BcdezgUEnLM]_chunk1527.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Limbic System Voice Lines (Disco Elysium) [ug5DR5ylSPc]/Limbic System Voice Lines (Disco Elysium) [ug5DR5ylSPc]_chunk302.mp3
+/home/ubuntu/respair/jpn/moe/9febd2ae/wav/9febd2ae_1198.wav
+/home/ubuntu/respair/data_cache/Final_Persian/محمد امرایی/a4c4b25a-d6b2-48e2-af9f-c3606a69eae0/a4c4b25a-d6b2-48e2-af9f-c3606a69eae0_chunk382.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/ساعد باقری/8ed4d9cb-ebf4-4f5e-8960-2024091c1b55/8ed4d9cb-ebf4-4f5e-8960-2024091c1b55_chunk482.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/هكذا تكلم الذئب/هكذا تكلم الذئب_chunk1004.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ليتنا لم نلتق/ليتنا لم نلتق_chunk1035.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/عشق في بلاد الجليد/عشق في بلاد الجليد_chunk585.mp3
+/home/ubuntu/respair/jpn/moe/ee093a4f/wav/ee093a4f_0084.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/inga/inga_clean/Glava_02/Glava_02_chunk273.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/003/S003_E_0015.wav
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/sychev/Жизнь с БИПОЛЯРНЫМ РАССТРОЙСТВОМ 2 типа. Урбанистика, TEDx и психоанализ [umei-N44qqI]/Жизн_speaker_SPEAKER_06/Жизн_speaker_SPEAKER_06_chunk388.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/شفاة صامتة/شفاة صامتة_chunk1274.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/ylac/ylacombe_podcast/Ylacombe_podcast_audio_5478.wav
+/home/ubuntu/respair/data_cache/Final_Persian/منصور ضابطیان/e15de6bb-d0c4-4b73-a72a-bfd153b92c9d/e15de6bb-d0c4-4b73-a72a-bfd153b92c9d_chunk42.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أنا سنية و أنت شيعي/أنا سنية و أنت شيعي_chunk887.mp3
+/home/ubuntu/respair/jpn/moe/4e2f4ba6/wav/4e2f4ba6_1288.wav
+/home/ubuntu/respair/data_cache/Final_Persian/تینا میرکریمی/aebfec67-14a2-4672-9f31-27cd3b7febc4/aebfec67-14a2-4672-9f31-27cd3b7febc4_chunk178.mp3
+/home/ubuntu/respair/jpn/moe/ad28b91b/wav/ad28b91b_1167.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Cuno Voice Lines (Disco Elysium) [GI3nSMhAHgU]/Cuno Voice Lines (Disco Elysium) [GI3nSMhAHgU]_chunk1663.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/احسان چریکی/ead295e2-d936-4425-89db-150aa5325763/ead295e2-d936-4425-89db-150aa5325763_chunk493.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/003/S003_C_0011.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/All Vicious Mockery Insults [QhA1NwgnFN8]/All Vicious Mockery Insults [QhA1NwgnFN8]_chunk1488.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/بنت الباشا/بنت الباشا_chunk726.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/BG3 Voice Lines： Jaheira [r7HxfsGG0zo]/BG3 Voice Lines： Jaheira [r7HxfsGG0zo]_chunk1383.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/debate_chunks/Will Kamala Harris or Donald Trump be Better for America？ [hfoSRFGNykQ]/Will_speaker_SPEAKER_04/Will_speaker_SPEAKER_04_chunk50.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/مريض لن انساه/مريض لن انساه_chunk1308.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Кейт Лаумер - Король города/Кейт_speaker_SPEAKER_02/Кейт_speaker_SPEAKER_02_chunk931.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/الحصان الشارد/الحصان الشارد_chunk555.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/22khz/22khz/audiobook_rus_dataset_22khz_audio_16379.wav
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Gale/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_000/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_000_chunk374.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Сергей и Марина Дьяченко - Vita Nostra_part_000/Серг_speaker_SPEAKER_01/Серг_speaker_SPEAKER_01_chunk21.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/BG3 Voice Lines： Minsc [5wO9k1rgRcY]/BG3 Voice Lines： Minsc [5wO9k1rgRcY]_chunk5377.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/wth_ids/22khz/22khz/audiobook_rus_dataset_22khz_audio_304.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/رقصة المرمر/رقصة المرمر_chunk738.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_18630.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/ظلال الكولوسيوم/ظلال الكولوسيوم_chunk619.mp3
+/home/ubuntu/respair/data_cache/English_Final/with_ids/Ani_speech/audio_12749.wav
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/أرجوك أعطني هذا الدواء/أرجوك أعطني هذا الدواء_chunk367.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/أنا في أنتظبارك/أنا في أنتظبارك_chunk448.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/حامد فعال/487218ea-d36f-421a-b03d-898cbc3b1bc8/487218ea-d36f-421a-b03d-898cbc3b1bc8_chunk141.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/امیرمحمد صمصامی/92dc1a19-f918-40a5-84ce-ae0ba60aa1e5/92dc1a19-f918-40a5-84ce-ae0ba60aa1e5_chunk229.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/تحت سقف واحد/تحت سقف واحد_chunk1215.mp3
+/home/ubuntu/respair/data_cache/Final_Persian/محمدرضا علی اکبری/f6e7c8b3-f5be-48cb-8a08-34691ab81af6/f6e7c8b3-f5be-48cb-8a08-34691ab81af6_chunk937.mp3
+/home/ubuntu/respair/jpn/soshy/Japanese/tsujido/vo/003/S003_A_0346.wav
+/home/ubuntu/respair/data_cache/Final_Persian/یاسر دعاگو/6f570bc1-d61d-4bee-ad9c-602c6197091c/6f570bc1-d61d-4bee-ad9c-602c6197091c_chunk408.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/انتحار حمار/انتحار حمار_chunk1353.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/وصال الروح/وصال الروح_chunk241.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Кеннет Балмер - Страна которой нет на карте/Кенн_speaker_SPEAKER_01/Кенн_speaker_SPEAKER_01_chunk398.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/النساء لهن أسنان بيضاء/النساء لهن أسنان بيضاء_chunk683.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/audiobooks_25P/Роберт Шекли - Носитель Инфекции/Робе_speaker_SPEAKER_00/Робе_speaker_SPEAKER_00_chunk742.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/BD3/BG3_Rest/Gale/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_001/BG3 Voice Lines： Gale [CpasYgOyyl4]_part_001_chunk2653.mp3
+/home/ubuntu/respair/data_cache/English_Final/no_ids/HF_temp/games/Disco/Ancient Reptilian Brain Voice Lines (Disco Elysium) [MOYMRFmEqcg]/Ancient Reptilian Brain Voice Lines (Disco Elysium) [MOYMRFmEqcg]_chunk82.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم القصص/٣٣ بلونة حب/٣٣ بلونة حب_chunk935.mp3
+/home/ubuntu/respair/data_cache/Final_Rusiki/no_ids/Ruski_scraped_chunks/youtube/vedud/Невзоров – о Фараоне и ориентации Милонова ⧸ Alexandr Nevzorov's big interview [zcjKJ7FHDLM]/Невз_speaker_SPEAKER_03/Невз_speaker_SPEAKER_03_chunk730.mp3
+/home/ubuntu/respair/data_cache/Arabic/Processed_chnks/مجموعة كتب صوتية Storytel قسم روايات رومانسية/م لك يوسف/م لك يوسف_chunk619.mp3

vocos/data/filelist2.train ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c912110b830ea4d3d5b7e6a6c3a5660d7c99a36cf2d5fb12033c8abce311b259
+size 90047319

vocos/logs/lightning_logs/version_24/config.yaml ADDED Viewed

	@@ -0,0 +1,152 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+      name: lightning_logs
+      version: null
+      log_graph: false
+      default_hp_metric: true
+      prefix: ''
+      sub_dir: null
+      logdir: null
+      comment: ''
+      purge_step: null
+      max_queue: 10
+      flush_secs: 120
+      filename_suffix: ''
+      write_to_disk: true
+      comet_config:
+        disabled: true
+  enable_checkpointing: true
+  callbacks:
+  - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    init_args:
+      logging_interval: null
+      log_momentum: false
+  - class_path: pytorch_lightning.callbacks.ModelSummary
+    init_args:
+      max_depth: 2
+  - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+    init_args:
+      dirpath: null
+      filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+      monitor: val_loss
+      verbose: false
+      save_last: true
+      save_top_k: 3
+      save_weights_only: false
+      mode: min
+      auto_insert_metric_name: true
+      every_n_train_steps: null
+      train_time_interval: null
+      every_n_epochs: null
+      save_on_train_epoch_end: null
+  - class_path: vocos.helpers.GradNormCallback
+  default_root_dir: null
+  gradient_clip_val: null
+  gradient_clip_algorithm: null
+  num_nodes: 1
+  num_processes: null
+  devices:
+  - 0
+  - 1
+  gpus: null
+  auto_select_gpus: false
+  tpu_cores: null
+  ipus: null
+  enable_progress_bar: true
+  overfit_batches: 0.0
+  track_grad_norm: -1
+  check_val_every_n_epoch: 1
+  fast_dev_run: false
+  accumulate_grad_batches: null
+  max_epochs: null
+  min_epochs: null
+  max_steps: 2000000
+  min_steps: null
+  max_time: null
+  limit_train_batches: null
+  limit_val_batches: 50
+  limit_test_batches: null
+  limit_predict_batches: null
+  val_check_interval: null
+  log_every_n_steps: 100
+  accelerator: gpu
+  strategy: ddp
+  sync_batchnorm: false
+  precision: 32
+  enable_model_summary: true
+  num_sanity_val_steps: 2
+  resume_from_checkpoint: null
+  profiler: null
+  benchmark: null
+  deterministic: null
+  reload_dataloaders_every_n_epochs: 0
+  auto_lr_find: false
+  replace_sampler_ddp: true
+  detect_anomaly: false
+  auto_scale_batch_size: false
+  plugins: null
+  amp_backend: native
+  amp_level: null
+  move_metrics_to_cpu: false
+  multiple_trainloader_mode: max_size_cycle
+  inference_mode: true
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 44100
+        n_fft: 2048
+        hop_length: 512
+        win_length: 2048
+        n_mels: 128
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 128
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+        layer_scale_init_value: null
+        adanorm_num_embeddings: null
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 2048
+        hop_length: 512
+        padding: center
+    sample_rate: 44100
+    initial_learning_rate: 0.0005
+    num_warmup_steps: 0
+    mel_loss_coeff: 45.0
+    mrd_loss_coeff: 0.1
+    pretrain_mel_steps: 0
+    decay_mel_coeff: false
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.train
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 58
+      num_workers: 8
+    val_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.val
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 16
+      num_workers: 8
+optimizer: null
+lr_scheduler: null

vocos/logs/lightning_logs/version_24/events.out.tfevents.1738102892.104-171-202-79 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dd6ece1c3c30eafe201be7ae47f1915108cbcaa4c5c86e5ca9a3cc0d73d08d12
+size 824

vocos/logs/lightning_logs/version_24/hparams.yaml ADDED Viewed

	@@ -0,0 +1,10 @@

+sample_rate: 44100
+initial_learning_rate: 0.0005
+num_warmup_steps: 0
+mel_loss_coeff: 45.0
+mrd_loss_coeff: 0.1
+pretrain_mel_steps: 0
+decay_mel_coeff: false
+evaluate_utmos: true
+evaluate_pesq: true
+evaluate_periodicty: true

vocos/logs/lightning_logs/version_25/checkpoints/last.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b5b8380daa833cc2e56b967c6eeab7c3d4afb2839a0ebcbf0e69ce2ef0caf82
+size 681716271

vocos/logs/lightning_logs/version_25/checkpoints/vocos_checkpoint_epoch=0_step=16634_val_loss=6.2461.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:47ff3d96147a65ce0868c0d5314dd5a47a644aa4849cb05d64c619294c91de86
+size 681715824

vocos/logs/lightning_logs/version_25/checkpoints/vocos_checkpoint_epoch=1_step=33268_val_loss=5.4846.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b5b8380daa833cc2e56b967c6eeab7c3d4afb2839a0ebcbf0e69ce2ef0caf82
+size 681716271

vocos/logs/lightning_logs/version_25/config.yaml ADDED Viewed

	@@ -0,0 +1,152 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+      name: lightning_logs
+      version: null
+      log_graph: false
+      default_hp_metric: true
+      prefix: ''
+      sub_dir: null
+      logdir: null
+      comment: ''
+      purge_step: null
+      max_queue: 10
+      flush_secs: 120
+      filename_suffix: ''
+      write_to_disk: true
+      comet_config:
+        disabled: true
+  enable_checkpointing: true
+  callbacks:
+  - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    init_args:
+      logging_interval: null
+      log_momentum: false
+  - class_path: pytorch_lightning.callbacks.ModelSummary
+    init_args:
+      max_depth: 2
+  - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+    init_args:
+      dirpath: null
+      filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+      monitor: val_loss
+      verbose: false
+      save_last: true
+      save_top_k: 3
+      save_weights_only: false
+      mode: min
+      auto_insert_metric_name: true
+      every_n_train_steps: null
+      train_time_interval: null
+      every_n_epochs: null
+      save_on_train_epoch_end: null
+  - class_path: vocos.helpers.GradNormCallback
+  default_root_dir: null
+  gradient_clip_val: null
+  gradient_clip_algorithm: null
+  num_nodes: 1
+  num_processes: null
+  devices:
+  - 0
+  - 1
+  gpus: null
+  auto_select_gpus: false
+  tpu_cores: null
+  ipus: null
+  enable_progress_bar: true
+  overfit_batches: 0.0
+  track_grad_norm: -1
+  check_val_every_n_epoch: 1
+  fast_dev_run: false
+  accumulate_grad_batches: null
+  max_epochs: null
+  min_epochs: null
+  max_steps: 2000000
+  min_steps: null
+  max_time: null
+  limit_train_batches: null
+  limit_val_batches: 50
+  limit_test_batches: null
+  limit_predict_batches: null
+  val_check_interval: null
+  log_every_n_steps: 100
+  accelerator: gpu
+  strategy: ddp
+  sync_batchnorm: false
+  precision: 32
+  enable_model_summary: true
+  num_sanity_val_steps: 2
+  resume_from_checkpoint: null
+  profiler: null
+  benchmark: null
+  deterministic: null
+  reload_dataloaders_every_n_epochs: 0
+  auto_lr_find: false
+  replace_sampler_ddp: true
+  detect_anomaly: false
+  auto_scale_batch_size: false
+  plugins: null
+  amp_backend: native
+  amp_level: null
+  move_metrics_to_cpu: false
+  multiple_trainloader_mode: max_size_cycle
+  inference_mode: true
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 44100
+        n_fft: 2048
+        hop_length: 512
+        win_length: 2048
+        n_mels: 128
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 128
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+        layer_scale_init_value: null
+        adanorm_num_embeddings: null
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 2048
+        hop_length: 512
+        padding: center
+    sample_rate: 44100
+    initial_learning_rate: 0.0005
+    num_warmup_steps: 0
+    mel_loss_coeff: 45.0
+    mrd_loss_coeff: 0.1
+    pretrain_mel_steps: 0
+    decay_mel_coeff: false
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.train
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 58
+      num_workers: 8
+    val_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.val
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 16
+      num_workers: 8
+optimizer: null
+lr_scheduler: null

vocos/logs/lightning_logs/version_25/events.out.tfevents.1738103019.104-171-202-79 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f02506aa015b3928338d546f306e461971e99dcb31e66a265d647f63ce46295
+size 7661756

vocos/logs/lightning_logs/version_25/hparams.yaml ADDED Viewed

	@@ -0,0 +1,10 @@

+sample_rate: 44100
+initial_learning_rate: 0.0005
+num_warmup_steps: 0
+mel_loss_coeff: 45.0
+mrd_loss_coeff: 0.1
+pretrain_mel_steps: 0
+decay_mel_coeff: false
+evaluate_utmos: true
+evaluate_pesq: true
+evaluate_periodicty: true

vocos/logs/lightning_logs/version_26/checkpoints/last.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3720eb1e5ee6c1ba76d45f73b1661c0285705d570ed08ee78263fdd2bb16954
+size 681715888

vocos/logs/lightning_logs/version_26/checkpoints/vocos_checkpoint_epoch=0_step=16634_val_loss=6.8451.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2499f5ade99900680bcc17d2e14987f91661c14cd925c7435c8fcd071323942a
+size 681715824

vocos/logs/lightning_logs/version_26/config.yaml ADDED Viewed

	@@ -0,0 +1,152 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+      name: lightning_logs
+      version: null
+      log_graph: false
+      default_hp_metric: true
+      prefix: ''
+      sub_dir: null
+      logdir: null
+      comment: ''
+      purge_step: null
+      max_queue: 10
+      flush_secs: 120
+      filename_suffix: ''
+      write_to_disk: true
+      comet_config:
+        disabled: true
+  enable_checkpointing: true
+  callbacks:
+  - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    init_args:
+      logging_interval: null
+      log_momentum: false
+  - class_path: pytorch_lightning.callbacks.ModelSummary
+    init_args:
+      max_depth: 2
+  - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+    init_args:
+      dirpath: null
+      filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+      monitor: val_loss
+      verbose: false
+      save_last: true
+      save_top_k: 3
+      save_weights_only: false
+      mode: min
+      auto_insert_metric_name: true
+      every_n_train_steps: null
+      train_time_interval: null
+      every_n_epochs: null
+      save_on_train_epoch_end: null
+  - class_path: vocos.helpers.GradNormCallback
+  default_root_dir: null
+  gradient_clip_val: null
+  gradient_clip_algorithm: null
+  num_nodes: 1
+  num_processes: null
+  devices:
+  - 0
+  - 1
+  gpus: null
+  auto_select_gpus: false
+  tpu_cores: null
+  ipus: null
+  enable_progress_bar: true
+  overfit_batches: 0.0
+  track_grad_norm: -1
+  check_val_every_n_epoch: 1
+  fast_dev_run: false
+  accumulate_grad_batches: null
+  max_epochs: null
+  min_epochs: null
+  max_steps: 2000000
+  min_steps: null
+  max_time: null
+  limit_train_batches: null
+  limit_val_batches: 50
+  limit_test_batches: null
+  limit_predict_batches: null
+  val_check_interval: null
+  log_every_n_steps: 100
+  accelerator: gpu
+  strategy: ddp
+  sync_batchnorm: false
+  precision: 32
+  enable_model_summary: true
+  num_sanity_val_steps: 2
+  resume_from_checkpoint: null
+  profiler: null
+  benchmark: null
+  deterministic: null
+  reload_dataloaders_every_n_epochs: 0
+  auto_lr_find: false
+  replace_sampler_ddp: true
+  detect_anomaly: false
+  auto_scale_batch_size: false
+  plugins: null
+  amp_backend: native
+  amp_level: null
+  move_metrics_to_cpu: false
+  multiple_trainloader_mode: max_size_cycle
+  inference_mode: true
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 44100
+        n_fft: 2048
+        hop_length: 512
+        win_length: 2048
+        n_mels: 128
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 128
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+        layer_scale_init_value: null
+        adanorm_num_embeddings: null
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 2048
+        hop_length: 512
+        padding: center
+    sample_rate: 44100
+    initial_learning_rate: 0.0005
+    num_warmup_steps: 0
+    mel_loss_coeff: 45.0
+    mrd_loss_coeff: 0.1
+    pretrain_mel_steps: 0
+    decay_mel_coeff: false
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.train
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 58
+      num_workers: 8
+    val_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.val
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 16
+      num_workers: 8
+optimizer: null
+lr_scheduler: null

vocos/logs/lightning_logs/version_26/events.out.tfevents.1738103077.104-171-202-79 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:48c17ee2d5df22160ac1d62a41c9db5957f60652875309e4b5f315bf25c0452b
+size 5746663

vocos/logs/lightning_logs/version_26/hparams.yaml ADDED Viewed

	@@ -0,0 +1,10 @@

+sample_rate: 44100
+initial_learning_rate: 0.0005
+num_warmup_steps: 0
+mel_loss_coeff: 45.0
+mrd_loss_coeff: 0.1
+pretrain_mel_steps: 0
+decay_mel_coeff: false
+evaluate_utmos: true
+evaluate_pesq: true
+evaluate_periodicty: true

vocos/logs/lightning_logs/version_27/checkpoints/last.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9c52539e953c4675d8f68db881f7c7f3afd6abeecc9932b288c71adf3ab487a
+size 681715888

vocos/logs/lightning_logs/version_27/checkpoints/vocos_checkpoint_epoch=0_step=16634_val_loss=6.0317.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3196e7caa913048385c6806a8fce5b7ee675a77bdacc83c3b84f50a9d557581e
+size 681715824

vocos/logs/lightning_logs/version_27/config.yaml ADDED Viewed

	@@ -0,0 +1,152 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+      name: lightning_logs
+      version: null
+      log_graph: false
+      default_hp_metric: true
+      prefix: ''
+      sub_dir: null
+      logdir: null
+      comment: ''
+      purge_step: null
+      max_queue: 10
+      flush_secs: 120
+      filename_suffix: ''
+      write_to_disk: true
+      comet_config:
+        disabled: true
+  enable_checkpointing: true
+  callbacks:
+  - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    init_args:
+      logging_interval: null
+      log_momentum: false
+  - class_path: pytorch_lightning.callbacks.ModelSummary
+    init_args:
+      max_depth: 2
+  - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+    init_args:
+      dirpath: null
+      filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+      monitor: val_loss
+      verbose: false
+      save_last: true
+      save_top_k: 3
+      save_weights_only: false
+      mode: min
+      auto_insert_metric_name: true
+      every_n_train_steps: null
+      train_time_interval: null
+      every_n_epochs: null
+      save_on_train_epoch_end: null
+  - class_path: vocos.helpers.GradNormCallback
+  default_root_dir: null
+  gradient_clip_val: null
+  gradient_clip_algorithm: null
+  num_nodes: 1
+  num_processes: null
+  devices:
+  - 0
+  - 1
+  gpus: null
+  auto_select_gpus: false
+  tpu_cores: null
+  ipus: null
+  enable_progress_bar: true
+  overfit_batches: 0.0
+  track_grad_norm: -1
+  check_val_every_n_epoch: 1
+  fast_dev_run: false
+  accumulate_grad_batches: null
+  max_epochs: null
+  min_epochs: null
+  max_steps: 2000000
+  min_steps: null
+  max_time: null
+  limit_train_batches: null
+  limit_val_batches: 50
+  limit_test_batches: null
+  limit_predict_batches: null
+  val_check_interval: null
+  log_every_n_steps: 100
+  accelerator: gpu
+  strategy: ddp
+  sync_batchnorm: false
+  precision: 32
+  enable_model_summary: true
+  num_sanity_val_steps: 2
+  resume_from_checkpoint: null
+  profiler: null
+  benchmark: null
+  deterministic: null
+  reload_dataloaders_every_n_epochs: 0
+  auto_lr_find: false
+  replace_sampler_ddp: true
+  detect_anomaly: false
+  auto_scale_batch_size: false
+  plugins: null
+  amp_backend: native
+  amp_level: null
+  move_metrics_to_cpu: false
+  multiple_trainloader_mode: max_size_cycle
+  inference_mode: true
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 44100
+        n_fft: 2048
+        hop_length: 512
+        win_length: 2048
+        n_mels: 128
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 128
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+        layer_scale_init_value: null
+        adanorm_num_embeddings: null
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 2048
+        hop_length: 512
+        padding: center
+    sample_rate: 44100
+    initial_learning_rate: 0.0005
+    num_warmup_steps: 0
+    mel_loss_coeff: 45.0
+    mrd_loss_coeff: 0.1
+    pretrain_mel_steps: 0
+    decay_mel_coeff: false
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.train
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 58
+      num_workers: 8
+    val_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.val
+      sampling_rate: 44100
+      num_samples: 65536
+      batch_size: 16
+      num_workers: 8
+optimizer: null
+lr_scheduler: null

vocos/logs/lightning_logs/version_27/events.out.tfevents.1738146591.104-171-202-79 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57d65dca6e2d50879800973f412ed4da5c334ebfbd70f475dea1988880d1d01e
+size 4136929

vocos/logs/lightning_logs/version_27/hparams.yaml ADDED Viewed

	@@ -0,0 +1,10 @@

+sample_rate: 44100
+initial_learning_rate: 0.0005
+num_warmup_steps: 0
+mel_loss_coeff: 45.0
+mrd_loss_coeff: 0.1
+pretrain_mel_steps: 0
+decay_mel_coeff: false
+evaluate_utmos: true
+evaluate_pesq: true
+evaluate_periodicty: true

vocos/logs/lightning_logs/version_28/config.yaml ADDED Viewed

	@@ -0,0 +1,152 @@

+# pytorch_lightning==1.8.6
+seed_everything: 4444
+trainer:
+  logger:
+    class_path: pytorch_lightning.loggers.TensorBoardLogger
+    init_args:
+      save_dir: logs/
+      name: lightning_logs
+      version: null
+      log_graph: false
+      default_hp_metric: true
+      prefix: ''
+      sub_dir: null
+      logdir: null
+      comment: ''
+      purge_step: null
+      max_queue: 10
+      flush_secs: 120
+      filename_suffix: ''
+      write_to_disk: true
+      comet_config:
+        disabled: true
+  enable_checkpointing: true
+  callbacks:
+  - class_path: pytorch_lightning.callbacks.LearningRateMonitor
+    init_args:
+      logging_interval: null
+      log_momentum: false
+  - class_path: pytorch_lightning.callbacks.ModelSummary
+    init_args:
+      max_depth: 2
+  - class_path: pytorch_lightning.callbacks.ModelCheckpoint
+    init_args:
+      dirpath: null
+      filename: vocos_checkpoint_{epoch}_{step}_{val_loss:.4f}
+      monitor: val_loss
+      verbose: false
+      save_last: true
+      save_top_k: 3
+      save_weights_only: false
+      mode: min
+      auto_insert_metric_name: true
+      every_n_train_steps: null
+      train_time_interval: null
+      every_n_epochs: null
+      save_on_train_epoch_end: null
+  - class_path: vocos.helpers.GradNormCallback
+  default_root_dir: null
+  gradient_clip_val: null
+  gradient_clip_algorithm: null
+  num_nodes: 1
+  num_processes: null
+  devices:
+  - 0
+  - 1
+  gpus: null
+  auto_select_gpus: false
+  tpu_cores: null
+  ipus: null
+  enable_progress_bar: true
+  overfit_batches: 0.0
+  track_grad_norm: -1
+  check_val_every_n_epoch: 1
+  fast_dev_run: false
+  accumulate_grad_batches: null
+  max_epochs: null
+  min_epochs: null
+  max_steps: 2000000
+  min_steps: null
+  max_time: null
+  limit_train_batches: null
+  limit_val_batches: 50
+  limit_test_batches: null
+  limit_predict_batches: null
+  val_check_interval: null
+  log_every_n_steps: 100
+  accelerator: gpu
+  strategy: ddp
+  sync_batchnorm: false
+  precision: 32
+  enable_model_summary: true
+  num_sanity_val_steps: 2
+  resume_from_checkpoint: null
+  profiler: null
+  benchmark: null
+  deterministic: null
+  reload_dataloaders_every_n_epochs: 0
+  auto_lr_find: false
+  replace_sampler_ddp: true
+  detect_anomaly: false
+  auto_scale_batch_size: false
+  plugins: null
+  amp_backend: native
+  amp_level: null
+  move_metrics_to_cpu: false
+  multiple_trainloader_mode: max_size_cycle
+  inference_mode: true
+model:
+  class_path: vocos.experiment.VocosExp
+  init_args:
+    feature_extractor:
+      class_path: vocos.feature_extractors.MelSpectrogramFeatures
+      init_args:
+        sample_rate: 24000
+        n_fft: 2048
+        hop_length: 300
+        win_length: 1200
+        n_mels: 80
+        padding: center
+    backbone:
+      class_path: vocos.models.VocosBackbone
+      init_args:
+        input_channels: 80
+        dim: 512
+        intermediate_dim: 1536
+        num_layers: 8
+        layer_scale_init_value: null
+        adanorm_num_embeddings: null
+    head:
+      class_path: vocos.heads.ISTFTHead
+      init_args:
+        dim: 512
+        n_fft: 2048
+        hop_length: 300
+        padding: center
+    sample_rate: 24000
+    initial_learning_rate: 0.0005
+    num_warmup_steps: 0
+    mel_loss_coeff: 45.0
+    mrd_loss_coeff: 0.1
+    pretrain_mel_steps: 0
+    decay_mel_coeff: false
+    evaluate_utmos: true
+    evaluate_pesq: true
+    evaluate_periodicty: true
+data:
+  class_path: vocos.dataset.VocosDataModule
+  init_args:
+    train_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist2.train
+      sampling_rate: 24000
+      num_samples: 57600
+      batch_size: 64
+      num_workers: 8
+    val_params:
+      filelist_path: /home/ubuntu/vocos/data/filelist.val
+      sampling_rate: 24000
+      num_samples: 57600
+      batch_size: 16
+      num_workers: 8
+optimizer: null
+lr_scheduler: null

vocos/logs/lightning_logs/version_28/events.out.tfevents.1738155430.104-171-202-79 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b4a7316956f5ead36f26b752c57b4666029b303700a235499d5430b0e1075d2
+size 698760

vocos/logs/lightning_logs/version_28/hparams.yaml ADDED Viewed

	@@ -0,0 +1,10 @@

+sample_rate: 24000
+initial_learning_rate: 0.0005
+num_warmup_steps: 0
+mel_loss_coeff: 45.0
+mrd_loss_coeff: 0.1
+pretrain_mel_steps: 0
+decay_mel_coeff: false
+evaluate_utmos: true
+evaluate_pesq: true
+evaluate_periodicty: true

vocos/metrics/UTMOS.py ADDED Viewed

	@@ -0,0 +1,223 @@

+import os
+import fairseq
+import pytorch_lightning as pl
+import requests
+import torch
+import torch.nn as nn
+from tqdm import tqdm
+UTMOS_CKPT_URL = "https://huggingface.co/spaces/sarulab-speech/UTMOS-demo/resolve/main/epoch%3D3-step%3D7459.ckpt"
+WAV2VEC_URL = "https://huggingface.co/spaces/sarulab-speech/UTMOS-demo/resolve/main/wav2vec_small.pt"
+"""
+UTMOS score, automatic Mean Opinion Score (MOS) prediction system,
+adapted from https://huggingface.co/spaces/sarulab-speech/UTMOS-demo
+"""
+class UTMOSScore:
+    """Predicting score for each audio clip."""
+    def __init__(self, device, ckpt_path="epoch=3-step=7459.ckpt"):
+        self.device = device
+        filepath = os.path.join(os.path.dirname(__file__), ckpt_path)
+        if not os.path.exists(filepath):
+            download_file(UTMOS_CKPT_URL, filepath)
+        self.model = BaselineLightningModule.load_from_checkpoint(filepath).eval().to(device)
+    def score(self, wavs: torch.Tensor) -> torch.Tensor:
+        """
+        Args:
+            wavs: audio waveform to be evaluated. When len(wavs) == 1 or 2,
+                the model processes the input as a single audio clip. The model
+                performs batch processing when len(wavs) == 3.
+        """
+        if len(wavs.shape) == 1:
+            out_wavs = wavs.unsqueeze(0).unsqueeze(0)
+        elif len(wavs.shape) == 2:
+            out_wavs = wavs.unsqueeze(0)
+        elif len(wavs.shape) == 3:
+            out_wavs = wavs
+        else:
+            raise ValueError("Dimension of input tensor needs to be <= 3.")
+        bs = out_wavs.shape[0]
+        batch = {
+            "wav": out_wavs,
+            "domains": torch.zeros(bs, dtype=torch.int).to(self.device),
+            "judge_id": torch.ones(bs, dtype=torch.int).to(self.device) * 288,
+        }
+        with torch.no_grad():
+            output = self.model(batch)
+        return output.mean(dim=1).squeeze(1).cpu().detach() * 2 + 3
+def download_file(url, filename):
+    """
+    Downloads a file from the given URL
+    Args:
+        url (str): The URL of the file to download.
+        filename (str): The name to save the file as.
+    """
+    print(f"Downloading file {filename}...")
+    response = requests.get(url, stream=True)
+    response.raise_for_status()
+    total_size_in_bytes = int(response.headers.get("content-length", 0))
+    progress_bar = tqdm(total=total_size_in_bytes, unit="iB", unit_scale=True)
+    with open(filename, "wb") as f:
+        for chunk in response.iter_content(chunk_size=8192):
+            progress_bar.update(len(chunk))
+            f.write(chunk)
+    progress_bar.close()
+def load_ssl_model(ckpt_path="wav2vec_small.pt"):
+    filepath = os.path.join(os.path.dirname(__file__), ckpt_path)
+    if not os.path.exists(filepath):
+        download_file(WAV2VEC_URL, filepath)
+    SSL_OUT_DIM = 768
+    model, cfg, task = fairseq.checkpoint_utils.load_model_ensemble_and_task([filepath])
+    ssl_model = model[0]
+    ssl_model.remove_pretraining_modules()
+    return SSL_model(ssl_model, SSL_OUT_DIM)
+class BaselineLightningModule(pl.LightningModule):
+    def __init__(self, cfg):
+        super().__init__()
+        self.cfg = cfg
+        self.construct_model()
+        self.save_hyperparameters()
+    def construct_model(self):
+        self.feature_extractors = nn.ModuleList(
+            [load_ssl_model(ckpt_path="wav2vec_small.pt"), DomainEmbedding(3, 128),]
+        )
+        output_dim = sum([feature_extractor.get_output_dim() for feature_extractor in self.feature_extractors])
+        output_layers = [LDConditioner(judge_dim=128, num_judges=3000, input_dim=output_dim)]
+        output_dim = output_layers[-1].get_output_dim()
+        output_layers.append(
+            Projection(hidden_dim=2048, activation=torch.nn.ReLU(), range_clipping=False, input_dim=output_dim)
+        )
+        self.output_layers = nn.ModuleList(output_layers)
+    def forward(self, inputs):
+        outputs = {}
+        for feature_extractor in self.feature_extractors:
+            outputs.update(feature_extractor(inputs))
+        x = outputs
+        for output_layer in self.output_layers:
+            x = output_layer(x, inputs)
+        return x
+class SSL_model(nn.Module):
+    def __init__(self, ssl_model, ssl_out_dim) -> None:
+        super(SSL_model, self).__init__()
+        self.ssl_model, self.ssl_out_dim = ssl_model, ssl_out_dim
+    def forward(self, batch):
+        wav = batch["wav"]
+        wav = wav.squeeze(1)  # [batches, audio_len]
+        res = self.ssl_model(wav, mask=False, features_only=True)
+        x = res["x"]
+        return {"ssl-feature": x}
+    def get_output_dim(self):
+        return self.ssl_out_dim
+class DomainEmbedding(nn.Module):
+    def __init__(self, n_domains, domain_dim) -> None:
+        super().__init__()
+        self.embedding = nn.Embedding(n_domains, domain_dim)
+        self.output_dim = domain_dim
+    def forward(self, batch):
+        return {"domain-feature": self.embedding(batch["domains"])}
+    def get_output_dim(self):
+        return self.output_dim
+class LDConditioner(nn.Module):
+    """
+    Conditions ssl output by listener embedding
+    """
+    def __init__(self, input_dim, judge_dim, num_judges=None):
+        super().__init__()
+        self.input_dim = input_dim
+        self.judge_dim = judge_dim
+        self.num_judges = num_judges
+        assert num_judges != None
+        self.judge_embedding = nn.Embedding(num_judges, self.judge_dim)
+        # concat [self.output_layer, phoneme features]
+        self.decoder_rnn = nn.LSTM(
+            input_size=self.input_dim + self.judge_dim,
+            hidden_size=512,
+            num_layers=1,
+            batch_first=True,
+            bidirectional=True,
+        )  # linear?
+        self.out_dim = self.decoder_rnn.hidden_size * 2
+    def get_output_dim(self):
+        return self.out_dim
+    def forward(self, x, batch):
+        judge_ids = batch["judge_id"]
+        if "phoneme-feature" in x.keys():
+            concatenated_feature = torch.cat(
+                (x["ssl-feature"], x["phoneme-feature"].unsqueeze(1).expand(-1, x["ssl-feature"].size(1), -1)), dim=2
+            )
+        else:
+            concatenated_feature = x["ssl-feature"]
+        if "domain-feature" in x.keys():
+            concatenated_feature = torch.cat(
+                (concatenated_feature, x["domain-feature"].unsqueeze(1).expand(-1, concatenated_feature.size(1), -1),),
+                dim=2,
+            )
+        if judge_ids != None:
+            concatenated_feature = torch.cat(
+                (
+                    concatenated_feature,
+                    self.judge_embedding(judge_ids).unsqueeze(1).expand(-1, concatenated_feature.size(1), -1),
+                ),
+                dim=2,
+            )
+            decoder_output, (h, c) = self.decoder_rnn(concatenated_feature)
+        return decoder_output
+class Projection(nn.Module):
+    def __init__(self, input_dim, hidden_dim, activation, range_clipping=False):
+        super(Projection, self).__init__()
+        self.range_clipping = range_clipping
+        output_dim = 1
+        if range_clipping:
+            self.proj = nn.Tanh()
+        self.net = nn.Sequential(
+            nn.Linear(input_dim, hidden_dim), activation, nn.Dropout(0.3), nn.Linear(hidden_dim, output_dim),
+        )
+        self.output_dim = output_dim
+    def forward(self, x, batch):
+        output = self.net(x)
+        # range clipping
+        if self.range_clipping:
+            return self.proj(output) * 2.0 + 3
+        else:
+            return output
+    def get_output_dim(self):
+        return self.output_dim

vocos/metrics/__pycache__/UTMOS.cpython-311.pyc ADDED Viewed

Binary file (15 kB). View file

vocos/metrics/__pycache__/periodicity.cpython-311.pyc ADDED Viewed

Binary file (4.59 kB). View file

vocos/metrics/epoch=3-step=7459.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:44c57e3e4135a243b43d2c82b6a693fcd56f15f9ad0e1eb2a8b31fdecd3a49b8
+size 1238128841

vocos/metrics/periodicity.py ADDED Viewed

	@@ -0,0 +1,105 @@

+import librosa
+import numpy as np
+import torch
+import torchaudio
+import torchcrepe
+from torchcrepe.loudness import REF_DB
+SILENCE_THRESHOLD = -60
+UNVOICED_THRESHOLD = 0.21
+"""
+Periodicity metrics adapted from https://github.com/descriptinc/cargan
+"""
+def predict_pitch(
+    audio: torch.Tensor, silence_threshold: float = SILENCE_THRESHOLD, unvoiced_treshold: float = UNVOICED_THRESHOLD
+):
+    """
+    Predicts pitch and periodicity for the given audio.
+    Args:
+        audio (Tensor): The audio waveform.
+        silence_threshold (float): The threshold for silence detection.
+        unvoiced_treshold (float): The threshold for unvoiced detection.
+    Returns:
+        pitch (ndarray): The predicted pitch.
+        periodicity (ndarray): The predicted periodicity.
+    """
+    # torchcrepe inference
+    pitch, periodicity = torchcrepe.predict(
+        audio,
+        fmin=50.0,
+        fmax=550,
+        sample_rate=torchcrepe.SAMPLE_RATE,
+        model="full",
+        return_periodicity=True,
+        device=audio.device,
+        pad=False,
+    )
+    pitch = pitch.cpu().numpy()
+    periodicity = periodicity.cpu().numpy()
+    # Calculate dB-scaled spectrogram and set low energy frames to unvoiced
+    hop_length = torchcrepe.SAMPLE_RATE // 100  # default CREPE
+    stft = torchaudio.functional.spectrogram(
+        audio,
+        window=torch.hann_window(torchcrepe.WINDOW_SIZE, device=audio.device),
+        n_fft=torchcrepe.WINDOW_SIZE,
+        hop_length=hop_length,
+        win_length=torchcrepe.WINDOW_SIZE,
+        power=2,
+        normalized=False,
+        pad=0,
+        center=False,
+    )
+    # Perceptual weighting
+    freqs = librosa.fft_frequencies(sr=torchcrepe.SAMPLE_RATE, n_fft=torchcrepe.WINDOW_SIZE)
+    perceptual_stft = librosa.perceptual_weighting(stft.cpu().numpy(), freqs) - REF_DB
+    silence = perceptual_stft.mean(axis=1) < silence_threshold
+    periodicity[silence] = 0
+    pitch[periodicity < unvoiced_treshold] = torchcrepe.UNVOICED
+    return pitch, periodicity
+def calculate_periodicity_metrics(y: torch.Tensor, y_hat: torch.Tensor):
+    """
+    Calculates periodicity metrics for the predicted and true audio data.
+    Args:
+        y (Tensor): The true audio data.
+        y_hat (Tensor): The predicted audio data.
+    Returns:
+        periodicity_loss (float): The periodicity loss.
+        pitch_loss (float): The pitch loss.
+        f1 (float): The F1 score for voiced/unvoiced classification
+    """
+    true_pitch, true_periodicity = predict_pitch(y)
+    pred_pitch, pred_periodicity = predict_pitch(y_hat)
+    true_voiced = ~np.isnan(true_pitch)
+    pred_voiced = ~np.isnan(pred_pitch)
+    periodicity_loss = np.sqrt(((pred_periodicity - true_periodicity) ** 2).mean(axis=1)).mean()
+    # Update pitch rmse
+    voiced = true_voiced & pred_voiced
+    difference_cents = 1200 * (np.log2(true_pitch[voiced]) - np.log2(pred_pitch[voiced]))
+    pitch_loss = np.sqrt((difference_cents ** 2).mean())
+    # voiced/unvoiced precision and recall
+    true_positives = (true_voiced & pred_voiced).sum()
+    false_positives = (~true_voiced & pred_voiced).sum()
+    false_negatives = (true_voiced & ~pred_voiced).sum()
+    precision = true_positives / (true_positives + false_positives)
+    recall = true_positives / (true_positives + false_negatives)
+    f1 = 2 * precision * recall / (precision + recall)
+    return periodicity_loss, pitch_loss, f1

vocos/metrics/wav2vec_small.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c66c39eaed1b79a61ea8573f71e08f6641ff156b6a8f458cfaab53877dfa4a26
+size 950500491

vocos/notebooks/Bark+Vocos.ipynb ADDED Viewed

	@@ -0,0 +1,264 @@

+{
+  "nbformat": 4,
+  "nbformat_minor": 0,
+  "metadata": {
+    "colab": {
+      "private_outputs": true,
+      "provenance": [],
+      "gpuType": "T4",
+      "authorship_tag": "ABX9TyMC53IsYoVJIVijVzw3ADvX",
+      "include_colab_link": true
+    },
+    "kernelspec": {
+      "name": "python3",
+      "display_name": "Python 3"
+    },
+    "language_info": {
+      "name": "python"
+    },
+    "accelerator": "GPU"
+  },
+  "cells": [
+    {
+      "cell_type": "markdown",
+      "metadata": {
+        "id": "view-in-github",
+        "colab_type": "text"
+      },
+      "source": [
+        "<a href=\"https://colab.research.google.com/github/charactr-platform/vocos/blob/main/notebooks/Bark%2BVocos.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "# Text-to-Audio Synthesis using Bark and Vocos"
+      ],
+      "metadata": {
+        "id": "NuRzVtHDZ_Gl"
+      }
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "In this notebook, we use [Bark](https://github.com/suno-ai/bark) generative model to turn a text prompt into EnCodec audio tokens. These tokens then go through two decoders, EnCodec and Vocos, to reconstruct the audio waveform. Compare the results to discover the differences in audio quality and characteristics."
+      ],
+      "metadata": {
+        "id": "zJFDte0daDAz"
+      }
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "Make sure you have Bark and Vocos installed:"
+      ],
+      "metadata": {
+        "id": "c9omqGDYnajY"
+      }
+    },
+    {
+      "cell_type": "code",
+      "source": [
+        "!pip install git+https://github.com/suno-ai/bark.git\n",
+        "!pip install vocos"
+      ],
+      "metadata": {
+        "id": "voH44g90NvtV"
+      },
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "Download and load Bark models"
+      ],
+      "metadata": {
+        "id": "s3cEjOIuj6tq"
+      }
+    },
+    {
+      "cell_type": "code",
+      "source": [
+        "from bark import preload_models\n",
+        "\n",
+        "preload_models()"
+      ],
+      "metadata": {
+        "id": "1H7XtXRMjxUM"
+      },
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "Download and load Vocos."
+      ],
+      "metadata": {
+        "id": "YO1m0dJ1j-F5"
+      }
+    },
+    {
+      "cell_type": "code",
+      "source": [
+        "from vocos import Vocos\n",
+        "import torch\n",
+        "\n",
+        "device = torch.device(\"cuda\" if torch.cuda.is_available() else \"cpu\")\n",
+        "vocos = Vocos.from_pretrained(\"charactr/vocos-encodec-24khz\").to(device)"
+      ],
+      "metadata": {
+        "id": "COQYTDDFkBCq"
+      },
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "We are going to reuse `text_to_semantic` from Bark API, but to reconstruct audio waveform with a custom vododer, we need to slightly redefine the API to return `fine_tokens`."
+      ],
+      "metadata": {
+        "id": "--RjqW0rk5JQ"
+      }
+    },
+    {
+      "cell_type": "code",
+      "execution_count": null,
+      "metadata": {
+        "id": "OiUsuN2DNl5S"
+      },
+      "outputs": [],
+      "source": [
+        "from typing import Optional, Union, Dict\n",
+        "\n",
+        "import numpy as np\n",
+        "from bark.generation import generate_coarse, generate_fine\n",
+        "\n",
+        "\n",
+        "def semantic_to_audio_tokens(\n",
+        "    semantic_tokens: np.ndarray,\n",
+        "    history_prompt: Optional[Union[Dict, str]] = None,\n",
+        "    temp: float = 0.7,\n",
+        "    silent: bool = False,\n",
+        "    output_full: bool = False,\n",
+        "):\n",
+        "    coarse_tokens = generate_coarse(\n",
+        "        semantic_tokens, history_prompt=history_prompt, temp=temp, silent=silent, use_kv_caching=True\n",
+        "    )\n",
+        "    fine_tokens = generate_fine(coarse_tokens, history_prompt=history_prompt, temp=0.5)\n",
+        "\n",
+        "    if output_full:\n",
+        "        full_generation = {\n",
+        "            \"semantic_prompt\": semantic_tokens,\n",
+        "            \"coarse_prompt\": coarse_tokens,\n",
+        "            \"fine_prompt\": fine_tokens,\n",
+        "        }\n",
+        "        return full_generation\n",
+        "    return fine_tokens"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "Let's create a text prompt and generate audio tokens:"
+      ],
+      "metadata": {
+        "id": "Cv8KCzXlmoF9"
+      }
+    },
+    {
+      "cell_type": "code",
+      "source": [
+        "from bark import text_to_semantic\n",
+        "\n",
+        "history_prompt = None\n",
+        "text_prompt = \"So, you've heard about neural vocoding? [laughs] We've been messing around with this new model called Vocos.\"\n",
+        "semantic_tokens = text_to_semantic(text_prompt, history_prompt=history_prompt, temp=0.7, silent=False,)\n",
+        "audio_tokens = semantic_to_audio_tokens(\n",
+        "    semantic_tokens, history_prompt=history_prompt, temp=0.7, silent=False, output_full=False,\n",
+        ")"
+      ],
+      "metadata": {
+        "id": "pDmSTutoOH_G"
+      },
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "Reconstruct audio waveform with EnCodec:"
+      ],
+      "metadata": {
+        "id": "UYMzI8svTNqI"
+      }
+    },
+    {
+      "cell_type": "code",
+      "source": [
+        "from bark.generation import codec_decode\n",
+        "from IPython.display import Audio\n",
+        "\n",
+        "encodec_output = codec_decode(audio_tokens)\n",
+        "\n",
+        "import torchaudio\n",
+        "# Upsample to 44100 Hz for better reproduction on audio hardware\n",
+        "encodec_output = torchaudio.functional.resample(torch.from_numpy(encodec_output), orig_freq=24000, new_freq=44100)\n",
+        "Audio(encodec_output, rate=44100)"
+      ],
+      "metadata": {
+        "id": "PzdytlXFTNQ2"
+      },
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "Reconstruct with Vocos:"
+      ],
+      "metadata": {
+        "id": "BhUxBuP9TTTw"
+      }
+    },
+    {
+      "cell_type": "code",
+      "source": [
+        "audio_tokens_torch = torch.from_numpy(audio_tokens).to(device)\n",
+        "features = vocos.codes_to_features(audio_tokens_torch)\n",
+        "vocos_output = vocos.decode(features, bandwidth_id=torch.tensor([2], device=device))  # 6 kbps\n",
+        "# Upsample to 44100 Hz for better reproduction on audio hardware\n",
+        "vocos_output = torchaudio.functional.resample(vocos_output, orig_freq=24000, new_freq=44100).cpu()\n",
+        "Audio(vocos_output.numpy(), rate=44100)"
+      ],
+      "metadata": {
+        "id": "8hzSWQ5-nBlV"
+      },
+      "execution_count": null,
+      "outputs": []
+    },
+    {
+      "cell_type": "markdown",
+      "source": [
+        "Optionally save to mp3 files:"
+      ],
+      "metadata": {
+        "id": "RjVXQIZRb1Re"
+      }
+    },
+    {
+      "cell_type": "code",
+      "source": [
+        "torchaudio.save(\"encodec.mp3\", encodec_output[None, :], 44100, compression=128)\n",
+        "torchaudio.save(\"vocos.mp3\", vocos_output, 44100, compression=128)"
+      ],
+      "metadata": {
+        "id": "PLFXpjUKb3WX"
+      },
+      "execution_count": null,
+      "outputs": []
+    }
+  ]
+}

vocos/requirements-train.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+pytorch_lightning==1.8.6
+jsonargparse[signatures]
+transformers
+torchcrepe
+pesq
+matplotlib==3.7.0
+conda install conda-forge::sox -y
+git+https://github.com/One-sixth/fairseq.git

vocos/requirements.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+torch
+torchaudio
+numpy
+scipy
+einops
+pyyaml
+huggingface_hub
+encodec==0.1.1

vocos/setup.py ADDED Viewed

	@@ -0,0 +1,39 @@

+import io
+import os
+from setuptools import find_packages, setup
+for line in open("vocos/__init__.py"):
+    line = line.strip()
+    if "__version__" in line:
+        context = {}
+        exec(line, context)
+        VERSION = context["__version__"]
+def read(*paths, **kwargs):
+    content = ""
+    with io.open(
+        os.path.join(os.path.dirname(__file__), *paths), encoding=kwargs.get("encoding", "utf8"),
+    ) as open_file:
+        content = open_file.read().strip()
+    return content
+def read_requirements(path):
+    return [line.strip() for line in read(path).split("\n") if not line.startswith(('"', "#", "-", "git+"))]
+setup(
+    name="vocos",
+    version=VERSION,
+    author="Hubert Siuzdak",
+    author_email="[email protected]",
+    description="Fourier-based neural vocoder for high-quality audio synthesis",
+    url="https://github.com/charactr-platform/vocos",
+    long_description=read("README.md"),
+    long_description_content_type="text/markdown",
+    packages=find_packages(),
+    install_requires=read_requirements("requirements.txt"),
+    extras_require={"train": read_requirements("requirements-train.txt")},
+)

vocos/train.py ADDED Viewed

	@@ -0,0 +1,6 @@

+from pytorch_lightning.cli import LightningCLI
+if __name__ == "__main__":
+    cli = LightningCLI(run=False)
+    cli.trainer.fit(model=cli.model, datamodule=cli.datamodule)

vocos/vocos/__init__.py ADDED Viewed

	@@ -0,0 +1,4 @@


1	+ from vocos.pretrained import Vocos
2	+
3	+
4	+ __version__ = "0.1.0"

vocos/vocos/__pycache__/__init__.cpython-311.pyc ADDED Viewed

Binary file (234 Bytes). View file

vocos/vocos/__pycache__/dataset.cpython-311.pyc ADDED Viewed

Binary file (5.68 kB). View file

vocos/vocos/__pycache__/discriminators.cpython-311.pyc ADDED Viewed

Binary file (15.2 kB). View file