Spaces:

Shingome
/

Audio_Dublicate

Running

Shingome commited on May 24, 2024

Commit

bb986e3

1 Parent(s): 27b08c6

initial commit

Files changed (4) hide show

app.py ADDED Viewed

+import gradio as gr
+from src.multiply_audio import multiply_audio
+from src.convertation import np_to_audio
+def sentence_builder(audio, count: int, offset: float):
+    raw_audio = np_to_audio(audio[0], audio[1])
+    file = "sound.mp3"
+    multiply_audio(raw_audio, count, offset * 1000.).export(file)
+    return file
+if __name__ == "__main__":
+    iface = gr.Interface(
+        sentence_builder,
+        [
+            "audio",
+            gr.Slider(1, 1000, step=1, value=1, label="Count"),
+            gr.Slider(0, 10, step=0.05, value=0, label="Offset")
+        ],
+        "audio"
+    )
+    iface.launch()

requirements.txt ADDED Viewed

+gradio==4.31.5
+numpy==1.26.4
+pydub==0.25.1

src/convertation.py ADDED Viewed

+import numpy as np
+from pydub import AudioSegment
+def np_to_audio(sr, x):
+    def normalize_audio(x):
+        return x / np.max(np.abs(x))
+    channels = 2 if (x.ndim == 2 and x.shape[1] == 2) else 1
+    x = normalize_audio(x)
+    y = np.int16(x * 2 ** 15)
+    return AudioSegment(y.tobytes(), frame_rate=sr, sample_width=2, channels=channels)

src/multiply_audio.py ADDED Viewed

+import gradio as gr
+from pydub import AudioSegment
+def multiply_audio(audio: AudioSegment, count: int, offset: float, progress=gr.Progress()):
+    audio_result = AudioSegment.silent(audio.duration_seconds * 1000. + offset * count)
+    for i in progress.tqdm(range(count), desc="Processing"):
+        audio_result = audio_result.overlay(audio, position=i * offset)
+    return audio_result