Spaces for Audio / Voices

John6666 's Collections

Gradio Components

Spaces for MCP

Papers

Spaces for Games / Entertainments

Spaces for Tagger / Captioner / Prompter

Spaces for Text-to-images (SDXL, Pony, SD1.5, Flux,...)

Spaces for Audio / Voices

Spaces for Generative-AI Chats

Resources for Tagging / Captioning / Prompting / LLM

My Bookmarks

Spaces for Image Upscaler / Upsampler / Resizer

LoRAs / Models (SDXL1.0, Pony, SD1.5, Flux, ...)

Spaces for Model / Space / useful Utilities in Hugging Face

Resources for Sound Processing

Spaces for LLM / VLM / NLP

Spaces for Image-to-Image / Video

日本語スペース (Spaces in Japanese language)

Gradio Themes

updated 7 days ago

Upvote

Running on Zero

428

428

AICoverGen

🚀

Launch a web interface for model interaction
Running

5

5

VisualNovel_sbv_demo

😊

Generate voice with Style-Bert-VITS2 editor
Running on CPU Upgrade

651

651

Moe TTS

😊

Generate and convert voice with text and audio inputs
Running

6

6

Bert-VITS2 AI Abe&Suga&Kishida

🏺

Generate speech from text using AI models
Running

51

51

AICoverGen

🚀

Launch a web interface for model interaction
Paused

12

12

rvc-Blue-archives-hoyogames

:
Running

57

57

VTuber RVC Models

▶

Convert audio using RVC models
Running

417

417

RVC Inference HF

👀

Combine and process audio files
Running on Zero

312

312

Audio🔹Separator

🏃

Vocal and background audio separator
Paused

55

55

BlueArchiveTTS

📉

Generate audio from text using BlueArchiveTTS
Runtime error

150

150

Multi Voice TTS(English/Chinese/Japanese)

😆

[中文/English/日本語]multilingual text-to-speech
Running on Zero

442

442

Stable Audio Open Zero

🔥

Generate audio from text prompts
Paused

181

181

Applio

🍏

A simple, high-quality voice conversion tool
Running on Zero

2.4k

2.4k

Voice Clone

🗣

Clone a voice to speak any text
Running on Zero

220

220

RVC⚡ZERO

⚡

Voice conversion framework based on VITS
Runtime error

1

1

DiffSinger🎶 Diffusion for Singing Voice Synthesis

🎶
Running

148

148

Ultimate Vocal Remover WebUI

🎵

Run a web-based user interface
Running

259

259

Aesthetic RVC Inference HF

🍏

Install and run Applio audio processing app
Running

81

81

Advanced RVC Inference

⚡

Download and run voice conversion model
Runtime error

804

804

Vits Models

🏃

Generate audio from text using voice synthesis
Runtime error

563

563

Multilingual Anime TTS

🎙

Generate anime character voice from text
Running

33

33

LoveLive-ShojoKageki VITS

⚡

Generate audio from text with voice conversion
Running

371

371

vits-uma-genshin-honkai

🐨

Generate audio from text using VITS model
Running

3

3

おしゃべり晋さんメーカー（Style-Bert-VITS2）

🏺

Generate speech from text
Running

20

20

Hololive Style-Bert-VITS2

😊

Generate audio from text using various voice styles
Running on Zero

539

539

Midi Music Generator

🎼

Generate MIDI music from prompts
Running

25

25

Japanese Lyric Generator

🎼

Generate Japanese lyrics from a title and prompt
Running on L4

366

366

VALL E X

🎙

Generate audio from text using voice prompts
Running

2

2

AI晋さんメーカー

🔥

Generate Japanese speech from text
Build error

9

9

BangDream-ShojoKageki Bert VITS2

📉

Generate Japanese audio from text
Running

5

5

lovelive-ShojoKageki VITS JPZH

📈

Generate speech from text
Running

18

18

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

🌖

Generate audio from text with ChatGPT integration
Build error

2.38k

2.38k

Bark

🐶

Generate realistic audio from text
Running

1.09k

1.09k

OpenVoice

🤗

Generate voice from text using a reference audio
Running

325

325

OpenVoiceV2

🤗

Generate voice from text using a reference audio
Runtime error

61

61

ChatTTS OpenVoice

🐠
Running on T4

205

205

MassivelyMultilingualTTS

🌍

Generate speech from text in multiple languages
Runtime error

2.77k

2.77k

XTTS

🐸

Generate speech from text using a reference voice
Runtime error

5.07k

5.07k

MusicGen

🎵

Generate music from text descriptions and optional melodies
Runtime error

516

516

Seamless M4T v2

📞
Sleeping

60

60

Mars5 Space

📉
Running on Zero

19

19

FAcodecV2

🎙

Convert or reconstruct audio using voice samples
Paused

255

255

TTS x Hallo Talking Portrait

👋

Generate Talking avatars from Text-to-Speech
Running on CPU Upgrade

425

425

RVC Genshin Impact

🎤

Convert and modify audio voices
Paused

131

131

FoleyCrafter

📚

Generate audio for silent videos
Runtime error

259

259

Voice Clone Multilingual

🏃

Languages ru,en,zh-cn,ja,de,fr,it,pt,pl,tr,ko,nl,cs,ar,es,hu
Paused

14

14

Talkalkai Cover

🐨

Execute dynamic code
Running on Zero

MCP

552

552

Image to Music v2

🎺

Get a music sample inspired by the mood of an image
Running

214

214

Whisper Timestamped

🕒

In-browser speech recognition w/ word-level timestamps
Running on CPU Upgrade

867

867

TTS Arena V2

🏆

Vote on the latest TTS models!
Running

24

24

TTSDS Benchmark and Leaderboard

🥇

Text-To-Speech (TTS) Evaluation using objective metrics.
Running

6

6

LAKH MIDI Dataset Search

🐨

Search and explore LAKH MIDI dataset with MidiCaps
Runtime error

29

29

PicoAudio

📈

Generate audio from text descriptions with timestamps
Running

23

23

Advanced MIDI Search

🏆

Search and explore 179k+ MIDI titles
Runtime error

89

89

SenseVoice

🐠

Transcribe audio with emotions and events
Running

305

305

Whisper Speaker Diarization

🗣

Separate speakers in audio recordings
Build error

272

272

Faster Whisper Webui

🚀

Transcribe audio to text with speaker diarization
Running on Zero

60

60

Vocal Separation SOTA

🎤

Separate vocals and background from audio
Runtime error

99

99

BangDream-ShojoKageki Bert VITS2

🐠

Print "hello"
Runtime error

2

2

BangDream-ShojoKageki Api

🐠

Convert text to speech using band character voices
Runtime error

19

19

BangDream-ShojoKageki Bert VITS2

🐠

Generate audio from text with speaker selection and language translation
Running

13

13

Efficient Audio Captioning

🔊

Generate captions from audio files
Configuration error

180

180

NaturalSpeech3 FACodec

🏃

Convert and reconstruct speech files
Running

419

419

tts Text To Speech

🌍

Text-to-speech (TTS) with Next-gen Kaldi
Sleeping

4

4

Edge Tts

🌍
Running

14

14

JA TTS Arena

🏆

Vote on the top Japanese TTS models!
Runtime error

18

18

MIKU TTS

⚡

Convert text to voice using a musical model
Running

20

20

Genshin Music Generator

🎮

Genshin Impact game style music generation
Sleeping

4

4

Advanced RVC Inference

⚡
Runtime error

Style Bert VITS2 MT

🐠
Paused

3

3

ZeroRVC

🎙
Build error

13

13

Edge TTS w/ More Options

👁

Generate speech from text using various voices
Runtime error

33

33

EZ Voice Clone

⚡
Paused

4

4

Training Helper Rvc

⚡

easy training helper For RVC
Runtime error

23

23

Anitalker

🚀

Generate talking face video from image and audio
Running

7

7

rvc-Blue-archives

:

Convert and manipulate audio using various models
Runtime error

76

76

Fish Diffusion (HiFiSinger) Demo

🌊
Running

18

18

Japanese Ero Voice Classifier

🥰

Classify audio into NSFW categories
Running

32

32

Style Bert VITS2 Editor Demo

😊

Generate voice with Style-Bert-VITS2 editor
Running on L4

634

634

OpenAudio S1

🏆

Generate speech from text
Paused

1

1

Rvc Demo

⚡

A demo of RVC pip
Runtime error

107

107

Bark Voice Cloning

🐶

Clone voices from audio files
Build error

1

1

NeonAI Coqui AI TTS Plugin

🐸
Running

106

106

NeonAI Coqui AI TTS Plugin

🐸

Generate speech from text in multiple languages
Runtime error

12

12

AICoverGen

🔥
Running

12

12

Harmonic Melody MIDI Mixer

🔥

Harmonize and mix any MIDI melody
Runtime error

33

33

Ilaria Audio Analyzer

🎵

Create a spectrogram and get audio info
Paused

851

851

Ilaria RVC

😻

Convert and separate audio using models and TTS
Paused

5

5

MDX UVR

🚀

Separate audio into instrumental and vocal tracks
Running on Zero

195

195

GPT SoVITS V2 Pro Plus

🤗

Generate speech from text using reference audio
Running

7

7

Read My Pdf Outloud

🗣

Generate audio from text or PDF with optional translation
Running

7

7

Vocal Remover

⚡

Remove vocals from an audio file
Build error

827

827

Parler-TTS

🥖

High-fidelity Text-To-Speech
Runtime error

3

3

Japanese Ero Voice Classifier

🥰
Running

8

8

GPT-SoVITS-ToneControl_test

🐠

Generate audio from text using reference audio
Running

30

30

Umamusume Bert Vits2

📊

Generate audio from text using a voice synthesis model
Paused

1

1

Animalese Py

📈

Generate Animalese audio from text
Paused

3

3

Animalese RVC

🔶

Convert text to Animalese voice
Build error

4

4

AI Hanser

📊
Running on Zero

160

160

Stable Audio Live Multiplayer

💻

Generate audio from text prompts
Running

888

888

Edge TTS Text To Speech

👁

Generate speech from text using Microsoft Edge TTS
Running

21

21

Youtube AI Summarizer

🐨

Transcribe and summarize YouTube videos or audio files
Paused

5

5

AICoverGen

🚀

Launch a web interface for downloading YouTube videos
Running

1

1

Animalese Js

💻

Generate animal-like speech from text
Paused

1

1

ASR Model Comparison

💬
Runtime error

4

4

AICoverGenMod

🔥

Launch a web interface for model interaction
Paused

1

1

Ilaria Converter

🔨

Convert audio and images to different formats
Paused

1

1

RVC UI TES

👁

Convert and train voice models
Build error

8

8

RVC Genshin Impact

🎤
Sleeping

1

1

Voice2VoiceChatbot

🦀
Sleeping

RealTimeVoicetoVoiceChatbot

🌖
sp-uhh/speech-enhancement-sgmse

Audio-to-Audio • Updated Feb 2 • 18 • 15
Paused

2

2

RVC UI

🏃

An easy-to-use voice conversion framework based on VITS.
Runtime error

RVC

🏃
Runtime error

AI Voice Assistance

🌍
Runtime error

4

4

Voice Clone

🗣

Clone voices by typing text and providing a reference audio file
Running

6

6

Optimus

🌍

Generate speech and translate audio using AI models
Running

42

42

Doc To Dialogue

👀

Transform a report or document into an interview/discussion
Running

55

55

Voicee

⚡

Super fastest Voice Assistant
Running

8

8

Fish Audio API Demo

🐟

Convert text to speech with reference audio
Runtime error

75

75

Musicgen Songstarter Demo

👁

Generate music using descriptions and optional melody audio
Paused

87

87

Hololive Rvc Models V2

▶

Generate audio with voice conversion
Running

38

38

Advanced MIDI Renderer

🎹

Transform and render any MIDI
Runtime error

3

3

Imagen POP Music Medley Diffusion Transformer

🚀

Generate POP music medley with Imagen diffusion transformer
Sleeping

2

2

Ultimate MIDI Classifier

🔥

Classify absolutely any MIDI by genre, song and artist
Running on Zero

5

5

Intelligent MIDI Comparator

📚

Intelligently compare any pair of MIDIs
Running

112

112

ChatTTS Speaker

🌍

Explore and download stable speaker embeddings for ChatTTS
Sleeping

2

2

Bridge Music Transformer

🌖

Generate a seamless bridge between two composition parts
Build error

63

63

vits-simple-api

👀

Generate audio from text or voice input
Running

16

16

Bert VITS Umamusume Genshin HonkaiSR

🎙

Generate audio from text
Running on Zero

68

68

Audio SR

🔊

Fixed fork of the original audio sr!
Running on Zero

377

377

Seed Voice Conversion

🎤

Convert voice to match another's style or tone
Running

40

40

Mini Omni

⚡

Generate audio response from uploaded audio
Running

6

6

Monophonic MIDI Melody Harmonizer

⚡

Retrieval augmented harmonization of any MIDI melody
Running

12

12

MIDI Melody

⚡

Add a unique melody to any MIDI file
Running

3

3

MIDI Chords Mixer

🔥

Mix chords from one MIDI to another MIDI
Paused

2

2

Morse To Audio

🏆

Convert Morse code to audio
Runtime error

1

1

RCV EASY GUI

🚀
Paused

1

1

Advanced RVC Inference

⚡

Convert and modify voices in audio files
Runtime error

3

3

Lyricsgenius

⚡

Get Lyrics from Genius's Link
Build error

1

1

Groq Gradio Voice Assistant

👁
Sleeping

2

2

Hex Separator

🐠
Paused

3

3

Groq API Models

🐠

Groq API Playground
Paused

2

2

AI Tube Engine MusicGen

🎵
Paused

1

1

AI Tube Engine MusicGen

🎵
Paused

1

1

AI Tube Engine MusicGen

🎵
Paused

5

5

AI Tube Engine MusicGen

🎵
Runtime error

12

12

UTMOSv2

🌖

Generate speech quality score from audio
Build error

5

5

Mini Omni

⚡
Running

12

12

Bench.audio

📊

LMSYS bench for audio agents
Runtime error

78

78

Compressed Wav2Lip

🌟
Running

139

139

Gradio Lipsync Wav2lip

👄

Generate lip-synced video from image or video and audio
Runtime error

8

8

EchoMimic

🐨

Create lifelike animated videos using a photo and audio
Running

57

57

Wav2lip Gpu

🌍

Create a video with lip-synced audio
Running

1

1

Matcha TTS Japanese

🏃

Description of Matcha TTS Japanese
Running

146

146

DeepFilterNet2

💩

Generate clean audio from noisy recordings
Running on Zero

17

17

French Parler-TTS

🇫

High-fidelity Text-To-Speech
Running on Zero

273

273

EzAudio

🟣

Generate and edit audio from text prompts
Runtime error

21

21

Kotoba Whisper Demo

🔥

Transcribe audio to text with timestamps
Running

1

1

Matcha Tts Onnx Benchmarks

🦀

Benchmark load model and tts time
Runtime error

7

7

Mini Omni

⚡
Running on Zero

2

2

AIChat-matcha-tts-onnx-en

🐠

Give your space a voice! (Demo)
Running on Zero

17

17

GAMA

🌍

Generate text based on audio input and questions
Running on Zero

5

5

GAMA-IT

🏆

Describe audio with questions
Sleeping

1

1

Sbv2 Py

🦀

Generate audio from text
Build error

214

214

OpenMusic

🎶

Generate music from text descriptions
Paused

3

3

Mistral 7B Instruct v0.3 Matcha-TTS English

🐠

Enjoy TTS Chat
Paused

2

2

Moshi

💨

Create interactive spoken dialogue using audio input
Running on Zero

51

51

EzAudio ControlNet

🟣

Generate audio from text and reference audio
Runtime error

3

3

Fish Audio API Demo

🐟
Runtime error

1

1

Whisper En Tiny

🐠
Sleeping

7

7

Guided Rock Music Transformer

🏃

Controlled source augmented rock music transformer
Running on Zero

22

22

Long-form MusicGen

🎷

Long-form Musicgen
Running

134

134

Multilingual TTS

💻

Convert text to speech in multiple languages
Running

3

3

AI岸田文雄メーカー

🔥

Generate Japanese speech from text
Running

1

1

AI菅義偉メーカー

🔥

Generate菅義偉's voice from text
Paused

1

1

Audio Mouth

😻

Generate a lip-synced video from audio
Running

450

450

PDF2Audio

📚

Transform text into engaging podcast dialogues or detailed reports
Running on CPU Upgrade

1.09k

1.09k

Open ASR Leaderboard

🏆

View and request speech recognition model benchmarks
Runtime error

1.09k

1.09k

Open NotebookLM

🎙

Personalised Podcasts For All - Available in 13 Languages
Runtime error

4

4

Kotoba Whisper Bilingual Demo

🔥

Transcribe and translate Japanese & English audio
Runtime error

469

469

MeloTTS

🗣

Fast, efficient, & multilingual text-to-speech
Runtime error

197

197

Canary 1b

🐤

Transcribe and translate audio into text
Runtime error

1

1

Style Bert VITS2 SW

😻

Generate audio from text
Runtime error

21

21

Llama 3.2 3b Voice

👁
Build error

1

1

Pdf2audio

📚
Running on Zero

978

978

Whisper Turbo

🤯

Transcribe audio or YouTube videos into text
Running on Zero

336

336

Realtime Whisper Turbo

🤯

Realtime implementation of Whisper large turbo
Running

162

162

Whisper Large V3 Turbo WebGPU

🚀

ML-powered speech recognition directly in your browser
Running on T4

311

311

Tortoise Tts

🐢

ExpressivText-to-Speech
Running

43

43

Russian Text To Speech

💻

Generate speech from text with accentuation
Paused

6

6

Yt-dlp Wav

📉

Download audio or video from a URL
Running on T4

347

347

UnlimitedMusicGen

🎼

unlimited Audio generation with a few added features
Runtime error

87

87

AudioCraft Plus v2.0.0a (MusicGen + AudioGen)

🎶
Runtime error

21

21

MusicGen+ V1.2.7 (HuggingFace Version)

🎼
Configuration error

61

61

VoiceRestore

🔊

Restore degraded audio using a Transformer-based model
Runtime error

3

3

Whisperturbo

⚡

whisper3 turbo
Running

62

62

GPT-SoVITS-3s-cloning-free-TTS

🎙

Generate audio from text using selected character voices
Running

4

4

おしゃべり石破茂メーカー（Style-Bert-VITS2）

🏺

Generate speech from text with customizable settings
Running

1

1

おしゃべり二階俊博メーカー

🏺

Generate speech from text
Runtime error

3

3

Text To Meow

🐠
Paused

4

4

Rvc Ui

🔥

Transform audio with pre-trained models and customize settings
Running

29

29

Reverb ASR Demo

🌍

Transcribe audio to text with style options
Paused

2

2

Ilaria RVC Mod

😻

Separate vocals and instruments from audio
Running on T4

400

400

Resemble Enhance

🚀

Enhance and denoise your audio files
Runtime error

6

6

Openai Whisper Large V3 Turbo

💻

Transcribe audio to text
Running

60

60

RVC PlayGround

💻

Convert audio to a different voice
Running

69

69

Podcastfy.ai - An Open Source alternative to NotebookLM's podcast feature

🚀

Generate a podcast from text, URLs, PDFs, and images
Paused

76

76

Video to Music

🎞

Generate and apply matching music background to video shot
Running

201

201

Video SoundFX

👂

Generates a sound effect that matches video shot
Running

MCP

173

173

Image2SFX Comparison

👂

Generates audio environment from an image
Running on Zero

2.62k

2.62k

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Sleeping

1

1

Heartbeat

💜
Running

432

432

TTS Spaces Arena

🤗

Blind vote on HF TTS models!
Running on CPU Upgrade

MCP

73

73

xVASynth TTS

🧝

CPU powered, low RTF, emotional, multilingual TTS
Running

390

390

— AI Jukebox —

🎶

Generate music powered by AI
Runtime error

347

347

TANGO

🐠

Co-Speech Gesture Video Generation
Runtime error

17

17

Anime Whisper Demo

🥰

Transcribe Japanese audio to text
Runtime error

64

64

Ichigo Llama3.1 S Instruct

🏢

Generate text from audio recordings
Running

10

10

Whisper Japanese Phone Demo

🚀

Whisper model to transcript japanese audio to katakana.
Runtime error

269

269

ClearerVoice-Studio (Speech Enhancement, Separation and Extraction)

📈

Better AI powered platform to purify your speech signal
Running

21

21

Steganography

♫

Text | Image | Audio | Video to Spectrogram || Steganography
Running

18

18

AICoverGenMod

🔥

Generate Cover From AI Voice Model
Running

32

32

UVR5 UI

🚀

Separate audio into stems using various models
Running on Zero

19

19

Diva Realtime Chat

🗣

Generate text responses from audio input
Running on Zero

6

6

Kotoba Whisper Diarization Demo

👁

Transcribe and diarize audio files or microphone input
Configuration error

13

13

Synthio Stable Audio Open

📚

Stable audio open model from Synthio paper.
Build error

1

1

RYO EVC

🚀
Runtime error

1

1

UVR

😻
Running on Zero

35

35

Moonshine ASR

🌒

Fast & efficient ASR outperforming Whisper!
Running

31

31

seewav-gui

🔊

Generate a video from audio with customizable waveform visualization
Runtime error

74

74

RWKV Music

🎵

Generate MIDI music using RWKV v4!
Build error

5

5

MP3 Transcribe

💻

Whisper Transcribe MP3 files, use a GPU to convert faster!
Running

MCP

6

6

StyleTTS 2 Zero

🗣

Efficient, fast, +non-native languages & Lojban
Configuration error

260

260

MaskGCT TTS Demo

😻

MaskGCT TTS Demo
Running on Zero

125

125

MelodyFlow

🎵

Generate music from text descriptions
Running on Zero

761

761

Whisper Large V3

🤫

Transcribe audio or YouTube videos into text
Running

6

6

Ultimate Chords Progressions Transformer

🚀

Self-correcting multi-instrumental chords transformer
Runtime error

8

8

Chords Progressions Transformer

🎶

Chords-conditioned music transformer
Running on Zero

46

46

Fast Whisper Turbo

⚡

Ultra-fast Whisper Turbo inference ⚡
Running on A10G

307

307

AudioLDM2 Text2Audio Text2Music Generation

🔊

Generate audio and waveform video from text
Running

7

7

Hey Buddy!

🗣

In-Browser Audio Wake-Word Spotting
Sleeping

3

3

Streamlit Pianoroll

🎹

Streamlit pianoroll playback element
Running

34

34

Audio-Separator (UVR)

⚡

Audio-Separator by Politrees
Running on Zero

101

101

Giant Music Transformer

🦖

Fast multi-instrumental music transformer
Runtime error

23

23

Omni Mini (WebRTC)

🌖
Sleeping

5

5

Fortepyan Datasets

🎹

Streamlit browser for piano music datasets.
Sleeping

4

4

PIANO Dataset

🎹

Demo of masking tasks from the PIANO dataset
Running on L40S

146

146

Fish Agent

💬

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

14

14

Audio to Stems to MIDI Converter

🎵

Separate audio stems and convert to MIDI
Running

29

29

Podcast Generation

🌍

Generate podcasts with AI avatars
Sleeping

ChatTTS OpenVoice

🐠
Sleeping

1

1

OpenVoice

📚

Create personalized voice clips with情感
Running

15

15

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running

334

334

Bark with Voice Cloning

📊

Generate and clone voices from text or audio
Runtime error

12

12

Midi Music Generator

🎼

Generate MIDI music sequences
Running

4

4

Audio Lyrics Extractor

🎵
Running

10

10

Did StyleTTS 2 Generate It?

🤔

Did StyleTTS 2 generate that audio?!?
Paused

35

35

Hertz Dev

🌍

base model for mono-channel completion
Paused

21

21

Xtts

⚡

Generate audio from text with custom speakers
Runtime error

302

302

ChatTTS Forge

💬

Launch a web interface for text-to-speech and SSML processing
Running on Zero

2.95k

2.95k

Kokoro TTS

❤

Upgraded to v1.0!
Runtime error

6

6

Pipertts

🌖

Generate voice audio from text input
Running

64

64

Nexa Omni Demo

🎧

Generate text from audio input
Runtime error

21

21

Video2music

📚

Generate music for a video based on its content and key
Runtime error

812

812

Audioldm Text To Audio Generation

🔊

Generate audio from text descriptions
Runtime error

2

2

So VITS SVC

🦀

Generate Voice Clones
Runtime error

2

2

GPT SoVITS

👀
Running on Zero

615

615

Spanish F5

🗣

Spanish finetune for the original F5 model.
Sleeping

2

2

Dolce SVC

🎤
Configuration error

3

3

DolceTTS

🚀

Generate speech from text
Running

3

3

Lipsync

⚡

Convert audio to lip-sync data
Running

7

7

Chino TTS

☕

Generate voice from text using ごちうさ TTS
Running

2

2

Style Bert VITS2 NO

🐨

Generate speech from text
Running

1

1

Style Bert VITS2 SU

📉

シャルティアのAI音声合成モデルを作りました。
Runtime error

1

1

Style Bert VITS2 MHY

🔥

早乙女乱馬（女）のAI音声合成モデルを作りました。
Runtime error

1

1

Style Bert VITS2 SAR

🚀

ベアトリスのAI音声合成モデルを作りました。
Paused

38

38

Talk To Ultravox

⚡

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Sleeping

3

3

SoundOfWater

🏃

Estimate physical properties merely from pouring sound!
Running

9

9

Llama Code Editor

🐢

Create interactive HTML web pages with your voice
Running

1

1

Transcribe & Translate

🌍

Record an audio, then use AI to transcribe and translate it.
Running on Zero

17

17

Inpaint Music Transformer

🖌

Large and fast music transformer for pitches inpainting
Running

38

38

Tsukasa 司 Speech

🌖

a lightweight TTS for Natural Anime speech generation.
Running

9

9

MusicGen Continuation

🎵

Generate music based on text and melody
Running

5

5

Semanticodec Ultra Low Bitrate Audio Codec

🚀

Ultra-low bitrate neural audio codec (0.31~1.40 kbps) with a
Running

27

27

Audiosr Versatile Audio Super Resolution

📚

Versatile audio super resolution (any -> 48kHz) with AudioSR
Paused

2

2

OuteTTS 0.2 500M Demo GPU

🐠

Generate human-like speech from text
Sleeping

2

2

ChatTTS Forge English interface

💬

TTS tool
Runtime error

1

1

Style Bert VITS2 RU2

📚

short_description: 猫屋敷まゆのAI音声合成モデルを作りました。
Runtime error

17

17

Galgame Voice Finder

🥰

Find similar game voice samples
Sleeping

1

1

Vad Go

👁
Running on Zero

184

184

Indic Parler-TTS

👀

A demo of Indic Parler-TTS
Runtime error

1

1

Voice Activity Detection

🐳
Running

9

9

Vikhr 4o

👀

Convert text to speech and speech to text
Running

22

22

Wespeaker Demo

🏢

Verify speakers using voice samples
Runtime error

4

4

Wesep Tse 2speaker Demo

💻

Target Speaker Extraction with WeSep
Running

14

14

Wenet Demo

🐢

Transcribe audio to text
Paused

7

7

Open_ASR_Leaderboard

🏆

View and request model performance data
Running

41

41

Text-to-Speech WebGPU

🗣

WebGPU text-to-Speech powered by OuteTTS and Transformers.js
Running

23

23

SpeechScore (Speech Quality Metrics and Evaluation)

📈

A home for scoring speech quality
Running

2

2

Fish Speech Benchmark

🐠

Non official benchmark by Fish Speech
Running on Zero

14

14

Chupa Generator

👅

Generate chupa sounds from text or audio
Running

9

9

Japanese Parler-TTS Mini Demo

🌖

Generate Japanese audio from text
Running

6

6

Japanese Parler-TTS Large Demo

🏢

Generate Japanese audio from text
Runtime error

3

3

Make Anime Emotion Dataset

⚡
Runtime error

6

6

Anime Speech Emotion Recognition

😊

Detect emotions from an audio file
Running on Zero

868

868

MMAudio — generating synchronized audio from video/text

🔊

Generate audio from video or text prompts
Running on Zero

166

166

Sound AI SFX

🐠

SText to Audio(Sound SFX) Generator
Running

7

7

Talk To Moshi

👁

Talk to Kyutai's moshi - powered by Gradio WebRTC!
Runtime error

401

401

HierSpeech++ (Zero-shot TTS)

⚡

Generate high-quality speech from text using a prompt audio
Runtime error

11

11

Talk To Gradio Docs Rag

🌍

Talk to the Gradio docs! Powered by Pydantic and WebRTC ⚡️
Running

5

5

Melody Workshop

📊

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running on Zero

19

19

Text2midi

📉

Generate music from text prompts
Paused

45

45

Website Seo Checker

🔊

Analyze SEO of a website
Running

2

2

CC Audio 8

🐢

Classify audio samples into categories
Sleeping

2

2

Lotus

🪷
Running

132

132

Moonshine Web

🌙

Real-time in-browser speech recognition
Running

11

11

Openai Realtime Voice

💻

Talk with openAI's new Realtime Voice API
Running on Zero

20

20

SoloAudio

🎯

Separate sounds from audio mixtures using text prompts
Running

32

32

Music Genre Classifier

🎶

Music Genre Classifier
Running

12

12

Guzheng Playing Tech

☰

Guzheng Performance Technique Recognizer
Running

12

12

Chinese Instruments

🪕

Chinese Traditional Instrument Sound Retriever
Running

12

12

Pentatonic Mode

🪕

Chinese Music Pentatonic Mode Detector
Running

3

3

Audio Edit

🐨

Convert audio to images
Paused

4

4

MMAudio

🔊

Video to Audio
Running

45

45

Audio Transcription

🎙

Transcribe audio from URLs or uploads
Running

5

5

Audio 8D

📉

Make your audio to 8D
Running

22

22

Audio Separator

⚡

Python Audio Separator Demo
Running

2

2

Real-time Whisper WebGPU (Vue)

🎤

Yet another Real-time Whisper with WebGPU, written in Vue
Running

6

6

MIDI Identification

🦀

Identify any MIDI
Running

4

4

Moonshine Web (Vue)

🌙

Yet another Real-time in-browser STT, re-implemented in Vue
Running

26

26

AIRI: Virtual Companion

🧸

AI driven VTuber & Companion, supports Live2D and VRM.
Running

12

12

Figured Bass Calculator

🎸

Convert figured bass to chord
Running

232

232

Ebook2audiobook v25.8.18

🚀

Turn any ebook into audiobook, 1107+ languages supported!
Running

4

4

Ebook2audiobook_v1.0

🐸

V1.0Convert any Ebook to AudioBook with Xtts + VoiceCloning!
Paused

14

14

Ebook2audiobookPiper-tts

🪈

Converts Ebooks into audiobooks with piper-tts
Runtime error

14

14

Ebook2AudiobookV25.3.2_Docker_Test

⚡

Ebook2audiobook docker space beta
Running

15

15

Web Tools

📃

Online programming aids
Running

8

8

MS1-X Virtual Synth

📟

Ready-to-play synth instrument!
Running

13

13

hoyoTTS

🔊

Genshin Impact & Honkai Star Rail game character voice TTS
Running

12

12

Erhu Playing Tech

🪕

Erhu Performance Technique Recognizer
Running

12

12

Bel Canto Discriminator

🎙

Discriminator of Bel Canto and Chinese Folk Singing
Running

16

16

Pianos

🎹

Piano Sound Quality Classifier
Running

17

17

Chest Falsetto Discriminator

🎤

Discriminator of Chest Vocie and Falsetto
Running

6

6

Monster Piano Transformer

👾

Ultra-fast and very well fitted solo Piano music transformer
Running

2

2

Style Bert VITS2 IM2

🌖

ヘスティアのAI音声合成モデルを作りました。
Running

1

1

Style Bert VITS2 YHK2

🏃

フレイヤのAI音声合成モデルを作りました。
Paused

2

2

Anachrovox V0.1 Emerald (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Paused

3

3

Anachrovox V0.1 Azure (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Paused

2

2

Anachrovox V0.1 Amber (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Running

67

67

MIDI-Melody-Generator - One-minute creation by AI Coding Autonomous Agent

📉

https://huggingface.co/spaces/VIDraft/mouse-webgen
Running on Zero

24

24

Audio Separator

📊

Separate music and vocals from audio
Running

42

42

Open Universal Arabic Asr Leaderboard

🥇

A benchmark for open-source multi-dialect Arabic ASR models
Running on Zero

273

273

MusicGen Streaming

🔥

Generate music from text prompts
Running

2.77k

2.77k

Whisper JAX

⚡
Running on Zero

31

31

Parler-TTS Streaming

📝

High-fidelity Text-To-Speech
Running on Zero

MCP

517

517

LatentSync

👄

Audio Conditioned LipSync with Latent Diffusion Models
Runtime error

260

260

Singing Voice Conversion

🎼

Transform your voice into a singer's
Running

59

59

Text To Speech

🔥

Generate speech from text with different speakers
Runtime error

3

3

Felguk Audio Edit

🦀

Audio edit
Runtime error

309

309

Kokoro TTS Zero

🎴

✨[With v1.0.0] Accelerated TTS on Kokoro-82M
Running

5

5

📚 𝕡𝕕𝕗 𝕥𝕠 𝕊𝕡𝕖𝕖𝕔𝕙 ℂ𝕠𝕟𝕧𝕖𝕣𝕥𝕖𝕣 🎧

📚

📚PDF 🪄Text to 🗣️Speech 🤖Transformer
Running on L4

1.4k

1.4k

SadTalker

😭

Generate a talking face video from an image and audio
Runtime error

2

2

OLLAMA TTS CLIENT

😎

Communicate with an AI assistant and convert text to speech
Running

13

13

Piper TTS Spanish

🚀

Convertir texto a voz gratis
Running

22

22

Audio Visualizer - One-minute creation by AI Coding Autonomous Agent

🦀

https://huggingface.co/spaces/VIDraft/mouse-webgen
Sleeping

1

1

JARVIS2

🦀

2
Running on Zero

321

321

TangoFlux

🚀

Text to Audio (Sound SFX) Generator
Running

276

276

Rvc Models

🎤

Generate voice covers from audio or text input
Running

8

8

Karaoke MIDI Search

🎼

Search and find karaoke MIDI files
Running

20

20

Semantic Audio Search w/ Transformers.js

🎵

Search for music by description
Running on Zero

40

40

Misaki G2P

⚡

G2P
Runtime error

8

8

ClearerVoice-Studio (Speech Super Resolution)

📈

Better AI powered platform to purify your speech signal
Sleeping

1

1

Style Bert VITS2 NHR

🏃

結束いのりのAI音声合成モデルを作りました。
Sleeping

1

1

Style-Bert-VITS2-AJU YM

🌖

ドラクエ３の女勇者のAI音声合成モデルを作りました。
Running

1

1

Style Bert VITS2 AKT

⚡

喜屋武飛夏のAI音声合成モデルを作りました。
Running

20

20

3DAudio-Spectrum-Analyzer - One-minute creation by AI Coding Autonomous Agent

📉

https://huggingface.co/spaces/VIDraft/mouse-webgen
Paused

2

2

Badassgi

🤯

Korean Speech Transcribe(Text) and English Translate(Korean)
Running on Zero

MCP

31

31

Audiocraft

🎷

Demo for Jasco Model Music Stems Generation
Running

213

213

Kokoro Text-to-Speech

🗣

High-quality speech synthesis powered by Kokoro TTS
Running

4

4

AudioTranscribe

⚡

Transcribe and summarise audio files using AI.
Runtime error

3

3

GSV MiSide Japanese

🌖

GPT-SoVITS for MITA!
Running on Zero

4

4

Guided Accompaniment Transformer

🎺

Guided melody accompaniment generation with transformers
Running on Zero

308

308

Llasa 3b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Running

31

31

Egyptian Arabic TTS

🐨

A humble space for trying EGTTS V0.1
Paused

202

202

YuE

👩

Generate music from lyrics and genre tags
Running on Zero

59

59

YuE

👩

OpenSource Music Generator
Running on Zero

3

3

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Running

4

4

MIDI Loops Mixer

🎨

Mix random MIDI loops into one coherent music composition
Running

4

4

Text To Speech Online

👀

Convert text to speech online
Running

22

22

Speech To Text Online

🎤

Convert spoken words into text
Runtime error

40

40

Llasa 8b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Runtime error

15

15

soundfont-generator

🦦

Generate soundfonts with latent flow matching
Running

3

3

Beepbox

📈

beepbox
Running on Zero

MCP

37

37

Auffusion

😻

Audio Gen, Audio Style Transfer and Audio InPainting
Paused

2

2

Talk To Ultravox

⚡

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Paused

3

3

Kokoro TTS Translate v2.0

📉

This is a text-to-speech and translator app.
Running on Zero

6

6

Llasagna v0.1 1b TTS

🍕

Generate customized speech from text using a reference audio
Running

333

333

Kokoro Text-to-Speech (WebGPU)

🗣

High-quality speech synthesis powered by Kokoro TTS
Running

2

2

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running on Zero

MCP

42

42

Hibiki Simple

👄

High-Fidelity Simultaneous Speech-To-Speech Translation
Running on Zero

14

14

Music2emo

📊

Towards Unified Music Emotion Recognition across Dimensional
Runtime error

12

12

Llasa 1b Multilingual TTS

🌍

Generate speech from text with or without cloning a voice
Running on Zero

7

7

Llama Midi

🦀

Write musical scores with LLaMA
Running on Zero

380

380

UVR5 UI

⚡

Separate audio into stems using various models
Runtime error

18

18

Music source separation

🌖

Separate vocals and accompaniment from audio
Running on Zero

406

406

Zonos

🌍

Generate audio from text with customizable emotions and settings
Running

111

111

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Paused

5

5

Zonos

🔊

Speech Synthesis with Zonos
Running

73

73

Kokoro Web

🗣

ML-powered speech synthesis directly in your browser
Running

226

226

AI Podcast Generator

🎙

Generate Podcast using Kokoro-TTS!
Running

9

9

Audio Arena

⚡

audio-arena
Running

12

12

GPT SoVITS V2

😻

Generate realistic voice from text
Runtime error

15

15

Llasa 1B Multi Speakers Genshin Zh En Ja Ko

🚀

Llasa-1B-Multilingual finetuned using simon3000/genshin-voic
Paused

60

60

SoundwaveDemo

📉

Process audio and generate text output based on instructions
Runtime error

4

4

MIDI Templates Inpainter

🖌

Inpaint pitches in MIDI templates to create unique songs
Running

12

12

Guzheng Tech99

☰

Frame-level guzheng playing technique detector
Paused

1

1

Ilytka

💻

Generate audio from text
Sleeping

4

4

AI Promo Studio with Llama 3

🎧

Generate creative radio Ads with AI.
Runtime error

1

1

Drum Groove Generator

📈

Generate drum beats from MIDI files
Running

3

3

MIDI Mamba159M HK

😻

Generate music from MIDI data
Running

25

25

Gemini Audi Video Chat

🏃

Have a video chat with Gemini - it can see you ⚡️
Running

2

2

RAD-TTS++ Ukrainian (Vocos)

🎧

Use RAD-TTS++ model to synthesize text in Ukrainian
Running on L40S

186

186

Skyreels A1 Talking Head

😻

Audio to Talking Face
Build error

3

3

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Runtime error

10

10

DiffRhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Running on Zero

628

628

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Running

4

4

DarijaTTS Test

🐢

Generate audio from Darija text
Running

3

3

CC Denoise

🐢

Remove noise from audio files
Running on Zero

227

227

Spark TTS

🌖

A text-to-speech model powered by SparkAudio and Mobvoi.
Running

8

8

SonicOrbit

👁

transforms your audio files into immersive 360° binaural
Running on Zero

16

16

Generate Sound Effects From Image

🎶

Turns your image into matching sound effects
Running

2

2

VoiceReplacer

🏢

VoiceReplacer
Running

12

12

Indic Asr

🏆

A speech recognition tool for Indic languages.
Running

10

10

BangDream Bert VITS2

👀

Generate Japanese TTS audio
Running

37

37

Spark-TTS

⚡

(Unofficial) Gradio demo for Spark-TTS
Running on Zero

835

835

Sesame CSM

🌱

Conversational speech generation
Running

4

4

Ilaria RVC

😻

Convert and separate audio using models and TTS
Running on Zero

237

237

Orpheus TTS

🚀

Try Orpheus TTS here
Running on Zero

40

40

Canary 1B Flash

🐤

Canary 1B Flash demo
Running

350

350

Qwen2.5 Omni 7B Demo

🏆

Generate text and speech from audio, video, and text inputs
Runtime error

1

1

Style Bert VITS2 TT

📈

オグリキャップのAI音声合成モデルを作りました。
Runtime error

1

1

Style Bert VITS2 TKR

🏆

アマテ・ユズリハ（マチュ）のAI音声合成モデルを作りました。
Running on Zero

MCP

149

149

KDTalker

😛

Generate a talking-head video from an image and audio
Running

64

64

Expressive TTS Arena

🎤

Vote for the most expressive TTS voice
Running on Zero

91

91

MegaTTS3 Demo

👋
Running

1

1

Speech-to-Text for Ukrainian v2.1 (W2V-BERT 2.0) with LM

🎙

Transcribe Ukrainian audio to text
Running on Zero

2

2

Speech-to-Text for Ukrainian v2.1 (W2V-BERT 2.0)

🎙

Transcribe Ukrainian audio to text
Running on Zero

205

205

IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

🎙

Generate speech from text using a reference audio
Running

2

2

Orpheus FR TTS

🚀

Try Orpheus TTS here
Sleeping

2

2

BERT ISTFT VITS

🐨

TTS语音合成系统
Running on Zero

5

5

MMS TTS

🗣

Demo of Facebook's MMS Text-to-Speech Model
Running on Zero

97

97

Vevo for Zero-shot VC, TTS, and More

🐠

Controllable Zero-Shot Voice Imitation
Running on Zero

1

1

SimpleRVC

🐨

Search and upload AI singer models
Running on Zero

42

42

Morpheus Uncensored Tts

👀

morpheus tts - uncensored
Running on Zero

1.68k

1.68k

Dia 1.6B

👯

Generate realistic dialogue from a script, using Dia!
Sleeping

1

1

Onsei Tukuri

🐨

Generate customized text-to-speech audio
Running

MCP

9

9

Kokoro Text-to-Audio

🎵

Convert text to speech using Kokoro model
Running on Zero

432

432

Parakeet-TDT-0.6b-V2

Transcribe audio to text with timestamps
Runtime error

44

44

Voila Demo

💻

Chat with a voice-clone AI
Running on Zero

575

575

ACE Step

😻

A Step Towards Music Generation Foundation Model
Runtime error

143

143

Open NotebookLM

🎙

Generate a podcast to discuss the topic of your choice!
Runtime error

150

150

FantasyTalking

😻

Generate realistic talking video from an image and audio
Runtime error

82

82

Daily Paper Podcast

🎙

Generates a podcast about today's top trending paper.
Running on Zero

18

18

StyleTTS2 Lite Vi

🦀

Generate audio from text using reference voices
Runtime error

7

7

StyleTTS2 Lite

🦆

Generate audio from text with customizable voice
Running on Zero

MCP

104

104

TIGER Audio Extractor

✂

Extraction & Reconstruction for Efficient Speech Separation
Running on Zero

39

39

AI Podcast Generator

😻

converts URLs, PDFs, and keywords into professional podcasts
Running

6

6

Multilingual TTS

💻

Generate speech from text in multiple languages
Sleeping

4

4

RAD-TTS++ Ukrainian (HiFiGAN)

🎧

Use RAD-TTS++ model to synthesize text in Ukrainian
Running

6

6

VAD with MarbleNet

🗣

Voice Activity Detection using MarbleNet model
Running on Zero

MCP

1.5k

1.5k

Chatterbox TTS

🍿

Expressive Zeroshot TTS
Running on Zero

40

40

Voice Clone AI Podcast

🍿

Voice Clone AI Podcast Generator with Chatterbox
Running on Zero

108

108

SoloSpeech

🎯

State-of-the-art target speech extractor
Running on Zero

8

8

Voice Trans

🐢

voice-trans
Running on Zero

183

183

Vui

🏢

NotebookLM conversational speech model
Runtime error

13

13

SonicVerse

🖼

Generate detailed music descriptions from audio clips
Running on T4

395

395

Riffusion • Spectrogram To Music

🌖

Get Music from Generated Spectrogram with Diffusion
Running

1

1

Style Bert VITS2 ATD

💻

クロエ・オベールのAI音声合成モデルを作りました。
Running on Zero

95

95

CapSpeech TTS

🧢

Stylized TTS – design voice, accent, and emotion your way
Running on L40S

423

423

Song Generation

🎵

Generate a custom song from lyrics and optional prompts
Runtime error

38

38

V-JEPA 2 - Streaming Video Classification

🌍

Run V-JEPA 2 on a video stream for Video Classification
Running on Zero

148

148

Voice Clone TTS

🏆

mcp_server
Running on Zero

9

9

Music to Outfit

👚

Generate an outfit from audio input
Running on Zero

38

38

MOSS TTSD

📉

MOSS-TTSD: Text to Spoken Dialogue Generation
Running

6

6

Furigana From Speech And Text

🏆

音声と漢字仮名交じりテキストからふりがなを推定するツール
Running

253

253

Meigen MultiTalk

🎙

Audio-Driven Multi-Person Conversational Video Generation
Running on Zero

16

16

Orpheus Music Transformer

🎺

SOTA 8k music transformer trained on 2.31M+ HQ MIDIs
Running on Zero

2

2

Orpheus Drums Transformer

🎺

Inpaint drum tracks with Orpheus Music Transformer
Running on Zero

2

2

Orpheus Humanizing Transformer

🎺

Humanize any music score with Orpheus Music Transformer
Running on Zero

4

4

Orpheus Bridge Music Transformer

🌉

Seamless music bridges generation with transformers
Running on Zero

3

3

Godzilla Piano Chords Texturing Transformer

💻

Solo Piano chords texturing music transformer
Running on Zero

MCP

297

297

ThinkSound

🔊

Generate audio for a video using captions and descriptions
Sleeping

6

6

MIDI Doctor

🩺

MIDI Doctor will see your MIDI now :)
Sleeping

1

1

Fast Urdu ASR

🚈

Fast Urdu speech recognition app using CPU.
Running

4

4

Transcribed Urdu

🎙

The most accurate Urdu speech recognition app.
Running on Zero

3

3

Orpheus MIDI Comparator

📚

Intelligently compare any pair of MIDIs
Running on Zero

3

3

Orpheus MIDI Loops Mixer

🌉

Mix several MIDI loops into one composition by bridging
Sleeping

3

3

Urdu STT with GPT-OSS

🏎

High-quality Urdu STT with Faster-Whisper and LLM.
Running

1.35k

1.35k

Realistic Text To Speech Unlimited

🔥

Free Text-To-Speech generator with Emotion control (OpenAI)
Running on Zero

3

3

Orpheus Mono Melodies Mixer

🌉

Mix monophonic melodies into one composition by bridging
Running on Zero

3

3

Orpheus Pitches Inpainter

🖌

Inpaint pitches in any MIDI composition
Running

110

110

Qwen TTS Demo

💻

Generate speech from text with voice selection
Running on Zero

MCP

51

51

Voxtral

🗣

Demo space for Mistral latest speech models
Running

27

27

TTS Arena Legacy

🔥

Please vote on TTS Arena V2 instead
Running on Zero

184

184

MegaTTS 3 Voice Cloning

🎤

MegaTTS 3 but with voice cloning!
Running

64

64

Voxtral WebGPU

🐱

State-of-the-art audio transcription in your browser
Running

80

80

Music Arena Leaderboard

🎵

AI Music Arena & Leaderboard (Suno, Udio, Google, Meta, +)
Running on Zero

MCP

2

2

Kokoro TTS

❤

Upgraded to v1.0!
Runtime error

16

16

Jam

🐠

Generate a song from lyrics and style reference
Running

53

53

Kitten TTS

🏆

SOTA Super-tiny TTS Model
Running

5

5

Granite Speech 3.3 Speech-To-Text

🚀

granite-speech-3.3-8b in a huggingface space
Running on Zero

16

16

SonicMaster – Text-Guided Music Restoration & Mastering

🎧

Enhance audio using text prompts
Running

5

5

Demucs Music Source Separation (v4)

⚡

Remove vocals from videos
Running

4

4

Advanced MIDI Renderer (Genshin Impact Music)

❤

Transform and render any MIDI
Runtime error

13

13

Ola

📊

Generate text and audio responses from images and videos
Running on Zero

1

1

Orpheus TTS

🚀

Try Orpheus TTS here
Running on Zero

4

4

Galgame-Orpheus-3B-Demo

🔥

Galgame-Orpheus-3B-Demo
Running on Zero

3

3

Galgame-Llasa-8B

🔥

Galgame-Llasa-8B
Runtime error

5

5

Galgame-Llasa-1B-v2

🔥

Galgame-Llasa-1B-v2
Running on Zero

126

126

VibeVoice

🏃

Generate a multi-speaker podcast from a script
Running on Zero

3

3

Canary Qwen Transcriber 2.5b

📝

Transcribe audio and ask questions about the transcript
Running on Zero

1

1

ACE Step

😻

A Step Towards Music Generation Foundation Model
Running on Zero

7

7

EchoX

🔥

An end-to-end speech large language model.
Running on CPU Upgrade

54

54

MiMo-Audio-Chat

💬

Chat with Xiaomi MiMo-Audio using voice
Running

141

141

Qwen3 Omni Demo

⚡

Interact with a multimodal chatbot using text, audio, images, or video

Upvote

Collection guide
Browse collections

Spaces for Audio / Voices

AICoverGen

VisualNovel_sbv_demo

Moe TTS

Bert-VITS2 AI Abe&Suga&Kishida

AICoverGen

rvc-Blue-archives-hoyogames

VTuber RVC Models

RVC Inference HF

Audio🔹Separator

BlueArchiveTTS

Multi Voice TTS(English/Chinese/Japanese)

Stable Audio Open Zero

Applio

Voice Clone

RVC⚡ZERO

DiffSinger🎶 Diffusion for Singing Voice Synthesis

Ultimate Vocal Remover WebUI

Aesthetic RVC Inference HF

Advanced RVC Inference

Vits Models

Multilingual Anime TTS

LoveLive-ShojoKageki VITS

vits-uma-genshin-honkai

おしゃべり晋さんメーカー（Style-Bert-VITS2）

Hololive Style-Bert-VITS2

Midi Music Generator

Japanese Lyric Generator

VALL E X

AI晋さんメーカー

BangDream-ShojoKageki Bert VITS2

lovelive-ShojoKageki VITS JPZH

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

Bark

OpenVoice

OpenVoiceV2

ChatTTS OpenVoice

MassivelyMultilingualTTS

XTTS

MusicGen

Seamless M4T v2

Mars5 Space

FAcodecV2

TTS x Hallo Talking Portrait

RVC Genshin Impact

FoleyCrafter

Voice Clone Multilingual

Talkalkai Cover

Image to Music v2

Whisper Timestamped

TTS Arena V2

TTSDS Benchmark and Leaderboard

LAKH MIDI Dataset Search

PicoAudio

Advanced MIDI Search

SenseVoice

Whisper Speaker Diarization

Faster Whisper Webui

Vocal Separation SOTA

BangDream-ShojoKageki Bert VITS2

BangDream-ShojoKageki Api

BangDream-ShojoKageki Bert VITS2

Efficient Audio Captioning

NaturalSpeech3 FACodec

tts Text To Speech

Edge Tts

JA TTS Arena

MIKU TTS

Genshin Music Generator

Advanced RVC Inference

Style Bert VITS2 MT

ZeroRVC

Edge TTS w/ More Options

EZ Voice Clone

Training Helper Rvc

Anitalker

rvc-Blue-archives

Fish Diffusion (HiFiSinger) Demo

Japanese Ero Voice Classifier

Style Bert VITS2 Editor Demo