Spaces:
Running
on
Zero
Running
on
Zero
update
Browse files
app.py
CHANGED
@@ -4,7 +4,6 @@ import warnings
|
|
4 |
from pathlib import Path
|
5 |
|
6 |
import gradio as gr
|
7 |
-
import huggingface_hub
|
8 |
import librosa
|
9 |
import spaces
|
10 |
import torch
|
@@ -13,7 +12,6 @@ from transformers import pipeline
|
|
13 |
|
14 |
warnings.filterwarnings("ignore")
|
15 |
|
16 |
-
huggingface_hub.login(token=os.getenv("HF_TOKEN"))
|
17 |
is_hf = os.getenv("SYSTEM") == "spaces"
|
18 |
|
19 |
generate_kwargs = {
|
@@ -62,6 +60,7 @@ def transcribe_common(audio: str, model: str) -> str:
|
|
62 |
audio = AudioSegment.from_file(audio)
|
63 |
audio.export("temp.wav", format="wav")
|
64 |
y, sr = librosa.load("temp.wav", mono=True, sr=16000)
|
|
|
65 |
# Get duration of audio
|
66 |
duration = librosa.get_duration(y=y, sr=sr)
|
67 |
logger.info(f"Duration: {duration:.2f}s")
|
@@ -88,9 +87,8 @@ def transcribe_anime_whisper(audio) -> str:
|
|
88 |
initial_md = """
|
89 |
# Anime-Whisper Demo
|
90 |
|
91 |
-
[**Anime Whisper**](https://huggingface.co/litagin/anime-whisper): 5
|
92 |
|
93 |
-
- ベースモデル: [kotoba-whisper-v2.0](https://huggingface.co/kotoba-tech/kotoba-whisper-v2.0)
|
94 |
- デモでは**音声は15秒まで**しか受け付けません
|
95 |
- 日本語のみ対応 (Japanese only)
|
96 |
- 比較のために [openai/whisper-large-v3-turbo](https://huggingface.co/openai/whisper-large-v3-turbo) と [kotoba-tech/kotoba-whisper-v2.0](https://huggingface.co/kotoba-tech/kotoba-whisper-v2.0) も用意しています
|
|
|
4 |
from pathlib import Path
|
5 |
|
6 |
import gradio as gr
|
|
|
7 |
import librosa
|
8 |
import spaces
|
9 |
import torch
|
|
|
12 |
|
13 |
warnings.filterwarnings("ignore")
|
14 |
|
|
|
15 |
is_hf = os.getenv("SYSTEM") == "spaces"
|
16 |
|
17 |
generate_kwargs = {
|
|
|
60 |
audio = AudioSegment.from_file(audio)
|
61 |
audio.export("temp.wav", format="wav")
|
62 |
y, sr = librosa.load("temp.wav", mono=True, sr=16000)
|
63 |
+
Path("temp.wav").unlink()
|
64 |
# Get duration of audio
|
65 |
duration = librosa.get_duration(y=y, sr=sr)
|
66 |
logger.info(f"Duration: {duration:.2f}s")
|
|
|
87 |
initial_md = """
|
88 |
# Anime-Whisper Demo
|
89 |
|
90 |
+
[**Anime Whisper**](https://huggingface.co/litagin/anime-whisper): 5千時間以上のアニメ調セリフと台本でファインチューニングされた日本語音声認識モデルのデモです。句読点や感嘆符がリズムや感情に合わせて自然に付き、NSFW含む非言語発話もうまく台本調に書き起こされます。
|
91 |
|
|
|
92 |
- デモでは**音声は15秒まで**しか受け付けません
|
93 |
- 日本語のみ対応 (Japanese only)
|
94 |
- 比較のために [openai/whisper-large-v3-turbo](https://huggingface.co/openai/whisper-large-v3-turbo) と [kotoba-tech/kotoba-whisper-v2.0](https://huggingface.co/kotoba-tech/kotoba-whisper-v2.0) も用意しています
|