opdateret plot og en lidt bedre beskrivelse
Browse files- README.md +7 -7
- duration_plot.png +0 -0
- performance_plot.png +0 -0
README.md
CHANGED
@@ -13,7 +13,11 @@ base_model:
|
|
13 |
pipeline_tag: automatic-speech-recognition
|
14 |
---
|
15 |
# HviskeTiske
|
16 |
-
|
|
|
|
|
|
|
|
|
17 |
|
18 |
## HviskeV2 turbo model for CTranslate2
|
19 |
Modellen konverterre syvai/hviske-v2 til CTranslate2 model format for dermed at kunne køre transskriberingerne markant hurtigere.
|
@@ -45,14 +49,10 @@ går igen ved større lydfiler. (herunder note at faster-whisper-large-v3-turbo-
|
|
45 |
### Performance
|
46 |

|
47 |
|
48 |
-
|
49 |
-
|-----------|------------|------------|------------|------------|-------------|-------------|
|
50 |
-
| hviske-v2 | 0.124101 | 0.162295 | 0.050109 | 0.079331 | 0.581712 | 0.136740 |
|
51 |
-
| hviske-tiske | 0.127241 | 0.167049 | 0.052416 | 0.085956 | 0.166297 | 0.007014 |
|
52 |
-
| deepdml/faster-whisper-large-v3-turbo-ct2 | 0.497013 | 0.242836 | 0.172726 | 0.131111 | 0.171653 | 0.007839 |
|
53 |
|
54 |
### Hastighed
|
55 |
-
For at teste hastighed, er der kørt på følgende længder lyd
|
56 |
- 5 sekunder
|
57 |
- 10 sekunder
|
58 |
- 30 sekunder
|
|
|
13 |
pipeline_tag: automatic-speech-recognition
|
14 |
---
|
15 |
# HviskeTiske
|
16 |
+
Hviske-Tiske er "nok" den hurtigste danske ASR model. Modellen er en distilleret version af hviske-v2.
|
17 |
+
|
18 |
+
I grove tal så øges hastigheden ca. 4x uden store tab i accuracy for hviske-v2, og dermed er det umiddelbart den hurtigste og næsten den mest præcise open source danske transskriberings model.
|
19 |
+
|
20 |
+
Ved lange lydfiler (30min +) så ses en forskel på 17 sekunder pr. fil. Samtidig fylder denne model kun ½delen på den nødvendige Vram på GPU. Dermed mindre krav til hardware for at køre den
|
21 |
|
22 |
## HviskeV2 turbo model for CTranslate2
|
23 |
Modellen konverterre syvai/hviske-v2 til CTranslate2 model format for dermed at kunne køre transskriberingerne markant hurtigere.
|
|
|
49 |
### Performance
|
50 |

|
51 |
|
52 |
+
|
|
|
|
|
|
|
|
|
53 |
|
54 |
### Hastighed
|
55 |
+
For at teste hastighed, er der kørt på følgende længder lyd, hvor CER og WER fordeler sig også som i ovenstående plot
|
56 |
- 5 sekunder
|
57 |
- 10 sekunder
|
58 |
- 30 sekunder
|
duration_plot.png
CHANGED
![]() |
![]() |
performance_plot.png
CHANGED
![]() |
![]() |