pluttodk commited on
Commit
fff1932
·
1 Parent(s): 931bb37

opdateret plot og en lidt bedre beskrivelse

Browse files
Files changed (3) hide show
  1. README.md +7 -7
  2. duration_plot.png +0 -0
  3. performance_plot.png +0 -0
README.md CHANGED
@@ -13,7 +13,11 @@ base_model:
13
  pipeline_tag: automatic-speech-recognition
14
  ---
15
  # HviskeTiske
16
- I grove tal så øges hastigheden et sted i mellem 3-4x uden store tab i accuracy for hviske-v2, og dermed er det umiddelbart den hurtigste og næsten den mest præcise open source danske transskriberings model
 
 
 
 
17
 
18
  ## HviskeV2 turbo model for CTranslate2
19
  Modellen konverterre syvai/hviske-v2 til CTranslate2 model format for dermed at kunne køre transskriberingerne markant hurtigere.
@@ -45,14 +49,10 @@ går igen ved større lydfiler. (herunder note at faster-whisper-large-v3-turbo-
45
  ### Performance
46
  ![Performance](./performance_plot.png)
47
 
48
- | model | wer (mean) | wer (std) | cer (mean) | cer (std) | time (mean) | time (std) |
49
- |-----------|------------|------------|------------|------------|-------------|-------------|
50
- | hviske-v2 | 0.124101 | 0.162295 | 0.050109 | 0.079331 | 0.581712 | 0.136740 |
51
- | hviske-tiske | 0.127241 | 0.167049 | 0.052416 | 0.085956 | 0.166297 | 0.007014 |
52
- | deepdml/faster-whisper-large-v3-turbo-ct2 | 0.497013 | 0.242836 | 0.172726 | 0.131111 | 0.171653 | 0.007839 |
53
 
54
  ### Hastighed
55
- For at teste hastighed, er der kørt på følgende længder lyd:
56
  - 5 sekunder
57
  - 10 sekunder
58
  - 30 sekunder
 
13
  pipeline_tag: automatic-speech-recognition
14
  ---
15
  # HviskeTiske
16
+ Hviske-Tiske er "nok" den hurtigste danske ASR model. Modellen er en distilleret version af hviske-v2.
17
+
18
+ I grove tal så øges hastigheden ca. 4x uden store tab i accuracy for hviske-v2, og dermed er det umiddelbart den hurtigste og næsten den mest præcise open source danske transskriberings model.
19
+
20
+ Ved lange lydfiler (30min +) så ses en forskel på 17 sekunder pr. fil. Samtidig fylder denne model kun ½delen på den nødvendige Vram på GPU. Dermed mindre krav til hardware for at køre den
21
 
22
  ## HviskeV2 turbo model for CTranslate2
23
  Modellen konverterre syvai/hviske-v2 til CTranslate2 model format for dermed at kunne køre transskriberingerne markant hurtigere.
 
49
  ### Performance
50
  ![Performance](./performance_plot.png)
51
 
52
+
 
 
 
 
53
 
54
  ### Hastighed
55
+ For at teste hastighed, er der kørt på følgende længder lyd, hvor CER og WER fordeler sig også som i ovenstående plot
56
  - 5 sekunder
57
  - 10 sekunder
58
  - 30 sekunder
duration_plot.png CHANGED
performance_plot.png CHANGED