opdateret plot og en lidt bedre beskrivelse

Files changed (3) hide show

README.md CHANGED Viewed

@@ -13,7 +13,11 @@ base_model:
 pipeline_tag: automatic-speech-recognition
 ---
 # HviskeTiske
-I grove tal så øges hastigheden et sted i mellem 3-4x uden store tab i accuracy for hviske-v2, og dermed er det umiddelbart den hurtigste og næsten den mest præcise open source danske transskriberings model
 ## HviskeV2 turbo model for CTranslate2
 Modellen konverterre syvai/hviske-v2 til CTranslate2 model format for dermed at kunne køre transskriberingerne markant hurtigere.
@@ -45,14 +49,10 @@ går igen ved større lydfiler. (herunder note at faster-whisper-large-v3-turbo-
 ### Performance
 ![Performance](./performance_plot.png)
-| model     | wer (mean) | wer (std)  | cer (mean) | cer (std)  | time (mean) | time (std)  |
-|-----------|------------|------------|------------|------------|-------------|-------------|
-| hviske-v2     | 0.124101   | 0.162295   | 0.050109   | 0.079331   | 0.581712    | 0.136740    |
-| hviske-tiske | 0.127241   | 0.167049   | 0.052416   | 0.085956   | 0.166297    | 0.007014    |
-| deepdml/faster-whisper-large-v3-turbo-ct2   | 0.497013   | 0.242836   | 0.172726   | 0.131111   | 0.171653    | 0.007839    |
 ### Hastighed
-For at teste hastighed, er der kørt på følgende længder lyd:
 - 5 sekunder
 - 10 sekunder
 - 30 sekunder

 pipeline_tag: automatic-speech-recognition
 ---
 # HviskeTiske
+Hviske-Tiske er "nok" den hurtigste danske ASR model. Modellen er en distilleret version af hviske-v2.
+I grove tal så øges hastigheden ca. 4x uden store tab i accuracy for hviske-v2, og dermed er det umiddelbart den hurtigste og næsten den mest præcise open source danske transskriberings model.
+Ved lange lydfiler (30min +) så ses en forskel på 17 sekunder pr. fil. Samtidig fylder denne model kun ½delen på den nødvendige Vram på GPU. Dermed mindre krav til hardware for at køre den
 ## HviskeV2 turbo model for CTranslate2
 Modellen konverterre syvai/hviske-v2 til CTranslate2 model format for dermed at kunne køre transskriberingerne markant hurtigere.
 ### Performance
 ![Performance](./performance_plot.png)
 ### Hastighed
+For at teste hastighed, er der kørt på følgende længder lyd, hvor CER og WER fordeler sig også som i ovenstående plot
 - 5 sekunder
 - 10 sekunder
 - 30 sekunder

duration_plot.png CHANGED Viewed

performance_plot.png CHANGED Viewed