MERaLiON
/

MERaLiON-2-10B-ASR

Automatic Speech Recognition

Model card Files Files and versions

YingxuHe commited on May 26

Commit

ac09b8b

·

verified ·

1 Parent(s): 096dfe1

Upload processor

Files changed (2) hide show

processing_meralion2.py +2 -1
processor_config.json +1 -0

processing_meralion2.py CHANGED Viewed

@@ -50,8 +50,9 @@ class MERaLiON2Processor(ProcessorMixin):
     ):
         self.fixed_speech_embeds_length = fixed_speech_embeds_length
         self.speech_token_index = speech_token_index
         self.whisper_chunk_size = whisper_chunk_size
-        self.number_chunk_limit = time_duration_limit // whisper_chunk_size
         self.do_normalize = do_normalize
         super().__init__(feature_extractor, tokenizer)

     ):
         self.fixed_speech_embeds_length = fixed_speech_embeds_length
         self.speech_token_index = speech_token_index
+        self.time_duration_limit = time_duration_limit
         self.whisper_chunk_size = whisper_chunk_size
+        self.number_chunk_limit = self.time_duration_limit // self.whisper_chunk_size
         self.do_normalize = do_normalize
         super().__init__(feature_extractor, tokenizer)

processor_config.json CHANGED Viewed

@@ -6,5 +6,6 @@
   "fixed_speech_embeds_length": 100,
   "processor_class": "MERaLiON2Processor",
   "speech_token_index": 255999,
   "whisper_chunk_size": 30
 }

   "fixed_speech_embeds_length": 100,
   "processor_class": "MERaLiON2Processor",
   "speech_token_index": 255999,
+  "time_duration_limit": 300,
   "whisper_chunk_size": 30
 }