metadata
language:
- th
tags:
- audio
- automatic-speech-recognition
license: mit
library_name: ctranslate2
base_model:
- biodatlab/whisper-th-large-v3-combined
pipeline_tag: automatic-speech-recognition
Whisper Large V3 (Thai): Combined V1 model for CTranslate2
ที่เก็บข้อมูลนี้มีไฟล์ที่แปลงจาก biodatlab/whisper-th-large-v3-combined ไปเป็นรูปแบบโมเดลของ CTranslate2.
โมเดลนี้สามารถใช้ได้ใน CTranslate2 หรือโปรเจกต์ที่พัฒนาต่อจาก CTranslate2 เช่น faster-whisper.
ตัวอย่างการใช้งาน
from faster_whisper import WhisperModel
model = WhisperModel("Vinxscribe/biodatlab-whisper-th-large-v3-faster")
segments, info = model.transcribe("audio.mp3")
for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))