japanese-hubert-base-phoneme-ctc-v3

rinna/japanese-hubert-base を CTC での日本語音素認識にファインチューニングしたモデルです。

v2 からの変更点

  • 漢字仮名交じりの書き起こしに対して MeCab (fugashi) で N-best を出力し、それぞれに対して pyopenjtalk-plus による後処理を行った後、読みに対して前バージョンのモデルで計算した CTC loss と MeCab のコストとの重み付き和が最小となるものを正解ラベルとして扱う
  • 学習データから除外する文の条件を次のように変更
    • 「9人」「9人」「九人」「今シーズン」「今大会」のいずれかが含まれた文は学習データから除外
    • 「十」「0」「0」のいずれかが含まれた文のうち、pyopenjtalk-plus で推定された発音に「ジュッ」が含まれるものは学習データから除外 (v2 から継続)
    • 「日本」「方」「明日」の除外は実施しない (v2 から変更)
  • 音素「ty」を追加

その他の条件は v2 と同じです。

Downloads last month
306
Safetensors
Model size
94.4M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for prj-beatrice/japanese-hubert-base-phoneme-ctc-v3

Finetuned
(50)
this model

Dataset used to train prj-beatrice/japanese-hubert-base-phoneme-ctc-v3

Space using prj-beatrice/japanese-hubert-base-phoneme-ctc-v3 1