テープ起こし・音声起こしの総合情報サイトokoso | 上手な録音起こし方の基本

上手な録音起こし方の基本

AmiVoiceをオコシストとして使う「第4回 認識結果の直し方」

今回と次回は、音声認識が間違っていた場合の直し方について質問してみます。

AmiVoice SP2で「音としては正しく聞き取れているのに文字化が正しくなかった」「しかも修正できなかった」状態を事前に4つ収集し、株式会社アドバンスト・メディアの樋爪さんに見ていただきました。

 

①音としては正しく聞き取れているのに「効いて」が候補にない。

 

ami4-1.jpg

 

樋爪:AmiVoiceは、個々の単語を認識しているわけではなく「前後の文脈」から文字化しています。ですから本当は、「効いて」を出したい場合は「効いて」になりそうな言葉をその前後に付けていただくといいんですね。

 

廿:「薬が効いて」と発話する、というようなことですね。

 

タイピングして日本語変換システムで変換する場合も、前後の文脈がないと変換されにくいことはよくあります。

例えば「し」と読む漢字はたくさんあって、1字だけでは必要な変換候補がなかなか出てきません。「詩」を出したいときは「しいか」とタイピングして「詩歌」を出し、「歌」を消すというような、熟語1字消しのテクニックがあります。そういうちょっと回り道だけど結果的には速い操作を、音声入力でも行えばいいわけです。

 

樋爪:でも、「きいて」なら「聞いて」「きいて」の他に「効いて」「聴いて」などが候補に並ぶのが美しい姿だと、実のところ私も思います。この不具合は、開発部門が現在修正中です。

 

廿:じゃあ、今後のバージョンに期待しています。現時点では…?

 

樋爪:現時点では、出そうな言葉を付けて発話するか、キーボードから入力して直していただくしかありません。

ただ、お客さまから「キーボードで直したらAmiVoice側が学習しない、そうするとまた同じ認識が繰り返される」という声をいただきまして、AmiVoice SP2には「テキスト学習」という機能を搭載しました。過去のWordファイルを読み込ませることで、AmiVoiceが文脈を学習します。他にExcelファイル、PDFファイル、テキストファイルなども読み込ませることができます。

 

テキスト学習させる方法:

AmiVoiceバーの上で右クリックして「テキスト学習ウィザード」を選択、あとはウィザードに沿って進む。学習させるファイルは、複数ファイルをまとめて選択できる。

 

 

②「後手維持(正しくは「ご提示」)」…音として正しく聞き取れているが、単語の区切りが違うために認識されない。

 

ami4-2.jpg

 

 

樋爪:私のAmiVoiceでやってみたら、「ご提示」になりました。

 

廿:ううっ…私って発音悪いのかな。

 

樋爪:いえいえ、たまたま区切りが違って認識されてしまうことはあります。AmiVoiceには「Shift+←、Shift+→で区切りを変更」というような機能はありません。単語登録していただくのもひとつの解決方法ですが、「ご××」だと、際限なく単語登録することになってしまいますからね…。

 

廿:「ご了解」「ご確認」「ご検討」などと何でも「ご登録」するのは「ご面倒」ですね。審議会などの音声だと、お役人様が答弁にやたら「ご」や「お」を付けるんです。

 

樋爪:そうしますと、過去の審議会起こしのファイルを、先ほどの「テキスト学習」でまとめて読み込ませるのが一番いいかもしれません。「テキスト学習」によって、文脈と同時に単語も学習されます。

 

廿:ジャンルが違うファイルをまとめて読み込ませたら、辞書が混乱してしまいますか? 例えば医薬系とビジネス系を学習させたら…。

 

樋爪:できれば、ユーザーを複数作って辞書を分けていただいたほうがいいと思います。分けるときは、これまでの音響学習データは引き継ぐことができます。

 

 

第4回のまとめ

・修正したい候補が出てこない場合は、文脈を考慮して発話し直すか、キーボードから修正する。

・「テキスト学習」機能で、文脈や単語を学習させることができる。

 

 

第1回

第2回

第3回

第5回

第6回

第7回

コメントする