テープ起こし・音声起こしの総合情報サイトokoso | 上手な録音起こし方の基本

上手な録音起こし方の基本

AmiVoiceをオコシストとして使う「第2回 認識されるしゃべり方」

AmiVoiceを使い、リスピークによってテープ起こしをする。どんなふうにしゃべれば音声認識されやすいのか、引き続き株式会社アドバンスト・メディアの樋爪さんにお話を伺います。

 

廿:じゃあ、認識率を高めるには、ボイスをためてレベルを上げるべく、ひたすら使い続けるのみということでしょうか。

 

樋爪:継続的にお使いいただくことはもちろんですが、認識率を高めるコツは他に、大きく分けて3つあります。

まず、ヘッドセットマイクを正しく使うこと。マイクの位置は口元から5センチ以内を推奨しています。AmiVoice SP2の付属マイクは指向性があるので、口元側からの音声を認識します。ですから、周りが騒がしくてもご本人の声を優先して認識します。

 

樋爪さんは、家電量販店でAmiVoiceの実演をされることもあるそうです。あのにぎやかな店頭でもちゃんと認識されるとのこと、さすが指向性マイクです。

 

樋爪:しゃべり方は、大げさな抑揚を付けずに棒読みすることがポイントです。アナウンサーがニュース原稿を読み上げるような淡々とした調子が、よく認識されます。

それから、前後の文脈で認識させているので、ひとまとめに長くしゃべるほうが認識されます。例えばマイクに向かって「に」だけ言っても、ひらがなの「に」、数字の「2」、漢字の「似」「荷」「煮」などのどれか判断できません。

何をしゃべっていいか迷って、まずは「あいうえお、かきくけこ」などと言ってみる方もいらっしゃいます。でも、これは自然な文脈での話し言葉ではありませんから、認識されにくいのです。

また、ゆっくりしゃべりすぎたり、1音ずつ区切ったりすると認識率が落ちます。「ぼいすってなんのたんいですか」というふうに、ひとまとめにすっと言うほうが認識されます。これらを守っていただくと、認識率は結構上がります。

 

廿:そういえばAmiVoiceって、事前に声の登録はしなくていいんですね。

 

樋爪:ええ、不要です。特定話者用のソフトウエアだと、事前に声を登録して、決まった文章を読み上げるなどの作業をする必要がありますが、私どものソフトウエアは不特定話者対応なので、インストールしたらすぐ使えます

ただ、やはり人によって話し方のくせはありますから、ユーザー様が使っていく間にソフト側は音響学習を続けていきます。

それと同時に、実はご本人も認識されやすい話し方を学習していかれます。「こういうしゃべり方をすると認識されやすいのか」と、お使いになる方が自然にコツを身に着けていかれるわけです。

 

最初は「そんなこと言ってないでしょ」と言いたくなる精度だったのが、使っていくうちに認識されるようになってきました。AmiVoiceが私のしゃべり方を覚えてきたのと同時に、私のほうも認識されやすいしゃべり方を徐々に体得してきたからでしょう。ソフトとユーザーが一緒に育っていくわけですね。

 

第2回のまとめ

・認識精度を上げるには、「マイクを口元から5センチ以内」にして、「あまり抑揚を付けず淡々と」「ひとまとめに長くしゃべる」。

・ソフトは音響学習でユーザーのしゃべり方を覚え、ユーザーはソフトに認識されやすいしゃべり方を覚えることで、認識精度が上がる。

 

 

第1回

第3回

第4回

第5回

第6回

第7回

コメントする