先日「イベント・セミナー情報」でご案内した、Voice Writingセミナー、東京開催の上級クラスに行ってきました。
◆自動音声テキスト変換機能
セミナーには、いろいろな立場の方がみえていました。テープ起こし会社勤務の方、テープ起こし在宅ワーカーの方、テープ起こしを発注する側の方、そして福祉系の方。たしかに、周囲の人のしゃべりが次々と自動音声認識されて文字で出てきたら、聴覚が不自由な方の役に立つかもしれません。
複数の参加者がその場で新聞を読み上げて音声をテキスト変換させるという実験も行われ、もちろん100%には遠いものの、なかなかの認識率でした。
ボイススピリッツ社の武内さんが読み上げても「エコカー」が「ココア」と認識されたりするので(笑)、やらせっぽい嘘くささがなく、どんな言葉がどんなふうに認識されるか理解できました。
Voice Writingは音声内のしゃべりを認識させることもできるのですが、最も認識率アップにつながるのはやっぱり「リスピーク」とのことでした。リスピークとは、音声内のしゃべりをマイクに向かって自分で発語し直すことです。
◆再生位置の自動保存
複数の音声ファイルを参照して起こす場合は、Voice Writing「再生位置の自動保存」という機能が便利なことを、今回のセミナーで知りました。
マイクなしの会議を録音するときは、例えばテーブルの上座と下座など、離れた場所に複数のレコーダーを置くことで、万全な録音になります。
この複数の音声を参照しながら起こす場合、違う音声ファイルを開くたびにタイムカウンタが音声冒頭(00:00:00)に戻っていると、該当個所をもう一度探すのが大変です。「再生位置の自動保存」とは、例えば音声Aを26秒まで聞いたところで音声Bを開き、また音声Aに戻ったとき、音声Aは0:00:26の位置で開くというものです。

Voice Writingは、同じフォルダに入っていれば複数の音声ファイルを待機(?)させておける。今、一番上の音声ファイル「DS750023.mp3」を13分23秒まで聞いたところ。ほかの音声ファイルを聞いて戻ったとき、「DS750023.mp3」の再生位置は00:13:23部分が開く。
※再生位置の自動保存機能は、書き起こしモードのとき有効になり、波形編集画面を開いているとき等は使えません。また、Voice Writingを終了するとリセットされるので、次回ソフトを立ち上げたときは00:00:00に戻っています。