テープ起こし・音声起こしの総合情報サイトokoso | 上手な録音起こし方の基本

上手な録音起こし方の基本

「ドラゴンスピーチ11J」を使ってみた(1)

今日は自宅作業。自宅PCにインストールしたまま全然使ってなかった音声認識ソフト「ドラゴンスピーチ11J」を試しています。

 

ds1.png

 

起動すると、「プロファイルの作成」がスタートしました。

(「プロファイル」って、プロフィールとどう違うんだっけとネット検索。プロフィールはもともとフランス語で、英語ではプロファイルのようです)

プロファイルの設定とは、ユーザーである私の声やしゃべり方、私が使うマイクなどを登録する作業です。まず、言語は日本語、年齢グループは「22-54」を選択しました。年齢に「回答しない」という選択肢があってちょっと笑えます。

 

CAPT0048.jpgのサムネール画像

 

ところが、しゃべってみると「音のレベルが低すぎます」という警告!

ds2.png

このヘッドセットマイクは確かに安物ですが、長女がいつもスカイプ通話に使っていますから、全然認識されないほどではないはず…。端子を抜いて挿し直したら認識されました。単に挿し方が甘かったようです。

 

しかし、やっぱり安物の悲しさ、「マイクのチェック:とても悪い」という判定でした。今後は必要があればオフィスで使っているヘッドセットマイクを持ち帰ることにして、とりあえずこのヘッドセットマイクで初期作業を進めることにします。

 

CAPT0050.jpg

 

続いて、ドラゴンスピーチではおなじみの、トレーニングテキストを読むプロセス。

「声に出して読む(約4分)ことで、ご自分の話しかたに適応するようにドラゴンスピーチをトレーニングすることができます」だそうです。ユーザーである私の訓練ではなくて、ドラゴンスピーチ側が私のために訓練してくれるわけですね。

 

CAPT0051.jpg

 

 

以前使ったドラゴンスピーチのバージョンは「Dragon Naturally Speaking 2005」でしたから、8年前だったようです。このときはドラゴンスピーチの認識精度も低く、私のPCのスペックも低くて、音声認識ソフトってホントに使えないわねっという感想でした。なにしろ、ドラゴンスピーチを使うと他のソフトがフリーズしたり、ひどいときはPC自体がダウンして再起動という状態でしたから。

 

ただ、2005を使ったとき興味深いと思ったのは、このトレーニング作業でした。ドラゴンスピーチ側がユーザーのしゃべり方を知るためのプロセスですが、同時にユーザー側も、PCの前でマイクに向かってしゃべるという動作に初挑戦するわけです。

そして、画面に表示されるテキストが、音声認識についてのチュートリアルになっています。声を出して読むわけですから、説明内容がユーザーの頭に入ります。

CAPT0053.jpg

 

トレーニング作業は2005当時と同じような内容でした。「マイクのチェック:とても悪い」だったわりにはすいすい進んで、すぐ終わりました。

 

さて、めでたく初期作業が終わって、いよいよ普通に使ってみます。最近起こした音声を聞きながらちょっとだけリスピークしてみました。おおー、素晴らしい認識精度!!

(実際の仕事案件を起こしたので、残念ながら認識された内容をお見せできません)

 

これならAmiVoiceの使い始め当時よりいいんじゃないの?と思うけど、それもたぶん違いますね。私が音声認識に慣れ、音声認識されやすいしゃべり方が以前よりできるようになってきているせいも大きいのです。2つのソフトを同時に使い始めるのでなければ、正しい比較はできません。

 

これから、よく使う言葉を学習させるなどの機能を試して、またレポートしたいと思います。ただし。

「ドラゴンスピーチ11じゃなくて“11J”だったら、ATOKと連動できるんじゃないの?」と興味しんしんのATOKユーザーの皆様、申し訳ありません。私は現在、日本語変換システムはGoogle日本語入力を使っていて、ATOKの月300円契約を解除してしまったため、ATOKとの連動は試せないのです…。

コメントする