テープ起こし・音声起こしの総合情報サイトokoso | 上手な録音起こし方の基本

上手な録音起こし方の基本

AmiVoiceをオコシストとして使う「第7回 取材を終えて」

6回にわたって、株式会社アドバンスト・メディアの樋爪さんから、AmiVoiceの使い方についてアドバイスをいただきました。いかがだったでしょうか。読者プレゼントも無事、当選者の方のお手元に届きました。

 

AmiVoiceは音響学習によってユーザーのしゃべり方を覚え、ユーザーはAmiVoiceに認識されやすいしゃべり方を体得していく。第2回でそう聞いたとき、ハリー・ポッターのようだなと、ふと思いました。

 

ハリー・ポッターの最終巻で、杖つくりのオリバンダー老人が「杖は魔法使いから、魔法使いは杖から学ぶのじゃ」と言っていました。他人の杖でも魔法はかけられるけれど、自分の杖を使ったとき魔法は最も強力に発動する。また、そういう関係になるように、杖とそれを所有する魔法使いはお互いに影響し合っていくという意味です。

 

「音声認識ソフトは、ソフトウエアがユーザーに依存しているような特殊な関係」と、樋爪さんはおっしゃっていました。

でも考えてみれば、それはMS IMEやATOKなど日本語変換システムのソフトウエアでも同じです。例えば「変換辞書を育てていくという意識を持つ」「変換の第1候補ができるだけ入れ替わらないように使う」ことが入力の効率アップにつながると、先輩オコシストの方がかつて教えてくれました。

音声入力ソフトも、認識されにくい言葉は違う言い回しで発話したりして、あの手この手で効率よく使えば役立ちます。ソフトの機能改善も続けられているようですし、今後に期待しつつ、まずは「ボイスをためてレベル上げ」からやってみましょう。

 

今年3月15日のアップデートで、AmiVoiceのマスター辞書に「標準(大)- 汎用音響モデル」が加わりました。樋爪さんによると、これが最も汎用的にいろいろなジャンルの音声を認識できるそうです。ただし、「標準(大)- 汎用音響モデル」はこれまでの音響学習データを引き継げないとのこと。

 

ami10.jpg

 

せっかく「標準(大)」をレベル12まで上げたんだけど…。でも、使い勝手がいいと聞いたからにはこれをメインのマスター辞書にして、またレベル1からボイスをためていくことにしました!

 

(追記:ここまで記事を書いたあと、「汎用音響モデル」の「ボイスをためてレベル上げ」を始めました。私がリスピーク特有のしゃべり方に慣れたせいもあって、今回は手際よく進んでいます。初日はスタートから1時間半足らずでレベル4までいきました。本日5月28日現在レベル26です)

 

第1回

第2回

第3回

第4回

第5回

第6回

コメントする