4月15日の「最新サービス・新製品情報」に、アドバンスト・メディアの議事録作成支援システムが納入60件を達成という記事を掲載しました。その記事内に「興味しんしんです」と書いたあと、考えました。「興味あるわー」というやじ馬的な態度に終わらず、音声認識技術についてしっかり取材した記事を書くべきではないかと。
ICレコーダーなどに録音された音声を、自動で文字化するソフト。それがあれば仕事は劇的にラクに、速くなる。そのための情報を探してokosoにたどり着いてくださる方が多いからです。
一方で、そんなソフトが普及したらテープ起こしをする者は仕事を失うのではという心配の声もよく聞きます。
そこで、昨日アドバンスト・メディア社にお邪魔してきました。
下の写真は、AmiVoiceの音声認識による文字化(が映し出された会議室のスクリーン)です。私がきのうの日経新聞の社説冒頭を読み上げたもので、「声の登録」や「マイクのトレーニング」不要、チャレンジ一発。かなりうまく文字化され、同音異義語が正しく処理され、句読点まで挿入されています。

「し」という無駄な1文字があるのと、誤:日米欧等→正:日米欧と、という2カ所が誤認識です。といってもこれは誤認識というより、私が言いよどんだところ。実際にそう発音しているので、必ずしもソフトのせいではありません。
普通のメディアだったら、この認識率に感服し、あとはシステムの概要や納入状況などを手際よく紹介して簡潔にまとめるところです。しかし、業界の人間としては「でも、これって××(←伏せ字。連載をお楽しみに!)だもの」と反射的に思います。
そのとき、先方も「でも、これは××ですからね」とおっしゃったのです。
オコシスト以外で、音声の文字化についてこれほど理解している方々にお会いしたのは初めてでした。
同社の「議事録作成支援システム」は数百万円、PC用音声入力ソフト「AmiVoice Es 2008」は2万円弱、iPhone向け「音声認識メール」は105円。この途方もない価格差は何から来るのか。
それは主に、音声認識の限界を補うための周到な対策の差でした。その説明は非常に納得のいくものだったので、この際okosoではドーンと、できるだけ詳細にご紹介します。音声認識技術の現状についてここまで詳しく書けるのは、テープ起こし・音声起こしの総合情報サイトであるokosoしかない!という意気込みで。
AmiVoice Es 2008の試用版を頂戴いたしました。ありがとうございます。

というわけで、音声認識に関する連載は来週からスタートです。


















