テープ起こし・音声起こしの総合情報サイトokoso | 最新サービス・新製品情報

最新サービス・新製品情報

音声認識による文字起こしサービス「VoXT」とは(第1回)

株式会社アドバンスト・メディアの新サービス「VoXT(ボクスト)」は、クラウド上の音声認識サービス。講演やインタビューなどの音声ファイルをクラウドにアップすると、音声認識技術で文字化したデータを返してくれます。

 

というクラウドサービスの説明に、同社から広報の河村悠紀子さんと議事録事業部営業部の鶴田大基さんが、okoso編集部に来てくださいました。

 

◆お試し文字変換1分はいつも無料

VoXTで文字化させるための価格は、「基本プラン」が音声1分あたり30円。「お得プラン」は月額2000円で2時間分までの音声文字変換が可能。2時間以降は30円/分(いずれも+消費税)。

VoXTアプリをダウンロードして登録してから2週間は、無料で体験できます。

 

また、無料体験期間を過ぎても、「この音声ファイルは音声認識に向くかな?」と心配なときは、音声の任意の1分間を無料で認識させられます。お試し認識で認識率が良ければ、この音声はいけると判断して、全体を認識させればいいわけです。

 

VoXT

https://voxt.jp/

 

…と、ひととおりの説明をお聞きしたあと、さっそく「それって使えるの?」という話に入っていきます。

 

◆VoXTアプリで誤認識部分を手軽に確認できる

鶴田:ご存じのように、音声認識技術というものは精度100%とはいえません。誤認識部分の修正は、VoXTアプリを使っていただければ便利です。音声認識はクラウド上で行いますが、このVoXTアプリはお使いのPCにインストールしていただくことになります。

認識結果は、VoXTアプリの画面では、発話区間ごとに音声のカウンタと文字認識結果が紐付いています。認識結果はWordに書き出すことができます。またVoXTアプリの画面では、文字をクリックすると、その部分の音声が再生されます。

 

 

20131119094652_2.jpg

 

 

廿:必要なところだけ、スピーディーに元音声を確認できるということですね。

 

河村:はい。記者の方などは、インタビューした全文を記事として発表するわけではありませんよね。記事を書く上で重要な、例えばある製品の価格について聞いた部分を念のため再確認したいというようなニーズがあるわけです。認識率が完全に100%でなくとも、ある程度の認識結果であれば、文字列を見て「あ、この辺だ」と分かります。その文字列をクリックして、元の音声を聞いていただくという使い方をしていただくことで、音声を全部聞いて該当部分を探すよりも作業時間が大幅に短縮できるわけです。

 

◆音声の再生・一時停止をスピーディーに

鶴田:また、VoXTアプリでは、音声の再生・一時停止がキーボードの操作で行えます。マウスを使って音声再生ソフトとWordの画面をいちいち切り替えて修正するより、ずっとスピーディーです。

 

はい、今、半分ぐらいの人が、「そのどこが新しいの?」と思い、半分ぐらいの人が「すごい、そんな斬新な機能があるなんて」と思いましたね(割合は私の想像です)。

 

テープ起こし(音声起こし)を仕事にしている人はずっと前から、音声の再生・停止等の作業がキーボードで行えるソフトウエアを使っています。Mojo氏のフリーソフト「おこしやす」が2004年1月、「Okoshiyasu2」が2006年の発表ですし、他にも類似ソフトがいくつもあります。しかも、キーボード使用でもまだ効率が悪いというわけで、フットスイッチで再生・一時停止などを行う人も多くいます。

 

ところが、ライターとか記者、あるいは聞き取り調査を行う研究者などは、案外これらの音声ソフトの存在を知りません。ICレコーダー本体の小さな再生・一時停止ボタンを操作しながら、書き起こしたりします。あるいは、ICレコーダーから音声ファイルをPCに取り込むところまでは思いついても、Windows Media Playerをマウスで再生・一時停止して聞きつつ、Wordに切り替えては文字を入力するという面倒なことをしていたりします。

最近は大学などでも講義をICレコーダーで録音している学生がいますが、彼らもたぶん便利な音声ソフトがあることを知らないのではという気がします。

ですから、オコシスト以外の人に向けては、「このアプリを使えば音声の再生・一時停止などが便利!」というのは、訴求力を持つと思います。

 

ちなみに、VoXTアプリがキー操作で行える項目は次のとおりです。キー割り当ては候補から選択できます。

 

01-02.jpg

 

 

 

自動巻き戻し(オートバックスペース)機能やカウンターコピー機能がないことから、職業的オコシストの方にはおすすめしにくい感じではありますが、この点も一般の人には問題ないと思います。

次回は実際にVoXTを使ってみます。

次回へ

音声認識による文字起こしサービス「VoXT」とは バックナンバー
第1回  第2回  第3回  第4回