テープ起こし・音声起こしの総合情報サイトokoso | 最新サービス・新製品情報

最新サービス・新製品情報

音声認識による文字起こしサービス「VoXT」とは(第2回)

それでは、クラウド型文字起こしサービスVoXTを実際に使ってみましょう。

 

◆サーバーへの音声アップは案外速い

取材の翌日、取材時に録音した音声ファイルで試してみました。VoXTアプリを自分のPCにインストールして、まずは音声ファイルのアップロード。音声長さは1時間11分46秒。

02-01.jpg

 

67MBの音声ファイルをサーバーにアップロードするのに、約4分でした。アップロード時間は、PCの性能やインターネット環境によって異なるようです。

 

◆音声を再生しながらお試し部分を選択

アップロード完了すると「発言箇所を検出中です」というメッセージが出ます。「発言箇所の検出が完了しました」が出るまでに、これも約4分。「音声を文字に変換」をクリックします。次の画面で「お試し文字変換(無料)」をクリック。

 

02-02.jpg

02-03.jpg

この画面では、音声を再生して聞きながら、お試し文字変換したいところを選ぶことができます。

 

◆Wordファイルと音声に連動した画面が表示される

「音声を文字に変換中です」というメッセージが出ます。「編集可能(文字変換結果が利用できます)」が出るまでに、約5分。

「編集を開始/再開」をクリック。次の画面をOKすると、こういうWordファイルと、こういうVoXT画面が表示されます。

 

02-06.jpg02-07.jpg

認識された文字が読み取れないよう、小さい画像にしました。1/21のokosoにアップした予告記事「AmiVoiceの新サービス「VoXT」をめぐって双方向取材!」でも書いたように、少し離れた位置にICレコーダーを置いたため、音声認識には適さない音声なのです。認識結果はほとんど合っていません。それを承知で、VoXTの使用手順を解説するためにやってみただけですから。手順は全体に分かりやすく、スムーズに使うことができました。

 

VoXTを発表した株式会社アドバンスト・メディアは、AmiVoice SP2という音声認識ソフトも出しています。VoXTはAmiVoice と何が違うのでしょうか。次回に続きます。

 

次回へ

音声認識による文字起こしサービス「VoXT」とは バックナンバー
第1回  第2回  第3回  第4回