テープ起こし・音声起こしの総合情報サイトokoso | 廿・今日もテープ起こし中

廿・今日もテープ起こし中

おすすめソフトのブログ記事

夏休み特別企画! テープ起こし用のおすすめ音声ソフトを豪華10連発でご紹介します。ソフトの選定は、私(廿里美)の独断です。ソフト名のアルファベット順にご紹介してきたこのコーナー、今日は最後の2ソフトです。

 

Windows Media Player
Windowsユーザーの場合、とにかくこのソフトは入っていて、たいがいの音声・動画ファイルを再生できます。私は、送られてきた音声を最初に聞いてみるときこのソフトを使うので、ほとんど毎日のように起動しています。特徴欄は×ばかりになってしまいましたが、あなどれないソフトです。

 

Windows Media Playerの特徴
1)ホットキーが使える…×
2)再生・停止が同じキーでできる…×
3)ちょっと戻り(オートバックスペース)ができる…×
4)速聞き・遅聞き時に音程が変わらない…×
5)ノイズ除去など…×
6)その他…多くの音声ファイル形式・動画ファイル形式を再生できる
7)価格…無料

 

先日、「ICレコーダーを骨までしゃぶる」でiPhoneのボイスメモを使ってみたところ、拡張子がm4aというAACファイルが作成されました。このファイル形式の存在自体を初めて知りましたが、Windows Media PlayerやQuick Time Playerで難なく再生できました。

 

テープ起こし用の音声ソフトは、再生できるファイル形式が一般に少ないので、AACなどはmp3など無難な形式に変換して使うことがほとんどです。ごくまれに、変換ソフトがなかなか見つからない音声形式で仕事が来ることがあります。そういう場合は、Media Playerで再生しておいて、それをVoice Writingで録音するという方法があります。

 

Voice WritingのStandard Editionには、PC内で流れる音声を何でも録音できる「超驚録」が組み込まれています。PC内で流れる音声(この際YouTubeでもUstreamでも)を何でも録音するソフトは、Windows XPにはいくつかありますが、Vista以降で使えるソフトはほとんど「超驚録」だけと言ってもいいぐらい少ないのです。…と、これは脱線でしたね。
さて、次ページは10連発最後のご紹介ソフトになります。

 

  〈1〉  〈2〉  次ページへ

 

連載第1回へ

連載第2回へ

連載第3回へ

夏休み特別企画! テープ起こし用のおすすめ音声ソフトを豪華10連発でご紹介します。ソフトの選定は、私(廿里美)の独断です。3回目の今回は、数少ないMac用のソフトから。

 

Pardon? OS X
http://www.vector.co.jp/soft/mac/edu/se220059.html
作者:永野靖忠氏

 

これはMac用のソフトです。そのため残念ながら自分では使ったことがありませんが、一応のご紹介です。

 

私の知っている範囲で、Pardon?の特徴
1)ホットキーが使える…○
2)再生・停止が同じキーでできる…○
3)ちょっと戻り(オートバックスペース)ができる…○
4)速聞き・遅聞き時に音程が変わらない…○
5)ノイズ除去など…不明
6)その他…不明
7)価格…フリー版と有料版シェアウェア1155円

 

  〈1〉  〈2〉  次ページへ

 

連載第1回へ

連載第2回へ

連載第4回へ

夏休み特別企画! テープ起こし用のおすすめ音声ソフトを豪華10連発でご紹介します。ソフトの選定は、私(廿里美)の独断です。2回目の今回は、まず海外ソフト。

 

Express Scribe
http://www.nch.com.au/scribe/index.html

NCH Softwareというオーストラリア企業のソフトです。

 

Express Scribeの特徴(分かる範囲ですが)

1)ホットキーが使える…○
2)再生・停止が同じキーでできる…×
3)ちょっと戻り(オートバックスペース)ができる…○
4)速聞き・遅聞き時に音程が変わらない…○
5)ノイズ除去など…不明(英語なのでよく分からない、すみません!)
6)その他…多くの音声形式に対応している、ブックマークが付けられる。
7)価格…無料

 

英語ですがめげずに、このページ下部の「Supported File Formats」という欄を見てください(私はサイト翻訳機能を使って見ています)。たくさん挙がっています。
中でも、オリンパス形式、ソニー形式、フィリップス形式、サンヨー形式に対応しているのが目を引きます。もっとも、Digital Voice Editorで書いたように、最近はメーカー独自形式の音声はずいぶん減りましたが。

 

音声のあとでもう一回確認!と思った個所にブックマーク(インデックスマーク)を付ける機能は、Digital Voice EditorやDSS Playerにも一応あります。ただ、自社のICレコーダーで録音された音声でないと付けられないなどの制約があります。このソフトは、そういう制限がないので便利です。

 

  〈1〉  〈2〉  〈3〉  次ページへ

 

連載第1回へ

連載第3回へ

連載第4回へ

夏休み特別企画! テープ起こし用のおすすめ音声ソフトを豪華10連発でご紹介します。ソフトの選定は、私(廿里美)の独断です。

 

「テープ起こし用の音声ソフトって、最適なのを1つ勧めればいいんじゃないの?」

 

そうとも言えましょう、しかし。
どのソフトにもそれぞれの特徴があるので、用途によって使い分けることもおすすめです。

 

まず、テープ起こし用音声ソフトに必要な機能として次の5つを定義しましょう。
1)ホットキーが使える
2)再生・停止が同じキーでできる
3)ちょっと戻り(オートバックスペース)ができる
4)速聞き・遅聞き時に音程が変わらない
5)ノイズ除去など

 

1は、他のソフト(例えばワードやエクセル)がアクティブになっていても、キーボード上の特定のキーで音声ソフトを操作できる機能。いちいちマウスに持ち替えてアクティブなソフトを切り替えると、作業効率が落ちますから。
2は、私はこのほうが便利だと思うのですが、慣れの問題かもしれません。
3、テープ起こしをしているとき音声をストップするのは、入力が追いつかなくなったときなので、その数秒手前から聞ける機能が便利なのです。
4、再生速度を変えると声のトーンも変わってしまうのでは、聞き取りにくいので。
5、私自身はこの機能をあまり使いませんが、各ソフトが工夫している部分なのでご紹介します。

 

ではさっそく次ページから…。アルファベット順の登場で、まずはこんなソフトです。

 

  〈1〉  〈2〉  〈3〉  次ページへ

 

連載第2回へ

連載第3回へ

連載第4回へ

 4月15日の「最新サービス・新製品情報」に、アドバンスト・メディアの議事録作成支援システムが納入60件を達成という記事を掲載しました。その記事内に「興味しんしんです」と書いたあと、考えました。「興味あるわー」というやじ馬的な態度に終わらず、音声認識技術についてしっかり取材した記事を書くべきではないかと。

 

 ICレコーダーなどに録音された音声を、自動で文字化するソフト。それがあれば仕事は劇的にラクに、速くなる。そのための情報を探してokosoにたどり着いてくださる方が多いからです。
 一方で、そんなソフトが普及したらテープ起こしをする者は仕事を失うのではという心配の声もよく聞きます。

 

 そこで、昨日アドバンスト・メディア社にお邪魔してきました。
 下の写真は、AmiVoiceの音声認識による文字化(が映し出された会議室のスクリーン)です。私がきのうの日経新聞の社説冒頭を読み上げたもので、「声の登録」や「マイクのトレーニング」不要、チャレンジ一発。かなりうまく文字化され、同音異義語が正しく処理され、句読点まで挿入されています。

amivoice3.jpg

 「し」という無駄な1文字があるのと、誤:日米欧等→正:日米欧と、という2カ所が誤認識です。といってもこれは誤認識というより、私が言いよどんだところ。実際にそう発音しているので、必ずしもソフトのせいではありません。

 

 普通のメディアだったら、この認識率に感服し、あとはシステムの概要や納入状況などを手際よく紹介して簡潔にまとめるところです。しかし、業界の人間としては「でも、これって××(←伏せ字。連載をお楽しみに!)だもの」と反射的に思います。
 そのとき、先方も「でも、これは××ですからね」とおっしゃったのです。
 オコシスト以外で、音声の文字化についてこれほど理解している方々にお会いしたのは初めてでした。

 

 同社の「議事録作成支援システム」は数百万円、PC用音声入力ソフト「AmiVoice Es 2008」は2万円弱、iPhone向け「音声認識メール」は105円。この途方もない価格差は何から来るのか。
 それは主に、音声認識の限界を補うための周到な対策の差でした。その説明は非常に納得のいくものだったので、この際okosoではドーンと、できるだけ詳細にご紹介します。音声認識技術の現状についてここまで詳しく書けるのは、テープ起こし・音声起こしの総合情報サイトであるokosoしかない!という意気込みで。

 

 AmiVoice Es 2008の試用版を頂戴いたしました。ありがとうございます。

amivoice1.jpg

 というわけで、音声認識に関する連載は来週からスタートです。

先日「イベント・セミナー情報」でご案内した、Voice Writingセミナー、東京開催の上級クラスに行ってきました。

 

自動音声テキスト変換機能
セミナーには、いろいろな立場の方がみえていました。テープ起こし会社勤務の方、テープ起こし在宅ワーカーの方、テープ起こしを発注する側の方、そして福祉系の方。たしかに、周囲の人のしゃべりが次々と自動音声認識されて文字で出てきたら、聴覚が不自由な方の役に立つかもしれません。


複数の参加者がその場で新聞を読み上げて音声をテキスト変換させるという実験も行われ、もちろん100%には遠いものの、なかなかの認識率でした。
ボイススピリッツ社の武内さんが読み上げても「エコカー」が「ココア」と認識されたりするので(笑)、やらせっぽい嘘くささがなく、どんな言葉がどんなふうに認識されるか理解できました。
Voice Writingは音声内のしゃべりを認識させることもできるのですが、最も認識率アップにつながるのはやっぱり「リスピーク」とのことでした。リスピークとは、音声内のしゃべりをマイクに向かって自分で発語し直すことです。

 

再生位置の自動保存
複数の音声ファイルを参照して起こす場合は、Voice Writing「再生位置の自動保存」という機能が便利なことを、今回のセミナーで知りました。

 

マイクなしの会議を録音するときは、例えばテーブルの上座と下座など、離れた場所に複数のレコーダーを置くことで、万全な録音になります。
この複数の音声を参照しながら起こす場合、違う音声ファイルを開くたびにタイムカウンタが音声冒頭(00:00:00)に戻っていると、該当個所をもう一度探すのが大変です。「再生位置の自動保存」とは、例えば音声Aを26秒まで聞いたところで音声Bを開き、また音声Aに戻ったとき、音声Aは0:00:26の位置で開くというものです。

 vw-3.jpg

 

Voice Writingは、同じフォルダに入っていれば複数の音声ファイルを待機(?)させておける。今、一番上の音声ファイル「DS750023.mp3」を13分23秒まで聞いたところ。ほかの音声ファイルを聞いて戻ったとき、「DS750023.mp3」の再生位置は00:13:23部分が開く。

 

※再生位置の自動保存機能は、書き起こしモードのとき有効になり、波形編集画面を開いているとき等は使えません。また、Voice Writingを終了するとリセットされるので、次回ソフトを立ち上げたときは00:00:00に戻っています。

忘れないうちに、自分のためにメモ。
Voice WritingのProfessional Editionには、超驚録が入っているので録音ができます。「でも、あれって1分しか録音できないですよねえ?」と先日ボイススピリッツ社の武内社長にお聞きしたら、初期設定が1分になっているためだそうです。

[設定]→[録音設定]の[指定時間後に停止する]を設定変更すればOK。

このところ、Voice WritingやOkoshiyasu2のホットキーの設定について質問されることが多い。

ところが私は、DSS Playerのフットスイッチを使っているので、最近あまりホットキーを使っていない。質問へのお返事には下のような内容を書いているのだけど、もっとおすすめのキー設定があったらぜひ教えてくださいね。デスクトップPCだとFキーは遠く感じるけど、ノートPCだとFキーも案外近いから、Fキーを割り当てている人もいるのかな。

 

Voice Writingの初期設定では、下記が割り当てられています。特に支障がなければこれでいいのではと思います。
再生・停止 CapsLock
早送り Ctrl+→
早戻し Ctrl+←

 

ただ、お使いのパソコンで(というよりIMEなど日本語入力ソフトで)、CapsLockを押すと入力が英数モードになる設定になっている場合、CapsLockは使えません。
その場合は、再生・停止 Ctrl+↓ などがいいかと思います。

 

Okoshiyasu2では、上記のほかに次のような組み合わせも使えます。
再生・停止Ctrl+:
早送り Ctrl+]
巻き戻し Ctrl+;

 

Voice Writing・Okoshiyasu2とも、キー設定画面では、必ず「設定」をクリックしてから「保存」「をクリックしてください。

 

その後ツイッターで質問してみたら、Okoshiyasu2のいろいろなキー設定が寄せられました。その特徴は「私は再生・停止にこれを使っています」というもので、巻き戻しや早送りのキー設定情報が特にない(笑)。私も、再生・停止にCapsLockを割り当てて、それ以外の操作はマウスを使っています。停止したとき自動で数秒巻き戻るように設定しておけば、大きく巻き戻す必要はさほどないので。

 

テープ起こしを仕事にしている人はATOKユーザーが多いため、下記にはMS-IMEユーザーには使えないキーが混じっています。

【ツイッターで寄せられたOkoshiyasu2の再生・停止キーの設定例】

・F12

・Ctrl+D

・無変換キー

など

Okoshiyasu2で音声の再生・停止にCapsLockキーを割り当てていると、CapsLockを押すたびに入力が英数モードになってしまうという件について、「音声ファイル講座」を主宰されている土屋恵美子さんが教えてくださいました。

 

「Okosiyashu2」のCaps Lockキーの件ですが、ATOKまたはMS-IMEのショートカットキーで、英数の設定を解除していないからです。

  

なるほど。Caps Lockは本来、英字の大文字・小文字を切り替えるキーですが、そのキーで英数入力モードに切り替える設定になっていると、英数入力モードに切り替わってしまうということですね。

 

たしかに自分のATOKでキー設定を見ると、英数キー(Caps Lockキー)には操作が何も割り当てられていない。だからOkoshiyasu2用のキーとして使えるのか…。

atok-capslock2.png
(この画面の呼び出し方:ATOKで[プロパティ]→[キー・ローマ字・色]タブ→[キーカスタマイズ]をクリック)

 

  

IMEで入力しながらOkoshiyasu2でCaps Lockキーを押してみると…あ、ホントですね。音声の「再生・停止」も行われますが、入力ソフト(Wordなど)も英数入力モードになってしまいます。IMEの設定を見てみると、英数キーでかなと英数入力が切り替わる設定になっています。

ime-capslock2.png

(この画面の呼び出し方:IMEで[ツール]→[プロパティ]→[全般]タブ→[編集操作]の[キー設定]の右側の「変更」をクリックし、新しく出てくるウィンドウで[キー設定]タブ)

 


ということは、ええと…。こうなるんでしょうか。
1)英数モードへの切り替えをCaps Lockキーで行っている(今後も行いたい)人は、Okoshiyasu2の再生・停止にCaps Lock以外のキーを割り当てるべき。
2)英数モードへの切り替えをCaps Lockキーで行わない人は、MS-IMEまたはATOKの設定を変更すれば、Okoshiyasu2の再生・停止をCaps Lockキーで行える。

 

というわけで、Windowsのバージョンとは関係なかったようです。それにしても、なんで今年に限って多くの人から同じ質問を受けたんだろう…。

 

補足。私のパソコンは「Shift+Caps Lock」でCapsLockがONになり、Caps Lockだけを押しても何も起こらないのだそうです。これは、オフィスに来て私のパソコンを使ったことがあるSさんからの情報。
Sさんの自宅のパソコンでは、「Shift+CapsLock」でCapsLockがONになり、単独のCapsLockを押すと、「英数」がONになるそうです。

テープ起こしに便利な音声ソフトとしてOkoshiyasu2(作者:Mojo氏)があります。テープ起こし用音声ソフトとして欲しい機能はほとんどあって、しかもフリーソフト、つまりタダ。
今日はOkoshiyasu2で、1ギガバイトもある巨大な音声ファイルを再生しています。「重くて開けない!」というメッセージが出るかと思いきや、問題なくさくさくと動いています。

 

さて、その優れもののOkoshiyasu2にこのところ妙な問題が発生しているようです。
Okoshiyasu2で音声を聞きながら、Wordで入力。そのとき、音声の再生・停止にCapsLockキーを割り当てていると、CapsLockを押すたびにWordの入力が英数モードになってしまうという話が…。
Okoshiyasu2が公式に対応しているのはWindows XPまでで、Vistaや7では、XPでできたことの一部ができない場合があります。例えば、再生・停止にCapsLockキーを割り当てられないことがあるのですが。

 

それはもともとですが、今回のトラブルは、なぜかXPユーザーに発生しています。ここ2カ月ぐらいで何件も同じ質問を受けました。それで検証のため今日はOkoshiyasu2を使っているのですが、私のXPではCapsLockで再生・停止しても、Wordは日本語入力モードのまま維持されています。私がIMEではなくATOKを使っているからなのかな?
もうちょっと調べてみよう。この件について何かご存じの方、ぜひ教えてください。

 

とりあえず音声の再生・停止にCapsLockキー以外を割り当てれば済むことなので、Okoshiyasu2っていいソフトだなあという私の感じ方に変更はありません、念のため。

 

2010年1月28日追記:

皆さまに情報をお寄せいただき、この問題の謎が解けました。謎解き編として「Okoshiyasu2のせいでもWindowsのせいでもなく...」をアップしました。