テープ起こし・音声起こしの総合情報サイトokoso | 上手な録音起こし方の基本

【連載第2回】「会議を文字にするソフト」を探している方へ

◆「159000000人」という文字化ではそのまま使えない

議事録が、数字を例えば「全角アラビア数字、位取りカンマあり、単位字(区切りごとの漢数字)を入れる」という仕様で、「1億5,900万人」などと表記することになっている場合、「159000000人」「一億五千九百万人」などのパターンで文字化されると、せっかく文字化されても人間がいちいち修正しなければならない。
そのため、アドバンスト・メディアの議事録作成支援システムでは、数字をどう表記するかなどのルールをあらかじめ設定しておくことができる。

ami2-05.png

 

また、「えー」「あのー」などの不要語は自動で削除されるモードと、不要語まですべて再現するモードが選べる。速聞き・遅聞き再生や、音声の特定部分のみを繰り返し再生するループ機能などが、キーボードのみで操作できる。

 

◆整然とした会議なら発言者を特定できる

文字認識結果の表示には、左側に自動で発言者名(話者名)が表示される。この「話者の識別機能」は最初から有効なわけではなく、運用の中で学習させることによって話者を識別できるようになるという。
ただ、議会は一般に、議長が「××君」と指名すると××議員が登壇してしゃべり出すというように、1人ずつ整然と発話するので話者を識別しやすい。これに対してディスカッション的な会議では、1人が話し終わらないうちに別の人が発言したりするので、話者識別機能は参考程度にしかならないという。

 

◆認識率には限界がある、だから利便性を高める

文字の修正が終わったら、ワードファイル・一太郎ファイル・テキストファイルからファイル形式を選んで、書き出しを行う。書き出す際には書式を細かく設定でき、それをテンプレートとして保存しておける。書式とは、例えば話者名のみゴシック体で発話内容を明朝体にする、全体を2段組みでレイアウトする、などだ。

 

作成されたファイルを開くと、議事録本文はほぼできあがっている。あとは文書冒頭に出席者名や議題一覧など、議事録におきまりの内容を入力すれば完成だ。

 

志村さん:音声認識の認識率を高める努力はもちろんしていきますが、どうしても限界はあります。そのため、後工程の作業で時間がかかる部分をユーザーさんからお聞きして、書き出し時にこのようなテンプレートを設定できるようにするなど、いろいろな解決策をソフトウエアに組み込んでいます。
文字認識結果の編集作業は、地方議会の場合、議会事務局の職員が担当されるケースが約8割です。一方、音声を送信して速記会社で編集する場合もあります。東京都議会ではデータを会議30分経過ごとにインターネットで自動転送し、速記会社がただちに認識誤りを修正しています。

 

※「速記会社」について
以前は話し言葉を記録・再現する手段が速記しかなかった。そこで、話し言葉を文字化する会社は速記の会社としてスタートしている場合が多く、現在でも速記会社と呼ばれている。今でも国家資格を持った速記者が在籍して活躍しているが、テープ起こし(録音した音声からの文字化)や、このような音声認識データの加工なども業務範囲になっている。

 

次回は、この「議事録作成支援システム」と単体のパソコン用音声入力ソフト「AmiVoice Es2008」との違いを聞く。

 

  前ページへ     2  

 

連載第1回へ   連載第3回へ   連載第4回へ