テープ起こし・音声起こしの総合情報サイトokoso | 廿・今日もテープ起こし中

廿・今日もテープ起こし中

今年の1月以降、「議事録未作成問題」がしばしばニュースになりました。東日本大震災後に開かれた震災や原発事故対策の政府の会議で、議事録が作られなかった問題です。

 

◆たしかに地震直後、音声起こし業界はひまでしたが…

政府などの公的な会議では、議題と決定事項ぐらいを記録した文書は「議事概要」とか「議事要旨」という名前で呼ばれることがほとんどです。ここでいう「議事録」とは、もっと詳細に発言者名と発言内容を記録したものを指します。

 

 

machi1.jpg

 

資源エネルギー庁のWebサイト「審議会・研究会」コーナーから、議事要旨と議事録両方を作成している例。議事要旨は1回分が数千字に対し、議事録は1回分がPDFファイルで数十ページもある。

 

 

オコシストとしては、公的な会議で詳細かつ正確な発言記録を作るのは当然と言いたいところです。

もちろん、速記・テープ起こし業界にたくさん仕事を発注してほしいからという意味ではありません。衣服がクリーニング業界のために存在するわけではないように、会議は速記・テープ起こし業界のために存在するわけではないのですから。

(もっとも、震災後は国際会議が中止になったりして文字起こしの仕事は一時かなりひまになったので、あのとき政府や地方自治体がたくさん発注してくれたらみんな喜んだとは思いますが)

 

受注が目当てでなければ、なぜ「オコシストとして」議事録作成が必要だと思うのか。それは、仕事柄たくさんの会議音声を文字起こししてきて、詳細な発言記録にはたくさんのメリットがあると感じているからです。

 

まず、言うまでもなく、会議に参加していない人にとって議事録は討議のプロセスを検証できるという機能があります。そのために政府の会議などは、平成21年に公文書管理法ができて、議事録を作成・保存・公開することになっているわけです。

※法律の条文を確認したところ、作成・保存はともかく、公開については「独立行政法人等情報公開法」という別の法律が関係してくるようです。

 

議事録未作成問題については、「阪神・淡路大震災や中越沖地震のときも議事録は作られていなかった、それなのに当時政権党だった自民党ほかが騒ぐのはけしからん」という意見もネット上で見受けられます。ただ、阪神や中越沖は公文書管理法の成立前でした。

 

◆議事録があれば120年前の会議も全部分かる!

国会や地方議会は、「逐語」すなわちすべての発言を言葉どおりに記録する形で記録を取っています。今調べてみたら、衆議院の第一回通常会は明治23年12月2日火曜日に開催されていることが分かりました。

 

議長「今日は全院委員長を選挙します。今日は皆さんを番号で呼びますからね」、大江卓議員「ちゃんと姓名があるんだから番号で呼ばないでくれ」というようなやりとりから始まっています(旧漢字とカタカナ表記で読みにくいですが、概ねそういう意味のようです)。

120年前のささいなやりとりまで再現されているのが、記録の威力です。何か知りたいこと、研究したいことがある人にとって、詳細な議事録は宝の山になります。

 

dai1kai.jpg

第1回帝国議会・衆議院第一回通常会(明治23年12月2日)の議事録

 

国立公文書館 アジア歴史資料センター

標題:第1回帝国議会・衆議院議事録・明治23.11.29~明治24.3.7

(12ページから議事スタートです)

 

 

ささいな発言まで発言者名付きで公表されることに抵抗感は誰しもあるはずですが、しかし。

 

〈1〉  〈2〉   次ページへ

 

「この仕事って、“聞き起こす”んでしょうかね、“書き起こす”んでしょうかね」

「そうなんですよね…。私も“音声起こし”って言ったり“文字起こし”って言ったりするんですけど」

 

つまり、音声を→聞いて→文字に→書く仕事。

それぞれの方向から表現すると、音声起こし、聞き起こし、文字起こし、書き起こし、になってしまうわけです。

 

でも、なんとなく「起こす」感じはみんなが持っているようです。

音声のままでは、一覧性や検索性が低い。それを起こしてきて、使いやすくする。音声起こし(テープ起こし)とは、そういう仕事なのだと思います。

 

 

昨年連載していた【話し言葉の処理】を、久々に再開します!

私は夏に弱いので昨年6月30日の更新で止まってしまい、昨年の秋から冬はセミナーの仕事などがあって、今年の春は中級教材を作っていたし、夏はまた死んでいて、秋になったので再開という気長な世界です(すみません)。

 

【話し言葉の処理】の第1回は、次のような内容を書きました。

話された言葉を → 聞く

書かれた言葉を → 読む


テープ起こしの仕事は、口頭で発話された言葉を文章化する。受け手側は、口頭で発話された言葉を文章として読む。そこに、次のような「ねじれ」が生ずる。


話された言葉を

→ 読む


話された言葉をどう処理すれば、このねじれを緩和して、文字化・文章化・文書化できるのだろうか。

 

これが問題意識で、

第5回までは、ねじれを埋めるための作業としての、ケバ取りや整文について書いてきました。

 

今年の春は、「ひとりで学べる音声起こし教材【中級1】素起こし+軽い整文」というダウンロード教材を作りました。その教材では、ケバ取りや整文について、考え方や処理例をたくさん挙げながらかなり詳しく書きました。処理の方針はテープ起こし会社各社で違うと思うけど、一つの考え方を知っていれば、それとの対比でどの会社の方針も理解しやすいはずなので、とりあえず私の考えということで書いたものです。

教材を作る過程で、日本語の話し言葉と書き言葉はどうしてこうも違うのかという謎に、また行き当たりました。

 

考えてみれば、私はこの謎に中学・高校時代も悩まされています。その当時は英語と日本語のギャップと思っていたのですが。

12歳の私が抱いた疑問を40歳すぎてようやく解いてみたら、それはテープ起こしの仕事と密接に絡み合っていました。つまり、日本語の話し言葉と書き言葉はどうしてこうも違うのかという問いであり、その処理方法を探ることがテープ起こしの仕事には欠かせなかったのです。

 

その謎とは、「This is a pen.」をめぐる物語…。来週からスタートします。お楽しみに!

 

 

今朝、「24時間体制でネコネコを監視」と聞こえたのでテレビの画面を見たら、山と泥水が映っていました。先日の台風による紀伊半島の「せき止め湖」の話題でした。

「人々」とは言うけど「猫々」なんて言わないよね、テープ起こしを十数年やっていながら、なんという聞き間違い。

…と思いながら事務所に着いてPCを立ち上げ、Yahoo!を見たら「紀伊半島土砂ダム 決壊の恐れ」というニュースの見出しが目に入りました。

 

土砂ダム?「せき止め湖」と同じもの?

そういえば、土砂崩れなどで川がせき止められてしまった場所のことを、ちょっと前まで「天然ダム」と言っていませんでしたか。人為的に造ったダムではなくて…という意味でしょう。

お役所用語というか専門用語としては、河道閉塞(かどうへいそく)があります。この言葉は以前音声に出てきたので、私は単語登録してあります。

 

「紀伊半島土砂ダム 決壊の恐れ」というニュースは、TBS系(JNN)の提供によるものでした。Yahoo!で関連するニュースを次々クリックしてみたところ、2とおりの用語が出てきました。

 

土砂ダム」TBS系(JNN)、毎日新聞

土砂崩れダム」読売新聞、産経新聞、フジテレビ系(FNN)

 

あれっ。今朝のNHKニュースで言っていた「せき止め湖」は全くありません。

えーと、じゃあ朝日と日経は何と呼んでいるのか、それぞれのWebサイトを見てみましょう。

 

土砂ダム」朝日新聞、日経新聞

 

そんな。せき止め湖は?

NHKニュースで聞いたんだから、NHKのWebサイト「NHKオンライン」。

ありました。「奈良・野迫川村で避難指示」というニュースで、「奈良県野迫川村は、今後、雨が予想され、せき止め湖が決壊するおそれもあるとして」と記載されています。

 

ずいぶん用語が違うものです。一応どれも覚えておくことにします。音声に出てきたときすぐ文字が思い当たるか、そんな言葉あったっけ?とネット検索するはめになるかで、テープ起こしの作業効率はかなり違うのです。「堰」は常用漢字表外字だから通常「せき止め湖」と表記する…というところまで知っていれば、さらに効率的です。

 

いずれどれかの用語に統一されることになるかもしれませんね。今のところ、「土砂ダム」がわずかに優勢な感じです。

 

連用中止形は文法的に悪いものだと考えますか?
「連用中止形ってそもそも何?」という方が多いのではないでしょうか。文法用語なのだろうな、という推測はできるにしても。私もこの春初めて知りました。

 

ダウンロード教材「ひとりで学べる音声起こし教材【中級1】素起こし+軽い整文」を作成していたとき、Wordの文章校正機能を取り上げることにして、文章校正の詳細設定ウィンドウをあらためて確認してみました。
普段は大ざっぱに使っていたのですが、1項目ずつよく見ると、「これはチェックするべきだろうか、不要だろうか」と迷う項目がいろいろありました。その中に、「連用中止形の多用」という項目があったのです。

 

ren.jpg

一番下に見えているのが「連用中止形の多用」。

 

「文章校正の詳細設定」ウィンドウの出し方
・Word2003の場合:ツール→オプション→「スペルチェックと文章校正」タブ→文章校正の「詳細設定」
・Word2010の場合:リボン「ファイル」→オプション→文章校正の「設定」

 

動詞の連用形とは、用言の前に来るときの活用形のことです。例えば、動詞「出す」の連用形は「出し」で、「出します」「出して」というふうに「ます」や「て」につながります。
その連用形のうち、後ろに「て」が付くはずなのに付いてない形を、連用中止形と呼ぶようです。
学問的に正確な説明は私にはムリなので、Wordの文章校正で「連用中止形の多用」にチェックを入れて、実際の自動文章校正の様子を見てみましょう。

 

ren2.jpg

 

【1】で緑色の波線が表示されている4カ所が、動詞の連用中止形です。例えば「されて」ではなく「され」となっているために、波線が引かれています。「迎えて」ではなく「迎え」というのが2回。「なって」ではなく「なり」が1回です。
【2】は、1センテンスに1個だけの連用中止形です。多用されていないため波線は付いていません。1センテンスに2個以上の連用中止形があると「多用されている」ということでチェックされます。

 

校正でチェックが入るということは、連用中止形の多用は正しい文章ではないということなのでしょうか。

 

  〈1〉  〈2〉  次ページへ

「イナズマイレブンGO」というテレビアニメを目にしました。もともとこれはニンテンドーDS用のゲームソフトで、今回のは前作の続編でとか、うんちくはいろいろあるようなのですが。要するに、サッカーアニメのようです、しかし。
コの字型に高い壁が立ち上がってドリブルする者の行く手をはばむワザなど、何やら超能力バトルのようなものが展開されています。

 

いっそ、テープ起こしにもそういう必殺技があれば便利なのでは。さっそく考えてみました。夏の特別企画「あったらいいな!オコシストのエスパーワザ」です。

 

1「右化手」(みぎけしゅ)
 両手でタイピングしているとき、右手がもうひとつ現れてマウスを操作する。

 

2「左化手」(ひだりけしゅ)
 両手でタイピングしているとき、左手がもうひとつ現れて紙の資料をめくる。タイピング中にお菓子をつまんで口に入れる用途にも使える。
※右化手と左化手を同時に使うには、7日間の山ごもり修行が必要。

 

3「仮想10」(かそうてん)
 言葉を調べるためGoogle検索したとき、上位10個のWebページが空中にすべて開いて一覧できる。

 

4「選出光線」(せれくしょんびーむ)
 「仮想10」で開いたサイトのうち参考になりそうなものに、「これに決めた」という意思表示を行う、視線のワザ。残りの9サイトが自動的に閉じ、選んだ1サイトが空中に拡大表示される。
※目力(めぢから)が必要なので、「つけまつげ2枚重ね」などアイメイクを特に濃くする。

 

 

  〈1〉  〈2〉  次ページへ

Japanistは、かつて富士通が出していた日本語入力ソフトウエアです。私は日本語変換システムとしてはATOKを愛用していますが、年に1回か2回はJapanistに頼ります。ですから、CD-ROMを大事に保存して、PCが替わるたびインストールしています。

 

Japanistに頼る業務とは、過去に納品したファイルから専門用語などを一気に抜き出して、単語登録ファイルを作成すること。具体的にどうやるのかというと…。
ここ数日、okosoのツイッターである@okosozukin からつぶやいた実況を、まとめて掲載します。

 

7月5日

ATOKの文書学習ツール「おまかせキーワードチャージャー」って、たぶん長い目で見れば役立つのだろうけど。新分野の言葉は、Japanistで抽出して一気に単語登録するほうが確実ではあります。明日やろう。

 

7月6日AM


あまりに専門用語の多い審議会、しかも種類が増えて、これまでの単語登録ファイルに全く出てこない言葉が続出しています。今日は、単語登録ファイル作成を実況ツイートします。

 

Japanist2003、古いソフトですがVista対応のアップデートファイルが用意されていて、うまく動いてくれました。「おてがる登録」機能を起動して、Wordファイル23個を入れたフォルダを指定します。

 

japanist.jpg

 

2分とかからず、3456個もの単語を読みと品詞付きで抽出してくれました。でも「いけん サ変名詞 意見」など、登録する必要のない単語がかなり入っています。テキストファイルに書き出して、不要な単語を削除中。

 

「位置」や「図」は普通に変換できるけど、「位置図」は第一候補にこないことが多いので登録。「橋梁」は普通に変換できるけど、「橋台」(きょうだい)は出てこないので登録。

 

7月6日PM


午前11時、3500件を1100件に減らしたところで疲れたので、別の仕事を1時間ほどしていました。まだまだ減らします。面倒ですが、手動で単語登録するよりは速いし、見落としもないし、削除する言葉も一応読むので、頭に入ることは確かなのです。

 

作業中の単語ファイルと過去に作った単語ファイルを、まとめてエクセル1シートに貼り付ける。ふりがなで並べ替える。「次のセルと同じだと●が出る関数」を入れて、重複している語を削除。…まで終わりました。

 

ちなみに、「次のセルと同じだと●が出る関数」というのはこれです。
=IF(B1=B2,"●")
B列にふりがなが入っている状態で、この関数をA列に入力します。

 

ATOKで使うので、Japanistの品詞名をATOK型に変更。自動抽出された「品詞」や「読み」の明らかな間違いを修正。今生きている単語は571個。また別件の仕事に取りかかります。

 

聞き直しだけ自分でしたファイルって、自分のATOKに単語がたまっていかないので、ときどきこの方法で一気に単語登録しています。

 

  〈1〉  〈2〉  次ページへ

音声起こしの仕事を十数年やっていると、「知らなかったし、自分では一度も使ったことがないけど、案外普及している言葉」に出合います。
えいや」もその一つです。
この言葉は、次のような意味で使われます。
とにかく適当に決めてやっちゃおう(必要なら後で修正すればいいさ)
「えい、やー!」というチャンバラのかけ声、あんなふうに勢いで前に出るイメージです。
6月10日の毎日新聞「検証 大震災 福島原発事故3カ月」に、ちょうどいい用例がありました。

 

「半径20キロに根拠はない。エイヤッ、と決めた数字だった」と、決定過程に関わった文部科学省幹部は振り返った。

 

原発事故では10キロまでの防災対策しかもともと決められておらず、でもその外側も危険であることが分かってきて、とにかく急いで何らかの避難指示を出さなければいけないという、3月12日の決定について語った部分です。

 

「根拠はないけど、あとで修正することもできるはずだから、とりあえずこんな程度にと、決めた」
  ↓
「エイヤッ、と決めた」
表現を一気に簡潔化するマジックワードなのです。

 

「えいやでやるしかないわけです」「えいやで決めたことで」などと、私は口にしたことがなく、周囲の人が言うのを聞いた覚えもありません。
そのため、受け取った音声にこの言葉が初めて出てきたときは、聞き取れず、意味も分かりませんでした。「エンヤでやる」「エーヤでやる」…英語にそんな単語あったっけ、それとも人名か…などと考えてしまいました。

 

しかしネット検索すると、IT業界などでもよく使われている様子。さらに、「はてなキーワード」では「エイヤ」の意味や用例のあとに、「どの業種でもよく使われる言葉・・(?) 学生が社会人になると、真っ先に疑問に思う言葉のうちの一つ」という解説が付いています(笑)。実は、どの業種でも使われているようです。


はてなキーワード「エイヤ」 http://d.hatena.ne.jp/keyword/%A5%A8%A5%A4%A5%E4
真・コンピュータ用語辞典「えいや」 http://glossary.tank.jp/t049C.html
誰も教えてくれない用語集「えいや」 http://wiki.livedoor.jp/nobo_i0902/d/%A4%A8%A4%A4%A4%E4

前回、私が次のような条件で会社の新しいICレコーダー候補を選んだことを書きました。
・本体でステレオ録音可能
・内蔵メモリ4GB
・USBダイレクト接続、USB充電
・シーンセレクト(口述、会議などを選べば録音モードが自動設定される)

 

最初の3条件は、機材を買ったあとで使い方に迷うような機能ではありません。しかし、最後のシーンセレクトはどうでしょうか。「口述」は自分一人で機材に向かってしゃべる状況、これは簡単にイメージできます。しかし、シーンセレクトに「商談」と「会議」があったら、どう違うか迷うのではないでしょうか。

 

オリンパスイメージングのV-75は、手っ取り早くイラストで紹介していました。
これなら一目瞭然です。

v75-6.JPG  v75-2.JPG

 

「商談」は、少人数がひざを突き合わせて話している状態。ということは、インタビューなどもこれを選べばOKということが分かります。
「会議」は「商談」よりもうちょっと人数が多く、しかも誰かが立ち歩いていることもある、という絵ですね。ということは、プレゼンなどもこちらに入ることが多いでしょう。

 

各シーンがどんな録音設定になっているかを確認すると、「商談」はマイク感度が「中」、「会議」はマイク感度が「高」になっています。「会議」は、人数が多い上に動いている人もいる分、より頑張って音を拾う設定になっていることが分かります。

 

マイク感度は高ければいいというものではありません。
「高」であればそれだけノイズを拾う能力(?)も高いので、「低」や「中」で済む状況ならそちらを使ったほうがいいわけです。「口述」シーンのマイク感度は「低」になっており、周囲で多少音がしようとも自分の声をメインに拾うようになっています。

 

※V-75のシーンセレクトは、口述、商談、会議、講義から選ぶことができ、他にユーザーの独自設定が可能です。

 

V-75の機能は面白かったので、ウォッチングはまだ続きます。お楽しみに。

4月下旬、うちの会社(の青山オフィス)から、ICレコーダーを買い換えたい、どれがいいかというメールが来ました。
さっそく、次のような返事メールを書きました。

 

ICレコーダーの件、次のような条件で探してみました。
・本体でステレオ録音可能
・内蔵メモリ4GB
・USBダイレクト接続、USB充電
・シーンセレクト(口述、会議などを選べば録音モードが自動設定される)

 

そうしたら、各社見事に同じ価格帯です…(1万円程度)。
どれもおすすめだと思います。

 

SONY ICD-UX513F
http://www.sony.jp/ic-recorder/products/ICD-UX513F/

 

オリンパス Voice-Trek V-75
http://olympus-imaging.jp/product/audio/v75/

 

SANYO ICR-PS511RM
http://jp.sanyo.com/icr/lineup/ps511rm/

 

◆私のVoice-Trek DS-750も発売当初より買いやすい値段になっていますが
(今1万5000円弱)、
USBダイレクト接続できない、ボタンが小さく操作しにくいなどが
結構不便なため、おすすめに入れませんでした。

今回のおすすめ3機種は、いずれも内蔵メモリが4GBあるので、
MP3のビットレート128kbps(ステレオ録音)で約67時間分入ります。

 

v75-9.JPGこのメールの結果、青山オフィスが購入したのは、オリンパス Voice-Trek V-75でした。写真では分かりにくいですが、ボディーの色は黒ではなくグレーです。実物でも、角度によっては黒に見えます。
田無オフィスに借りてきましたので、次回からこのV-75の鑑賞レポートをお届けします。

 

鑑賞というのは、外見や使い勝手などの鑑賞です。音がいいことはすでに確認済みです。この機種で録音した座談会音声をさっそく起こしましたから。