テープ起こし・音声起こしの総合情報サイトokoso | 上手な録音起こし方の基本

上手な録音起こし方の基本

聞き取れない音声の原因と対策の最近のブログ記事

その場がうるさくて、肝心な人の声が聞き取りにくい。こういうとき、うるささには2種類あります。人の声以外がうるさい会場と人の声がうるさい会場です。

 

1)人の声以外がうるさい会場:操業中の工場での取材音声、窓を開けた部屋での取材で車の騒音がひどい音声など(そういえば、セミの声がうるさい音声とか、浜辺での取材で波の音が大きい音声も経験しました…)

2)人の声がうるさい会場:レストランや居酒屋での取材音声、大規模な展示会での取材音声など

 

○対策→

1)の場合:音声ソフトのノイズ除去機能を試す

2)の場合:自分がそこにいると思って聞く

 

いずれも、もし自分が会場選びから関われるなら、そもそもうるさい会場を選ばないこと。録音から関われるなら、マイク感度を低にして、近い声を主に拾う設定にします。

テープ起こしのみを担当する場合、人の声と全く違う音域のノイズは、テープ起こし用音声ソフトのノイズ除去機能が効くことがあります。これに対して、人の声そのものがノイズになっている場合は、音域が同じなので除去できません。

 

レストランなど周囲の人の声がうるさい音声を起こす場合は、自分もそのレストランのテーブルに同席しているつもりで聞くのが、有効な対策になります。

 

その理由は簡単です。もし自分がレストランの同じテーブルに座っていれば、自分の耳が受け取るのは、ICレコーダーで録音したのと同じ音声だからです。それなのになぜ実際のレストランでは、周囲のガヤガヤにもめげず、目の前のA氏の声だけがはっきり聞こえるのでしょうか。

 

それは、自分の意識がA氏に向いていて、A氏の話を聞き取りたいと意識しているからです。

人間の耳にはそういう選択機能があるのです。とすれば、ナマのレストラン音声だけではなく、録音されたレストラン音声に対しても、ある程度の選択機能を発揮できるのではないでしょうか。

 

音声を聞くときに、レストランの店内をイメージします。そして、自分(というか、自分の意識)を、A氏の向かいの席に座らせます。私はA氏の声が聞きたい、A氏の話を聞きたい!とイメージします。集中すると、だんだん外野の騒音がひいていきます。

レストランに実際にいるときほど完全にはひいてくれませんが、次第次第にA氏の声がしっかり聞こえるようになります。

 

体育館などでのスピーチを録音すると、場内が広くて天井も高いために、音が何度も反響して、わーんというエコーがかかってしまいます。

以前、オリンパスに取材に行ったとき質問してみましたが、会場のせいでエコーがかかる音声は、レコーダー側の設定では解決できないそうです。

 

では、テープ起こし用音声ソフトの側で何か調整できるでしょうか。

テープ起こし用の音声ソフトには、たいていノイズ除去機能が付いています。しかしこれらは通常、人の声とは違う音域のノイズに対して最も有効なのです。天井が高い会場などのエコーは人の声自体がもとになっていますから、守備範囲外です。ノイズ除去を無理にかけても人の声の成分がやせてしまい、かえって聞き取りにくくなったりします。

 

○対策→文字起こしだけを担当する場合、ありません(根性で聞く)

 

会場選びから関与できる場合は、そもそも残響の少ない会場を選びます。録音から関与できる場合、マイクを使っているならミキサーからラインでつないで録音させてもらいます。それが無理な場合はスピーカーのできるだけ近くで録音します。マイクを使わない場合は、少しでも話者の近くで録音します(壁や天井に反響する音ではなく、直接発せられた音を拾う)。

音声を支給されて文字起こしだけを行う場合は…ただひたすら、根性で聞き取る以外ありません。

 

話者の声は小さくなく、話し方も明快。ただもう、あまりの早口なので聞き取れない。これもよくあります。

 

例)「話せるということでございます」と聞こえた部分、聞き直したら実は「判断しているということでございます」だった

 

「は・な・せ・る」→実は→「はん・だん・して・いる」 2音が1音に聞こえるような早口で、いわば天然の2倍速音声です。

続きの「ということでございます」も、音として全部正確に聞き取れるわけではありません。例えば議会などの答弁という状況では普通そう言うだろうと予想して聞くので、早口でも聞き取れるということにすぎません。

 

○対策1→音声ソフトを遅くして聞く

 

録音状態がよく、発音も明瞭な場合は、やや遅めに再生するとよく聞こえることがあります。私はDSS Playerだったら0.8倍速で聞きます。Voice Writingはもっと微調整ができるので、0.9倍速ぐらいにすることもあります。等速よりわずかに遅くするだけでも、ずいぶん聞き取れます。

※Voice Writingの無料版は遅くしたとき声も低くなるので、スタンダード版のほうを使います

 

○対策2→途中で運動をする

 

天然2倍速といえるぐらいの早口を文字起こしする場合、音声1分あたりの文字数もふだんの倍近くになってしまいます。必死にキーボードを打っているのに、ちっとも音声のタイムカウンタが進まない!という状態です。

ストレッチや肩のぐるぐる回しなど、途中で運動タイムを入れましょう。むきになってタイピングし続けると、けんしょう炎やひどい肩こりの危険があります。

 

原因1で取り上げた「話者の声が小さい」は、特定の発言者だけ声が小さい状態です。それに対して今度は、録音の設定が悪かったせいで全部の発言者の声が小さいという状態です。

ICレコーダーにもカセットテープのレコーダーにも、ちょうどいい音量で録音するという機能があります。なのになぜ、全発言者の声が極度に小さいファイルができてしまうのでしょうか。

 

例えば、動画だったせいで音が小さいという仕事を、以前文字起こししたことがあります。座談会の全員の姿を映せる距離に、ビデオカメラが置かれました。つまり、全員から何メートルも離れた位置から録音され、全員の声が遠くなったわけです。こういうとき、カメラは遠くにセットせざるをえなくても、それとは別にICレコーダーをテーブルの上に置いてもらえると、音声が近くてよく起こせるのですが。

 

○対策→アンプ内蔵スピーカーで聞くこと

 

録音音量そのものが小さいときは、たとえPC上で音量を最大にしても限界があります。

この場合、音声加工ソフトで波形を編集し、例えば元の音の300%などに増幅して保存し直すという手があります。しかし、まず動画ファイルから音声だけを抽出して保存するところから始まって、結構な手間がかかります。

 

hakei-1.jpg

極端に音量の小さい波形の例。波というほど振り幅がない...。

 

手っ取り早いのは、PCにアンプ内蔵スピーカーをつなぎ、そこから音を出すことです。ヘッドホンを使う場合は、このスピーカーにヘッドホン端子を挿します。

スピーカー単体は「音を再生する」機能しかありません。それに対して、アンプは「音を増幅する」機能があるので、アンプ内蔵スピーカーは、もとの音より大きくして聞くことができるのです。

スピーカーから音を出してみると音質クリアなのに、ヘッドホンを使うと音が悪くて聞き取れない。これは、ヘッドホンの故障です。端子が接触不良、またはコードが断線ぎみになっているなどです。

 

○対策→ヘッドホン端子の接触不良だったら、接点復活剤を使う 断線ぎみのときは、あきらめてヘッドホンを買い換える

 

接点復活剤はいくつかのタイプがあるようですが、スプレーが一番簡単だと思います。PCモニタの端子が接触不良になったとき、接点復活スプレーを使ったら一発で直りました。

 

 

121017_1438~01.jpg

 

 

ヘッドホンのコードは、完全に断線してしまったら音は聞こえません。ザーザーしながらも聞こえているときは、断線の一歩手前という状態です。

「うっかりヘッドホンを下に落とし」+「うっかり椅子の脚でそのコードを踏んでしまう」。こんな、うっかりの2つ重ねが断線(あるいは断線の一歩手前)の原因になります。安価なヘッドホンだったら、修理に出すより買い換えたほうが安上がりです。高価なタイプなら断然修理です。

「音声のままでは一覧性・検索性が低い。文字に書き起こすことでデータを活用し、情報の価値を高めよう!」というのが、okosoの主張。


聞き取れない箇所だらけの書き起こしでは、情報の価値が高まりません。正確な書き起こしのためには、いい機材を上手にセッティングし、クリアに録音することが大事です。しかし、録音が良くても、聞き取れない原因はまだ他にもあります。


今日は「話者がつっかえた、口ごもった」です。

 

◆聞き取れない原因2【話者がつっかえた、口ごもった】

 

つっかえる、口ごもるなどは、ありふれた現象です。でも、たったそれだけのことで聞き取りに支障が出ることって、実はよくあるのです。例を挙げてみましょう。

 

 

例)

それでっときょー

 

ふだん私たちは、例えばこんなふうに聞こえる音声を、聞いた瞬間に分解して理解しています。

「それでっときょー」→「それで、えっと、今日」→「えっと」は一般的な仕様では文字化しない→「それで、今日」

 

普通の話し方なら、「それでっときょー」とつながって発音されても「それで、えっと、今日」に聞こえるはずです。ところが、発言者が途中でつっかえたり口ごもったりすると、まず単語の切れ目が分からなくなります。しかも、つっかえたとき微妙にアクセントが狂うことがあります。うっかり「と」が高く発音されると「都響」みたいに聞こえます。

「それで・ときょー」と聞こえるけどオーケストラの話題じゃないし…となると、「ときょー」に当てはめる言葉が思い浮かびません。

 

○対策→そういう現象はよくあることを知っておく

 

本当は「それで・ときょー」と言ってないのではないか。つっかえたか、口ごもったかなのでは。それに気づいて聞き直すと、真ん中は、つっかえたために「えっと」(実際の発音は「…っと」)と言って、立て直した部分であることが分かります。

 

実にささやかな原因です。でも、新人オコシストが「すみません、聞き取れない箇所がたくさんありました…」と納品してきたデータをチェックしたら、3分の1近くがこの「話者がつっかえた、口ごもった」箇所だったこともありました。そういう現象はよくあることを理解すると、次からは正しく聞き取れるようになります。

 

 

 

「音声のままでは一覧性・検索性が低い。文字に書き起こすことで、データを活用し、情報の価値を高めよう!」というのが、okosoの主張。

しかし、聴取不能箇所だらけの書き起こしでは、情報の価値が高まりません。正確な書き起こしのために、まずは、いい機材を上手にセッティングし、クリアに録音することが大事です。

でも、機材とセッティング方法が良くても、聞き取れない原因はまだ他にたくさんあります。そこで秋の特別連載「聞き取れない音声の原因と対策」をお送りします。


ではさっそく、聞き取れない音声の原因と対策を一つひとつ見ていきましょう。

 

◆聞き取れない原因1【話者の声が小さい】

 

会議の録音などで、特定の人の声ばかり全然聞こえないというケースです。隣の席の発言者の言葉はよく聞き取れていて、録音の失敗ではありません。

音量をいくら上げても、「声が小さい人」の声は本当に聞き取れません。小さい声の人は、口をしっかり動かしてないし、息も少ししか使っていないのです。だから音量を最大にしたところで、何を言っているか分からないことに変わりはありません。

 

 

○対策→自分の推測力をアップすること+ネット検索のスキルアップに励むこと

 

物理的な音としてはいじれないので、かろうじて聞こえる言葉から聞こえない言葉を推測するしかありません。推測だけでは不十分なときは、ネット検索で確認します。

 

例)教育についての会議音声で、「レリバ…高める」と聞き取れた

 

息の感じだと、バと高の間には2字か3字入りそうです。「レリバ」でネット検索すると、「レリバホテル」が上位に出てきたりしますが、話の内容からしてこれは違います。「レリバ 高める」で2語検索すると、「レリバンスを高める」という言葉がいくつかヒットします。ヒットしたページは教育問題の内容が多いので、合っていそうです。

さらに、音声内の他の人の発言に、明瞭に聞き取れる「レリバンス」という言葉が出てくるかどうかにも注意しながら作業します。

 

「声が小さい」に類似して、「高齢者の声が不明瞭」という音声もあります。加齢のせいで、歯の間が空いたり肺活量が小さくなったりするのが原因です。これも、音量を上げたところで、発音そのものを明瞭にできるわけではありません。推測+ネット検索で乗り切ります。

 

「声が小さい」の対策として、そもそも会場で発言者全員がマイクを使うようにすればいいという考え方もあります。しかし、声の小さい人の声は、マイクにもうまく乗らないことが多いのです。マイクなしよりは聞き取れますが、他の発言者の声よりも聴取不能部分が発生します。

発言者本人に、「しっかり発音して人に聞き取ってもらいたい!」という意識が薄く、自分の発音があいまいで弱いことに気づかないのでしょうね。参加者一人ひとりに発声練習をさせてから会議をスタートしてほしい…、オコシストとしてはそんな暴論さえ主張したくなってしまいます。