「音声のままでは一覧性・検索性が低い。文字に書き起こすことでデータを活用し、情報の価値を高めよう!」というのが、okosoの主張。
聞き取れない箇所だらけの書き起こしでは、情報の価値が高まりません。正確な書き起こしのためには、いい機材を上手にセッティングし、クリアに録音することが大事です。しかし、録音が良くても、聞き取れない原因はまだ他にもあります。
今日は「話者がつっかえた、口ごもった」です。
◆聞き取れない原因2【話者がつっかえた、口ごもった】
つっかえる、口ごもるなどは、ありふれた現象です。でも、たったそれだけのことで聞き取りに支障が出ることって、実はよくあるのです。例を挙げてみましょう。
例)それでっときょー
ふだん私たちは、例えばこんなふうに聞こえる音声を、聞いた瞬間に分解して理解しています。
「それでっときょー」→「それで、えっと、今日」→「えっと」は一般的な仕様では文字化しない→「それで、今日」
普通の話し方なら、「それでっときょー」とつながって発音されても「それで、えっと、今日」に聞こえるはずです。ところが、発言者が途中でつっかえたり口ごもったりすると、まず単語の切れ目が分からなくなります。しかも、つっかえたとき微妙にアクセントが狂うことがあります。うっかり「と」が高く発音されると「都響」みたいに聞こえます。
「それで・ときょー」と聞こえるけどオーケストラの話題じゃないし…となると、「ときょー」に当てはめる言葉が思い浮かびません。
○対策→そういう現象はよくあることを知っておく
本当は「それで・ときょー」と言ってないのではないか。つっかえたか、口ごもったかなのでは。それに気づいて聞き直すと、真ん中は、つっかえたために「えっと」(実際の発音は「…っと」)と言って、立て直した部分であることが分かります。
実にささやかな原因です。でも、新人オコシストが「すみません、聞き取れない箇所がたくさんありました…」と納品してきたデータをチェックしたら、3分の1近くがこの「話者がつっかえた、口ごもった」箇所だったこともありました。そういう現象はよくあることを理解すると、次からは正しく聞き取れるようになります。