文字起こしを仕事にしよう

2021.12.21

リアルタイム字幕が動き出す

リアルタイム字幕。リアルタイムに、トークに字幕を表示する技術。
タイピング速度の速い人が複数で組む方法や、特別なキーボードによる入力方法が使われてきた。
音声入力は、発音・発声の訓練をばっちり受けた専門家がリスピーク(復唱)する形式で、スポーツ中継など限られたジャンルで活用されているにすぎない。

というのが、かつての私の理解だった。

 

◆音声認識の精度が爆上がり

それが、今や何にでも字幕がほいほい付くようになってきた。You Tubeだって、メニューから「字幕」を選択すれば、トーク内容が表示される。
(認識率はともかく!)

いやいやいや、認識率も上がってきた。
私はスマホのフリック入力が苦手なので、スマホでLINEを5字以上書くときは音声入力を使う。これが、とても使いやすくなってきたのだ。

と感心していたら、私が関わっている文字起こし活用推進協議会に、UDトークというコミュニケーション支援アプリの開発会社であるシャムロック・レコードが入会。リアルタイム字幕に使われるアプリだという。

そのアプリ名は知っていた。友人に以前聞いたことがあった。使われている音声認識エンジンは、私がかつて文字起こしに使っていたAmiVoiceだという。
でも、スマホのアプリをどう使ったらいいのか具体的には分からなくて、当時は何もしなかった。

今年、協議会がリアルタイム字幕のセミナーを開催したので私も受講し、実際にアプリを使ってみるようになった。

最初にそのアプリ名を教えてくれた友人にも話を聞きに行ったが、リアルタイム字幕への対応は自分にはムリではという気がした。友人は文字起こし業務の一方できちんと要約筆記を学び、要約筆記の現場も数多くこなしてきた人だったからだ。私にはそちらの知識がない。

ちょっと引いていた私がころっと変わったのは、UDトーク代理店の人からあるエピソードを聞いた瞬間だ。

◆アプリの売り込みに行くと、なぜか実案件がどかどか

「私は代理店だから、あちこちにUDトークの説明をしたい。なのに、営業先で“今度のイベントのリアルタイム字幕を担当してもらえませんか”と言われる。週末はいつもリアルタイム字幕の案件が入っている」

アプリを売りたいのに実案件が入ってきてしまうなら、この分野は将来性があるかもしれない。

その根拠は、私が以前勤めていた会社の次のようなエピソードだ。

私が以前勤めた会社の社長は、もともとは富士通関連企業の営業マンだった。
もう何十年も前、彼は富士通が発表したばかりのワープロ専用機OASYSを売り込んで回っていた。でも、当時は行く先々でこう言われたそうだ。
「ワープロを買っても当社には使える人間がいない。むしろ、この文書をそのマシンで清書してもらえませんか?」
(当時、文書はまず手書きするものだった)

彼は奥さんにワープロの入力を教えて文書作成を請け負った。それでも全ての依頼には応えきれず、近所の人を集めてワープロの入力を教え、文書作成を請け負った。
やがて会社員の片手間では対応できなくなり、結局脱サラして、文書作成・データ入力の会社を作った。
ワープロ専用機からパソコンの時代になり、納品もフロッピー手渡しからインターネットの時代になったが、その会社は息子さんに代替わりしてちゃんと続いている。

◆覚えたことを発信しますっ

潜在的な需要はあるのに、誰にどんな方法で頼んだらいいか分からなくて、当時の各企業は困っていた。
道具が出現しても、使いこなせる人が少なかった。
今、リアルタイム字幕がそれに相当する時期になっているのだとしたら…。
これはすごいことなんじゃないだろうか。自分に知識がないなら学べばいい。今スタートするべきだ。

会社、役所、学校などがリアルタイム字幕を使いこなしていく時期はたぶんばらばらだ。既にばっちりのところもあるし、導入したはいいが使いこなせず放置になっているところもあるらしい。開発会社は便利な機能を盛り込んでいるのに使う側の人たちがうろうろしている、あの時期だ。
パソコンの文書作成というスキルが広く普及したように、やがてリアルタイム字幕も誰もが普通に使うようになるかもしれない。今は、字幕担当者の支援が必要そうだ。

代理店さんも、アプリの存在を教えてくれた友人も、リアルタイム字幕の実務について、快く何でも教えてくれる。
そして、リアルタイム字幕担当者のスキルというのは、文字起こしスキルとかなり共通していることが分かってきた。

覚えたこと、試したこと、できるようになったことや勉強中のことを、私もできるだけ発信していきたい。