テープ起こし・音声起こしの総合情報サイトokoso | 今日も音声起こし中

今日も音声起こし中

2011年7月アーカイブ

Japanistは、かつて富士通が出していた日本語入力ソフトウエアです。私は日本語変換システムとしてはATOKを愛用していますが、年に1回か2回はJapanistに頼ります。ですから、CD-ROMを大事に保存して、PCが替わるたびインストールしています。

 

Japanistに頼る業務とは、過去に納品したファイルから専門用語などを一気に抜き出して、単語登録ファイルを作成すること。具体的にどうやるのかというと…。
ここ数日、okosoのツイッターである@okosozukin からつぶやいた実況を、まとめて掲載します。

 

7月5日

ATOKの文書学習ツール「おまかせキーワードチャージャー」って、たぶん長い目で見れば役立つのだろうけど。新分野の言葉は、Japanistで抽出して一気に単語登録するほうが確実ではあります。明日やろう。

 

7月6日AM


あまりに専門用語の多い審議会、しかも種類が増えて、これまでの単語登録ファイルに全く出てこない言葉が続出しています。今日は、単語登録ファイル作成を実況ツイートします。

 

Japanist2003、古いソフトですがVista対応のアップデートファイルが用意されていて、うまく動いてくれました。「おてがる登録」機能を起動して、Wordファイル23個を入れたフォルダを指定します。

 

japanist.jpg

 

2分とかからず、3456個もの単語を読みと品詞付きで抽出してくれました。でも「いけん サ変名詞 意見」など、登録する必要のない単語がかなり入っています。テキストファイルに書き出して、不要な単語を削除中。

 

「位置」や「図」は普通に変換できるけど、「位置図」は第一候補にこないことが多いので登録。「橋梁」は普通に変換できるけど、「橋台」(きょうだい)は出てこないので登録。

 

7月6日PM


午前11時、3500件を1100件に減らしたところで疲れたので、別の仕事を1時間ほどしていました。まだまだ減らします。面倒ですが、手動で単語登録するよりは速いし、見落としもないし、削除する言葉も一応読むので、頭に入ることは確かなのです。

 

作業中の単語ファイルと過去に作った単語ファイルを、まとめてエクセル1シートに貼り付ける。ふりがなで並べ替える。「次のセルと同じだと●が出る関数」を入れて、重複している語を削除。…まで終わりました。

 

ちなみに、「次のセルと同じだと●が出る関数」というのはこれです。
=IF(B1=B2,"●")
B列にふりがなが入っている状態で、この関数をA列に入力します。

 

ATOKで使うので、Japanistの品詞名をATOK型に変更。自動抽出された「品詞」や「読み」の明らかな間違いを修正。今生きている単語は571個。また別件の仕事に取りかかります。

 

聞き直しだけ自分でしたファイルって、自分のATOKに単語がたまっていかないので、ときどきこの方法で一気に単語登録しています。

 

  〈1〉  〈2〉  次ページへ