<このWeb sitesは,Geocitiesの閉鎖に伴いこのサイトに移設しました。>
<上記は,Geocitiesのスポンサーです.私のWebは以下から始まります.>

ATOKに単語を登録して効率の良い変換を

地盤環境関係単語リスト(辞書)ファイルの紹介


 IME(昔で言うFEP)に、僕はATOKをずっと使ってきました。これは新入社員の時にJXWord太郎というソフト(PC-9801Eに8inのDisc1枚で動いていた)を使い始めてからだから、かれこれ十数年になる。
 でも非常にもったいなかったのは、この間ずっと様々な単語をATOKに辞書登録してきたにもかかわらず、それを残しておかなかったことだ。

 本当にもったいない。

 同じような事がちまたで繰り返されていると思うと、もうこれは文明の損失だ。

 そこで、以下の情報とファイルを、皆さんに伝授・公開しよう思う。

  1. ATOKで効率の良い辞書登録の方法
  2. 公開されている地盤環境関係のATOK用一括登録用単語リスト(辞書)ファイル
  3. 知久氏が作られた理化学辞書Ver5.2(登録単語2万語)のATOK15専用に改編したリストファイル
  4. 僕が前の会社にいたときに、私のグループに新しく配属されてきた人達用に配布していたATOKの単語辞書ファイル(ATOK15専用)

 ところでなぜMS-IMEではなくってATOKかって?それはATOKの方が、断然変換効率が高いからだ。
 このサイトのワードのページでも書いているように、誤変換が起きると次のような操作が必要になる。

  1. はじめに、頭の中に浮かんだ文章を打ち込み、変換する。
  2. 頭の中の文章と異なる漢字に変換(誤変換)される。
  3. その時、頭で考えていた文章を一旦中断する。
  4. 漢字を修正する作業を行う。
  5. 修正終了後、先ほど考えていた文章を思い出す。
  6. 打ち込みを続ける。

 こんなバカなことはできるだけしたくない。文章って、勢いで書いている時ってあるでしょう?僕はMS-IMEも使っているし、ATOKも使っている。両者を使ってみてその違いをみると、はっきり言って、ATOKの方が、誤変換は少ない。特にATOK15は、ほとんど間違いを起こさない。

 誤変換の少ない入力には、ちょっとしたコツがある。それは、句読点まで入力してから変換させることだ。
  たとえば「やさいをきる。」と入力してから変換させてみよう。きちんと「野菜を切る。」となるだろう。
  続いて「せそうをきる。」と入力してから変換させてみよう。きちんと「世相を斬る。」と変換されるはずだ。
  さらに「きものをきる」ではどうだろうか。「着物を着る」ときちんと変換される。
 非常に特殊な専門用語を除いて、間違いなく変換されていく。前の名詞の内容を判断しているのだ。
 もちろん「やさい」「せそう」「きもの」を入力して変換した後、続いて「きる」を入力・変換しても、ATOKであれば正しく変換されるので、句読点で区切る必要がない。しかし、長く打ち込んだ方がはるかに誤変換は少ない。

 僕が使っている限り、ATOKの方がダントツに誤変換が少ない。それに同音異義語の意味が変換と同時に出てくれて、意味を見ながら選択できるし、もしまだ一度もATOKを使ったことがないとおっしゃるのであれば、是非使ってみることをお薦めする。
 もちろんATOKはワードでも使えるし、日本語対応であればどんなソフトでも使うことができる。


ATOKで効率の良い辞書登録の方法

 最近のATOKは本当に良くできている。だからあまりよけいな単語は登録しない方がよい。一般的には、なるべく名詞だけにしぼり込んだ方が良いとさえ言われている。

 けれどもやっぱり名詞以外の専門用語って結構ある。
 そんな時は、ごく当たり前だが、単語を登録する時は、きちんと品詞を分けて、登録した方がよい。

 これが最も誤変換が少なくなる手だ。

 以下に、ATOK15のヘルプファイルから品詞の見分け方を抜き出して載せておいたので、縮小印刷してPCに張っておくと良いだろう。
 通常では、名詞か助数詞ぐらいしか登録をすることはないと思う。

ATOK15の品詞名 見分け方 登録時注意
よく登録する品詞 名詞 ・物や物の状態に付ける一般的な名詞 花、鳥
固有人姓 ・人の姓に付ける固有の名詞 山田、木村
固有人名 ・人の名に付ける固有の名詞 花子、太郎
固有人他 ・外国人名など、固有人姓や固有人名以外に付ける固有の名詞 ガリバー、アリス
固有地名 ・場所に付ける固有の名詞 大阪市、ダッカ
固有組織 ・組織に付ける固有の名詞 ジャストシステム
固有商品 ・商品に付ける固有の名詞 テフロン、ATOK
固有一般 ・人名・場所・組織・商品以外に付ける固有の名詞 天の川、ペガサス
名詞サ変 ・後にサ変動詞「する」を付けることができる名詞 演出-する、援助-する
名詞ザ変 ・後にザ変動詞「ずる」を付けることができる名詞 念-ずる、命-ずる
名詞形動 ・物事の姿・状態・性質などを表し、後ろに「だ」・「な」を付けることができる名詞 画期的-だ(な)、大切-だ(な)
名サ形動 ・名詞、サ変、形容動詞の要素を持っており、後ろに「する」・「な」を付けることができる名詞 満足する・満足な、いたずらする・いたずらな
助数詞 ・数字に付けて種類や単位を表すことば 週、グラム
単漢字 ・助詞、助動詞が付かず、ほかの品詞としての要素を持たない1文字の漢字 亜、以、宇
たぶんほとんど登録することのない品詞 カ行五段 カ行の五段活用する動詞 書く、動く
ガ行五段 ガ行の五段活用する動詞 急ぐ、泳ぐ
サ行五段 サ行の五段活用する動詞 示す、消す
タ行五段 タ行の五段活用する動詞 立つ、勝つ
ナ行五段 ナ行の五段活用する動詞 死ぬ
バ行五段 バ行の五段活用する動詞 飛ぶ、遊ぶ
マ行五段 マ行の五段活用する動詞 生む、読む
ラ行五段 ラ行の五段活用する動詞 売る、走る
ワ行五段 ワ行の五段活用する動詞 会う、笑う
ハ行四段 ハ行の四段活用する動詞 言ふ、笑ふ
一段動詞 上一段、下一段活用する動詞 着る、始める
カ変動詞 カ行変格活用する動詞 来る
サ変動詞 サ行変格活用する動詞 熟する、察する
ザ変動詞 ザ行変格活用する動詞 軽んずる、甘んずる
形容詞 単語の終わりに「。」をつけてみると、最後の文字が「い」になるもの 楽しい、空しい、長い、苦しい
形容詞ウ 形容詞の中で語尾がウ音便化したときに語幹の形が変わることば 高う、長う
形容動詞 ・単語の終わりに「。」をつけてみると、最後の文字が「だ」「です」になるもの。
・物事の性質・状態を表し、言い切るときの形が「だ」・「な」で終わることば
綺麗だ、静かです
豊かだ(な)、うららかだ(な)
形動タリ 物事の性質・状態を表し、語尾が「と」「たる」に活用することば 燦然と・燦然たる、平然と・平然たる
副詞 動詞・形容詞・形容動詞を修飾する ・動作の状態を表す…「『さっと』攻撃をかわす」、「『こそこそ』逃げ出した」
・物事の程度を表す…「『よほど』気になるようだ」、「『相当』辛い」 ※「『もっと』傷薬!」みたいに名詞へ係る場合もある。
・決まった言い回し…「『たぶん』王子のせいだろう」、「『決して』諦めない」、「『まるで』夢のようだ」、「『もし』できるなら」、「『どうか』私をお連れくださ・い」、「『なぜ』こんなことになったのだ」
連体詞 名詞(代名詞)を修飾する。最後の文字が「の」「な」「る」「た」「だ」などのもの。
活用がなく、体言だけを修飾することば
・「〜の」…この、その、あの、どの、かの
・「〜な」…大きな、小さな、いろんな、おかしな
・「〜る」…ある、さる「〜の」…この、その、あの、どの、かの
・「〜な」…大きな、小さな、いろんな、おかしな
・「〜る」…ある、さる、とある、あらゆる、きたる
・「〜た」…大した、茶化した、馬鹿げた
・「〜だ」…とんだ、ゆがんだ
・その他…同じ、わが
※他の品詞と間違えやすい。
 「大きい」と「大きな」…「大きい剣」だと形容詞、「大きな剣」だと連体詞
 「あれ」と「あの」…「あれ、人?」だと代名詞、「あの人」だと連体詞
接続詞 文をつなぐ役目をする。 そして、しかし
・「近くの店で買えなかった。『だから』通販で買うことにした。」
・「将軍を味方に引き入れることができなかった。『しかし』そのまま進軍を続けた。」
感動詞 思わず口から出てしまう、挨拶や感情表現。 おはよう、はい、ああ、もしもし、こら、それっ、よいしょ
接頭語 他のことばの前に付けて使うことば 御、ご、無
接尾語 他のことばのあとに付けて使うことば 後、様
独立語 助詞・助動詞が付かず、他のことばとつながりを持たないことば 敬具、かしこ
冠数詞 数字の前に付けて使うことば 第、午前
数詞 数量・順序などを示すことば 1、壱
終助詞 文末において、感動・疑問などの意味を添える助詞の働きをすることば ※ATOKでは、文末では、ほかのことばより優先されやすくなります。
登録例「だよん」、変換例「私だよん
この表はATOK15ヘルプファイルに、注釈を書き込んだものです。

 なお動詞・形容詞・形容動詞など、語尾が活用する単語を登録する場合は、語幹だけを単語として登録する。
 ただし、一段動詞として登録する場合は、語尾の「る」を除いた語句を単語として登録する。

登録する単語 登録する範囲 読み 品詞
指名する 指名 しめい 名詞サ変
命ずる めい 名詞ザ変
安全な 安全 あんぜん 名詞形動
動く うご カ行五段
起きる 起き おき 一段動詞
熱する ねっ サ変動詞
美しい 美し うつくし 形容詞
静かだ 静か しずか 形容動詞
高う たこ 形容詞ウ
平然と 平然 へいぜん 形動タリ
笑ふ わら ハ行四段
出典:ATOK15ヘルプファイル

公開されている地盤環境関係のATOK用一括登録用単語リスト(辞書)ファイル

 みなさんもご存じのように、地下水汚染や土壌汚染という現象は、様々な分野の基礎学問からなり立っています。分析だけでは汚染状況を全く把握できませんし、地層を見ているだけでもだめです。対策に至っては土木工学も必要です。もちろん現場の化学物質に対する労働安全も必要です。対策の目標を設定するには、関連法や、施主の経済状況の分析も必要です。すなわち「地盤環境」という分野が、独立した学問体系となることは、ほとんど不可能なのです。
 同様に、地盤環境専門の用語というのはほとんどありません。
 従って、ATOKでの登録単語は、関連する基礎分野の用語を登録していくことになります。

 ATOKには専門用語はあまり入っていません(特に化学物質名)ので、効率よく変換させるために、通常の場合、自分で単語を登録していくことになります。自分で実際に使う単語が登録されていくので、これが最も変換効率がよいと思います。
 しかし会社や組織の中で、誰もが独自に一人一人登録していくのは、非常にもったいないのも事実です。また品詞を何にすれば良いのかということを考えている時間がない、というのもまた事実です。

 そこで、一般向けにフリーで公開されている単語リストを辞書登録することを、考えられると思います。
 ここに地盤環境問題に関連する基礎分野の登録リスト(辞書)を、いくつか紹介します。先にも書いたように地盤環境は、応用分野であり、様々な基礎分野からなり立っています。僕が今のところ把握している関連する基礎分野のフリーの単語リストは、これだけです。
 なおこれらの最新ファイルは、直接各サイトにてご確認ください。

  1. 環境化学関係 環境化学辞書(1998年)劔持氏作 約一万三千語
  2. 地球物理関係 地球物理辞書(2001年)日本地物倶楽部作 約六千語
  3. 物性物理・化学(無機・有機)および光学分野 ATOK理化学辞書5.2(1996年)知久氏作 約一万九千語
  4. 地学関係 地学用かな漢字変換辞書(http://www.gsj.jp/GDB/openfile/files/no0033/0033index.html)地質調査所研究資料集No.33 約二万九千語(地球科学用語約11,000、山川名約8,500、地名約5,500、地形図名約2,000)
     (直リンクできないので、コピーして、このページへ移動してください)

 広く一般向けに公開されている単語リストには、いくつかの欠点があります。
 最も大きい点は、読み方(入力方法)が、作成者とダウンロードする使用者とでは異なるという点でしょう。例えば「N値」です。あなたはローマ字かな変換で「ENUCHI」と打ちますか、それとも「enuchi」ですか、または「NCHI」、もしくは「nchi」ですか。さらにかな入力の方もいらっしゃるでしょう。また略語の入力の仕方も、作成者によって大幅に異なります。例えば、ある方は略字の前に「@」を付けて、トリクロロエチレンの場合では「@tcえ」で変換するのが良いというという方も、おられます。
 また一方で、作者の方には直接関係なくIME(かな漢字変換プログラム)側の問題もあるのです。それは品詞です。かな漢字変換プログラムが進化するにつれ、登録する品詞もより細かくなってきます。よりヒットするように配慮するわけです。しかしIMEのバージョンがあがったからと言って、作者の方に、用語リストの全ての品詞を見直すことは、特にフリーで公開されている場合、なかなか難しいでしょう。(JIS化もされいますが、共通化は進んでいないようです)

 このような点をふまえながら、上記の地盤環境関係の用語リストについて私なりの感想をまとめてみました。あくまで僕個人の感想ですので、できればご自身でそれぞれのテキストファイルの中身をご覧になるのが良いと思います。

 1(環境化学関係)のファイルは以下の点で、残念ながらあまりお薦めできません。

  1. ファイルの大部分(半分以上か?)が医学用語である。
     −>地盤環境関係では、ATOKにあらかじめ収録されている医学用語以外は、ほとんど使用する機会がない。もしあるとすれば、専門用語リストの入手を考えればよい。
  2. 特定分野の専門家の名前(姓のみの入力で姓名まで変換される)が多く含まれる。
     −>ファイル中に記載されている方々は皆さん著名な方とは思いますが、この方々とは直接関係ない分野の方も使用されることを想定すると、学術や技術用語を中心とされている方がよいかと思うのです。
  3. 顔文字(括弧やピリオドなどの記号で顔の表情を作っている文字)が入っている。
  4. 記載されている単位に使用している文字が、機種依存する可能性の高い文字を使用している。
  5. 品詞名が、一定していない。

 2は地球物理関係の用語が非常に良くしぼり込まれて(あまり関係なさそうな用語も少量入っていますけれど)おり、大変良い用語集となっています。ただし内容はあくまでも「地球物理」であり、地盤環境で必要とされる応用地質での用語は、ほとんど入っていません。また残念なことに品詞名に若干の間違いがあったり、書かれている品詞名がATOK15からみた品詞分類や名称とは異なります。
 従って、直ちに利用することは避けた方がよいと思います。

 4は地質調査所で利用する目的で作成されたリストで、その研究成果として公表されています。従って、リスト内の単語の信頼性は、非常に高いと考えられます。しかし残念なことに、品詞が一切書いてありません。利用するには、品詞を書き加えなければなりません。

 この中で私がお薦めできるのが、3の理化学辞書Ver5.2です。化学に関する用語はほとんど網羅されています。また関係のない用語はほとんどと言ってリストに無く、無意味な変換は発生しにくいことが考えられます。しかし現在のこのままでは、ATOK15用の品詞名になっていないことから、誤変換が生じてしまう可能性もありますし、また登録できない場合も出てきます。

 以上をまとめると、次のようになります。

  1. 地盤環境関係に必要と考えられる用語(化学関係、地盤工学関係、地質関係、土木工学関係、関係法令関係などなど)登録リストは、ほとんど無い
  2. 公開されている用語リストで、僕がお薦めできるのは「理化学辞書Ver5.2」。ただし品詞名をATOK15用に変換する必要がある。

 そこで、これら二つに対する回答として、ATOK15用の2つの用語リスト(辞書登録ファイル)を公開します。

  1. 理化学辞書Ver5.2 for ATOK15
     「物性物理・化学(無機・有機)および光学分野向けの単語辞書テキストVer5.2(知久氏作)」をATOK15用に改編した物
  2. 地盤環境関係用語集V001.1
     以前勤めていた会社のグループ員のために個人的に作った単語リスト。

 この「理化学辞書Ver5.2 for ATOK15」を辞書登録することで、化学関係の用語はばっちり対応できます。

 でももしかすると、登録単語数が増えることで、無関係な用語への変換が発生してしまい、結果的に使いにくくなる、と考えられる方もいらっしゃるかもしれません。
 しかし正しい品詞で登録されていれば、このような心配は皆無です。

今のところファイルは公開しておりません。あしからずご了承ください。

ごく最近気が付いた理化学辞書V5.2に入っていない単語


2009年になって、辞書機能をネット上で共有するというIMEが登場した。まだ使ってはいない。今後の評判をみてみようと思う。

 Social IME 〜みんなで育てる日本語入力〜

 このソフトの特徴は以下の通り。


ホームページに戻る このサイトについて
Copyright(c) 2002 - 2009 , [always in the field]KOBAYASHI Shigeru , JAPAN


Yahoo Geocitiesの閉鎖に伴い、このホスティングサービスに移設しました。