[OSASK 6213] teditc02l.

  こんばんは、川合です。


Hidemi KAWAI は 2003/05/16 22:36:35 の「[OSASK 6149] Re: teditc0
2k.」で書きました:

(半角スペース変換問題)
>  次のリリースのときに直しますので、それまではスペースを含む文字
>を変換しないようにしてください。すみません。

  チェックしてはいないんですが、たぶん直ったと思います。

  それと、日本語入力モードでバイト数が灰色表示のときにウィンドウ
を閉じると、編集結果がうまく反映されないという以前の仕様に戻って
いたのを直しました。

  さらにバンドル辞書を、ZAKKYさんのやつをベースにかなりいじった
ものに差し替えました。今までの辞書とは変換効率が全然違います。こ
れについては後述します。

  さらにte_dicv0.binの性能を大幅に改善したので辞書のコンパイルが
とても高速になりました(単に今までが手抜きだったわけですが)。

  ダウンロードはこちらからどうぞ。

    http://osask.ne.nu/teditc2l.lzh

  変換辞書についてですが、次のような方針で改良しています。

[動詞]
・五段活用動詞は語幹部分が登録されている
    例:終わ(る) 上が(る)  聞(く)  読(む)  走(る)
・下一段活用動詞は語幹+次の一文字が登録されている
    例:上げ(る)  見え(る)
・上一段活用動詞も語幹+次の一文字が登録されている

[形容詞]
・ク活用は語幹部分が登録されている
・シク活用は語幹+しが登録されている

・・・とまあこんな感じで、とにかく活用の際に変化しない部分を含め
て辞書に入れるようにしています。これにより各変換候補の数が多くな
りすぎないようにしています。

  また音読みの漢字(たとえば「きょ」で「許」など)は、削除しまし
た。だから漢字の音読みを入れて変換しても出てきません。その代わり
訓読みを充実させているので「ゆるす」を変換すれば「許す」が出てき
ます(「ゆる」だけで出てきます)。

  音読みの単漢字候補は消しましたが、その代わり熟語はかなり追加し
ました。許可、許諾、許容、特許、免許・・・。これはつまり、音読み
一字で使うことがない文字は候補から消すかわりに、音読みで使う場合
を充実させて、単漢字音読み候補がない不便さを解消してしまおうとい
うものです。辞書にない単語を登録する場合などで、「許」の字を出し
たいときは適当な熟語か訓読みで入れて変換すればいいというわけです
(どうやっても出せなければKANJIMAP.TXTを使って辞書登録してくださ
い)。

  これらの改良の上に、変換候補順を使用頻度順にしています。たとえ
ば「か」は次のようになっています。

か        書 買 勝 噛 欠 火 日 化 蚊 課 家 箇 科 可 刈 狩

  「書く」「買う」「勝つ」などは頻度が高いので、前のほうにあるわ
けです。

  これらの改良により、以前よりは格段にストレスを感じずに文章を書
けます。もちろん変換システムそのものに改良の余地はまだあるわけで
すが。

  なお今のところ上記の改良は「ごん」までできていて、次は「さ」で
す。つまり「さ」以降はZAKKYさんの辞書からあまり改善していないの
で、使いにくい場合があっても勘弁してください(それでもほんの少し
は改良しましたが)。これで34%くらいです。


  それでは。

--
    川合 秀実(KAWAI Hidemi)
OSASK計画代表 / システム設計開発担当
E-mail:kawai !Atmark! imasy.org
Homepage http://www.imasy.org/~kawai/



ML番号でジャンプ
ML単語検索