ページへ戻る

− Links

 印刷 

teditcDic のソース :: OSASK計画

osaskwiki:teditcDicのソース

  
* teditcの辞書のページ
-ここのほかに参考になるページ:
--[[かんなの辞書をOSASKで使うためのメモ]]

**現在の状況
-KANJIMAP-完成
-既存のフリーな辞書からのコンバート-完成
--この辞書を改良する-募集中
-新たに辞書を作成する
--ZAKKYが実験用辞書を作成中
---容量無視で徹底的に活用させてみるとか
---同時に用言の強化(最重要動詞の選出)
---名詞も重視
---とにかく効率重視で
--必要最低限の大変コンパクトな辞書-募集中
---誰かがやるとバンドルに便利かも。

このプロジェクトは本格的なIMEが用意されるまで大変有用です。
協力をお願いします。(特に改良は需要が高いです)
----
-「容量無視で徹底的に活用させてみる」をやるくらいなら、僕がteditcの単語属性を有効にして、ちゃんとやるほうが手間が少ないと思います。ということで、まずはそれ以外の全てを優先するのをおすすめします。 -- [[K]] SIZE(10):2003-05-14 (水) 11:11:44
-まあ趣味なのでそのうちやめるかもしれませんし期待はなしの方向で。 -- [[ZAKKY]] SIZE(10):2003-05-14 (水) 14:09:29
-これからとりあえずZAKKYさんがリリースした辞書をベースに自分が言ってきた方法で改良をしてみます。丸一日やってできなかったら、またしばらくほっとくことにします。 -- [[K]] SIZE(10):2003-05-19 (月) 06:56:20
-とりあえず10%ほど完了。先は長い・・・。 -- [[K]] SIZE(10):2003-05-19 (月) 10:56:06
-18%完了。「かん」の多さに疲れが出ました。今日はおしまい。 -- [[K]] SIZE(10):2003-05-19 (月) 16:44:49
-現在21%。今は「きょ」をやっています。 -- [[K]] SIZE(10):2003-05-20 (火) 22:04:37
-現在26%。「け」まで来ました。 -- [[K]] SIZE(10):2003-05-25 (日) 08:53:21
-現在38%。次は「し」です。 -- [[K]] SIZE(10){2003-06-06 (金) 18:02:41}
-現在45%。次は「しん」です。 -- [[K]] SIZE(10){2003-08-31 (日) 01:10:41}

#comment

**変換辞書に語句を登録 ([[登録漢字リスト]]を統合)

- 登録して欲しい変換候補や登録した変換候補を書き込んでください。特に変換したいのに出ない語句とか重要かもしれません。
- だからといって人名などの固有名詞をむやみに登録するのはやめましょう。
----
-確かにやらたと人名を登録するのは嫌だけど、でもこれくらいは載せてほしいなあというのがあれば教えてください。入れるかどうかはディストリビューション作者(たとえば僕)に任されます。ご了承くださいね。 -- [[K]] SIZE(10){2003-07-10 (木) 17:04:23}
-僕の個人的な願望としてはちょっとくらいマイナーでも、OSASKコミュニティの誰かが必要としているのなら、強引すぎる当て字以外はいれてあげたいなあという気はします。多すぎて辞書が馬鹿でかくなるようならそれも考えものですがね。 -- [[K]] SIZE(10){2003-07-10 (木) 17:06:54}
-MS-IMEでも変換できないような特殊な読みとかは逆に変換効率を下げる可能性があるので少し心配しました。 -- [[企画。]] SIZE(10){2003-07-10 (木) 22:12:34}
-変換効率的には、変換候補が一番最後とかにある分にはそれほど邪魔にはならないでしょう。IMEに無くてもなるほどと思えるやつは入れますよ(もちろん候補は最後のほうにはなりますが)。むしろIMEよりもデフォルトで強いって、なんか嬉しくないですか?(笑)。 -- [[K]] SIZE(10){2003-07-10 (木) 22:22:59}
-もしかして知らない人のためにフォロー。変換候補が多いと間違えて行き過ぎちゃったら一巡させなきゃいけないじゃん!ということはありません。前候補に戻る方法があります。行き過ぎちゃった!と思ったら、矢印の上とかを押してみてください。 -- [[K]] SIZE(10){2003-07-10 (木) 22:25:18}
-あの、辞書ってのはテキストファイルにタブとスペースで区切ってあるあれですか?あれの候補をどんどんみんなで作ってるわけですか? -- [[nisi]] SIZE(10){2003-07-11 (金) 11:41:40}
-あれの形式なんですが、コメントで品詞が記述されてますが、品詞も何か判断するのでしょうか?とか、同じ読みが定義中複数行でてきた場合どうなりますか? -- [[nisi]] SIZE(10){2003-07-11 (金) 11:43:21}
-と思ったら・・・

 /* 動詞の例 */
 
 か				書
 よ				読
 ・・・
 
 /* 形容詞の例 */
 
 よ				良
 ・・・
というのが既にあった・・・動作はどうなってるのかな?(試してない)
-とりあえず、品詞は判断していません。今のところ非常に単純な変換をしています。つまりただの置き換え。本来なら日本語文法に基づいて活用形を内部で発生させて、それに合致するものだけを候補に上げるべきなのです。しかし今はそこまではできていません。つまり、品詞は判断されていないのです。 -- [[K]] SIZE(10){2003-07-11 (金) 22:15:47}
-形式についてですが、つまり、「書く」という動詞の場合は、「書かない」「書こう」「書きます」「書けば」などと変化します。これをすべていれたら辞書の量がものすごくなるので、共通の「か」を「書」として登録しよう、ということなのです。 -- [[K]] SIZE(10){2003-07-11 (金) 22:18:41}
-形容詞の場合も考え方は全く同じです。・・・で最後の質問ですが、同じ読みが複数回出ると、今のバージョンではどちらかしか候補が出てこないというバグがあります。本来は自動的に統合されるべきですが、手抜きしています。そのうち直します。 -- [[K]] SIZE(10){2003-07-11 (金) 22:20:25}
-無変換キーでカタカナになる機能をつけてもらえれば変換候補が多くても問題ないかな -- [[ZAKKY]] SIZE(10){2003-07-11 (金) 22:22:59}
-カタカナにしたいときは、スペースとかで変換して、すぐに「↑」(前候補)を押せばいいから、問題無いと思うんだけどなあ。>ZAKKYさん -- [[K]] SIZE(10){2003-08-31 (日) 01:16:41}
-なるほど -- [[ZAKKY]] SIZE(10){2003-08-31 (日) 02:46:02}

#comment

  

  • teditcDic のバックアップソース(No. All)
    • 現: 2024-01-08 (月) 12:59:03 ゲスト