こんにちは、I.Tak.です。 SKEなんですが、ちょっと問題ではないか?と思う点がありまして。 From: Hidemi KAWAI <kawai !Atmark! imasy.org> Subject: [OSASK 5218] 文字のエンコード(Re: gcc移植計画). Date: Sat, 26 Oct 2002 08:47:14 +0900 > うことで、即席で新しいエンコード方法を考えてみました。「単純川 > 合エンコード(仮称)」略してSKEとでもしましょうか。 > > 0x00〜0x7f : ASCIIを表わす > 0x80〜0x9f, 0xff : この辺を使うとファイルシステムセーフ性に問 > 題があるかもしれないので、とりあえず利用しないことにする > (UTF-8では使っているので大丈夫なのかもしれませんがね) > 0xa0〜0xdf : 2バイト目以降のコード(6bitの自由度) > 0xe0〜0xe1 : 将来の拡張のためにリザーブ > 0xe2〜0xef : 複数バイトコードの先頭(下位4bitが後続するバイト > 数を意味する) > 0xf0〜0xfe : 将来の拡張のためにリザーブ マルチバイトにするときでも1バイト目に文字情報を入れないということ は、2バイトコードは6bitの自由度しかないことになります。こんな狭い ところに入る文字集合といったら JIS X 0201 カタカナ ぐらいしかあり ません。実質2バイトコードが使えないわけで……うーん、なんかカッコ 悪くありません?(^^; I.Tak. <g240845 !Atmark! mail.ecc.u-tokyo.ac.jp> http://user.ecc.u-tokyo.ac.jp/~g240845/