[OSASK 5346] Re: 文字のエンコード

 こんにちは、I.Tak.です。

 SKEなんですが、ちょっと問題ではないか?と思う点がありまして。

From: Hidemi KAWAI <kawai !Atmark! imasy.org>
Subject: [OSASK 5218] 文字のエンコード(Re: gcc移植計画).
Date: Sat, 26 Oct 2002 08:47:14 +0900

> うことで、即席で新しいエンコード方法を考えてみました。「単純川
> 合エンコード(仮称)」略してSKEとでもしましょうか。
> 
>   0x00〜0x7f : ASCIIを表わす
>   0x80〜0x9f, 0xff : この辺を使うとファイルシステムセーフ性に問
>     題があるかもしれないので、とりあえず利用しないことにする
>     (UTF-8では使っているので大丈夫なのかもしれませんがね)
>   0xa0〜0xdf : 2バイト目以降のコード(6bitの自由度)
>   0xe0〜0xe1 : 将来の拡張のためにリザーブ
>   0xe2〜0xef : 複数バイトコードの先頭(下位4bitが後続するバイト
>     数を意味する)
>   0xf0〜0xfe : 将来の拡張のためにリザーブ

 マルチバイトにするときでも1バイト目に文字情報を入れないということ
は、2バイトコードは6bitの自由度しかないことになります。こんな狭い
ところに入る文字集合といったら JIS X 0201 カタカナ ぐらいしかあり
ません。実質2バイトコードが使えないわけで……うーん、なんかカッコ
悪くありません?(^^;


I.Tak. <g240845 !Atmark! mail.ecc.u-tokyo.ac.jp>
http://user.ecc.u-tokyo.ac.jp/~g240845/


ML番号でジャンプ
ML単語検索