[Subject Prev][Subject Next][Thread Prev][Thread Next][Subject Index][Thread Index]
[OSASK 2862] Re: Fullset EUC
Hidemi KAWAI さん、こんにちは。I.Tak. です。
Tue, 01 Jan 2002 07:15:05 -0000 の
[OSASK 2847] Re: Fullset EUC-JP
に返信です。
> いくつかのテキストは、半角文字は半角で、全角文字は半角の2倍で
>表示することを想定して書かれているでしょう。その意図に背くだけの
>理由があれば僕はカナを全角で書くなどのことをやるかもしれませんが
>、そうでないかぎりやりません。OSASKはエミュレーターOSであること
>を忘れないでください。エミュレーションというのは基本的に実機に近
>ければ近いほど良いのです。
やはり互換性ですね。
> 日本語に限定したフルセットEUCは確かに共通に使えるでしょう。し
>かし本当のフルセットEUCに対応するなら、たくさんのコードページに
>対応しなければいけないでしょう。オプションは増えます。
私は、EUCを、GLにG0、GRにG1を呼び出しておき、シングルシフトで
GRにG2かG3を一文字だけ呼び出すという仕様だと思っていたんですが、
違うんですか?……あった。
http://wdic.asuka.net/?title=EUC より
┏━━━┳━━━━━━┯━━━━━━┯━━━━━━┯━━━━━━┓
┃文字 ┃ G0 │ G1 │ G2 │ G3 ┃
┃ 集合┃ │ │ │ ┃
┣━━━╋━━━━━━┿━━━━━━┿━━━━━━┿━━━━━━┫
┃日本語┃ JIS X0201 │ JIS X0208 │ JIS X0201 │ JIS X0212 ┃
┃ ┃ 英数 │ 漢字 │ カタカナ │ 補助漢字 ┃
┠───╂──────┼──────┼──────┼──────┨
┃中国語┃ ASCII │ GB 2312 │ │ ┃
┃簡体字┃ │ │ │ ┃
┠───╂──────┼──────┼──────┼──────┨
┃中国語┃ ASCII │ CNS 11643-1│ │ CNS 11643-2┃
┃繁体字┃ │ │ │ ┃
┠───╂──────┼──────┼──────┼──────┨
┃韓国語┃ ASCII │ KS X 1001 │ │ ┃
┃ ┃ │ │ │ ┃
┗━━━┻━━━━━━┷━━━━━━┷━━━━━━┷━━━━━━┛
APIに渡すbaseの値を変えるだけでフォントすなわち言語を変えられますから、
オプションを増やす必要はありません。baseの値だけ変えたマクロを個別に
作っておくだけで各国語のフルセットEUCが利用できますよ。
ちなみにKS C 5601は番号不足で1997年にKS X 1001になったそうです。
>> 今のところG2やG3を使うのは日本語だけなのも、確かにそうです。
> 中国語とかはどうなんでしょうか?よく知らないんですが・・・。
上の表のとおり、繁体字はG3を使うようです。台湾でしょう。
>> EUCの拡張性は日本語だけのものではありませんから、フルセットEUCこそ
>>API対応しましょう。日本語だけのためはシフトJISそのものです。MS拡張に
>>も個別対応しているようですし(←使いたい者が作る原理を感じました)。
:
> このときの発言にも現れていますが、僕は純粋に現状での日本語テキ
>スト全体を考えて、それでどれを中心にするべきかを決めました。今は
>シフトJISとNECコードに都合の良い仕様になっています。
うむむ、それは知りませんでした。ごめんなさい。やるせない現状……
> フルセットEUCを作るべきだという意見には賛成です。僕の言うフル
>セットは日本語専用ではなくEUCの全ての拡張性に配慮したものです。
>パラメーターは増えるでしょう。そしてシンプルで十分な場合もあるで
>しょう。僕はEUCについてはシンプルとフルセットの両方をつけてやり
>たいと思っています。そして文字長指定は、表示文字の半角文字単位で
>指定させようと思っています(つまり、半角カタカナは2バイトですが
>文字長1です)。
やはり上に書いたとおり、EUCの変換は私が書いたルーチンで全てのはず
です。あれは日本語専用ではありません。与えるbaseの値で……(以下同文)
EUCは地域化コードなので、各国語の混じった文は扱いません。制御記号
はシングルシフト2と3だけです。
>> つまるところ私はISO-2022やEUCが好きでシフトJISは嫌いなわけで、
>>かなりひいきして発言しています。しかし嘘は言っていません。
>>よぉ〜く考えてください(^_^;;;
> 僕は好き嫌いを押し殺して設計しているつもりです。
EUCがフルセットでなかったのは、それが日本語専用だと誤解なさっていた
んですね。
>> ぐいぐい00仕様のフォントはどういう配置になっているのか興味があります。
> これについては、[OSASK 2492]をごらんください。
ファイルのままのオフセット……
>> JIS X 0201 をエンコードすると英字とカナの間に空き(制御コード領域C1)
>>がありますよね。でもオリジナル変換ルーチンではそこの空きは埋めていない
>>ようでした。JIS X 0213 は隙間が無いように変換するのが面倒なのに……。
> はい、隙間は埋めていません。埋めない方が使いやすいですよね?一
>般的な変換においては。
そうですね。二バイト文字でもその方が便利です。節約は分かりますが、
優遇しているみたいで、ちょぉーっと引っかかります(^^;
------------------------------------------------------------
I.Tak. <msy !Atmark! catvmics.ne.jp>
http://home1.catvmics.ne.jp/~msy/takhome.htm