2: 2009-07-14 (火) 22:47:31 |
現: 2024-01-08 (月) 12:58:49 k-tan |
- | * OSASKにおけるAPIのパラメータの渡し方 | + | TITLE:x |
| + | * OSASKにおけるAPIのパラメータの渡し方 [#u0f7c4fa] |
| -[[OsaTech]]より | | -[[OsaTech]]より |
| -(by [[K]], 2009.07.14) | | -(by [[K]], 2009.07.14) |
| | | |
- | *** (1) | + | *** (1) [#w665c8fd] |
| -第一世代OSASKのAPIを規定するに当たって、最初に検討したのはパラメータの渡し方だったように思う。これはOSASK-MLが始まる前から[[K]]と今原氏とで検討した。 | | -第一世代OSASKのAPIを規定するに当たって、最初に検討したのはパラメータの渡し方だったように思う。これはOSASK-MLが始まる前から[[K]]と今原氏とで検討した。 |
| -当時の僕たちはパラメータの渡し方には、以下の3つがあると考えた。 | | -当時の僕たちはパラメータの渡し方には、以下の3つがあると考えた。 |
| ---BIOSのように、パラメータを所定のレジスタにいれ、APIを呼び出す。「はりぼてOS」もこのタイプ。 | | ---BIOSのように、パラメータを所定のレジスタにいれ、APIを呼び出す。「はりぼてOS」もこのタイプ。 |
| --スタック渡し | | --スタック渡し |
- | ---C言語の関数のように、パラメータをスタックにつんで、APIを呼び出す。 | + | ---C言語の関数のように、パラメータをスタックにつんで、APIを呼び出す。win32はこれに分類していいと思う。 |
| --ポインタ渡し | | --ポインタ渡し |
| ---すぐには例が思いつかないのだが、とにかくパラメータをメモリのどこかに所定の順序で並べて、その先頭アドレスをレジスタに入れて、APIを呼び出す。 | | ---すぐには例が思いつかないのだが、とにかくパラメータをメモリのどこかに所定の順序で並べて、その先頭アドレスをレジスタに入れて、APIを呼び出す。 |
| -ということで、メモリにパラメータ列を並べて、その先頭アドレスをEBXにいれて、APIを呼び出すというのが、第一世代OSASKの基本形になった。 | | -ということで、メモリにパラメータ列を並べて、その先頭アドレスをEBXにいれて、APIを呼び出すというのが、第一世代OSASKの基本形になった。 |
| | | |
- | *** (2) | + | *** (2) [#b4724580] |
| -レジスタ渡しを避けたことで、一度のAPI呼び出しで渡せるパラメータの量に上限は無くなった。そうすると、一度の呼び出しで複数のAPIを実行できる仕組みがほしくなった。そこで、[[K]]は以下のような設計をした。 | | -レジスタ渡しを避けたことで、一度のAPI呼び出しで渡せるパラメータの量に上限は無くなった。そうすると、一度の呼び出しで複数のAPIを実行できる仕組みがほしくなった。そこで、[[K]]は以下のような設計をした。 |
| --[機能番号 パラメータ パラメータ パラメータ ・・・] [機能番号 パラメータ パラメータ パラメータ ・・・] ... [0] | | --[機能番号 パラメータ パラメータ パラメータ ・・・] [機能番号 パラメータ パラメータ パラメータ ・・・] ... [0] |
| -メモリ上には、このようにパラメータ列の終わりに続けて次の機能番号を書くことができ、これで事実上いくつでもつなげることができた。この先頭のアドレスをEBXに入れてAPIを呼び出せば、つながった機能が全部実行される。そして最後には終端ファンクション(ファクション番号0)があった。これがないと、OSはどこまでがAPIのための構造体なのか判断できないためである。 | | -メモリ上には、このようにパラメータ列の終わりに続けて次の機能番号を書くことができ、これで事実上いくつでもつなげることができた。この先頭のアドレスをEBXに入れてAPIを呼び出せば、つながった機能が全部実行される。そして最後には終端ファンクション(ファクション番号0)があった。これがないと、OSはどこまでがAPIのための構造体なのか判断できないためである。 |
| | | |
- | *** (3) | + | *** (3) [#had5981b] |
| -この2つの特徴が、OSASKをOSASKたらしめた大きな要素になった。まずポインタ渡しになったことにより、定数の引数を多く持つAPI呼び出しは、いちいちスタックにつむのをやめて、.data内の配列に機能番号やパラメータを並べておき、可変部分のみを上書きして、API呼び出しをした。これはコードがとても短くなる。これはレジスタ渡しだと真似できない。レジスタ渡しなら、レジスタに値を代入しなければいけないからである。省略できる代入はない。またスタック渡しでもこれは真似できない。スタック渡しの場合も、すべてのパラメータをスタックにつまなければいけないからである。ということで、本質的ではないMOVの羅列やPUSHの羅列は、OSASKアプリからは一掃された。つまりコンパクトで高速になった。 | | -この2つの特徴が、OSASKをOSASKたらしめた大きな要素になった。まずポインタ渡しになったことにより、定数の引数を多く持つAPI呼び出しは、いちいちスタックにつむのをやめて、.data内の配列に機能番号やパラメータを並べておき、可変部分のみを上書きして、API呼び出しをした。これはコードがとても短くなる。これはレジスタ渡しだと真似できない。レジスタ渡しなら、レジスタに値を代入しなければいけないからである。省略できる代入はない。またスタック渡しでもこれは真似できない。スタック渡しの場合も、すべてのパラメータをスタックにつまなければいけないからである。ということで、本質的ではないMOVの羅列やPUSHの羅列は、OSASKアプリからは一掃された。つまりコンパクトで高速になった。 |
- | -複数ファンクションを一度のAPIコールで実現できるので、一つあたりのAPI呼び出しのオーバヘッドは軽減された。またこれはAPI設計にもいい影響を与えた。というのは、APIの機能を細分化するのにためらいがなくなったのである。普通だと効率を考えて、あまりにもささやかな機能をAPI化するのはためらう。そうするとどうしても複雑なAPIが多くなる。そしてOSも複雑になる。・・・しかしAPI呼び出しのオーバヘッドを無視してもいいと思えるようになると、APIはかなり小さな機能をサポートするだけでもかまわないと思えて、複数のAPIを組み合わせて使ってもらうのを前提に考えるようになる。結果的に小回りのきく使いやすいAPIになる。そしてOSも肥大化しない。 | + | -複数ファンクションを一度のAPIコールで実現できるので、一つあたりのAPI呼び出しのオーバヘッドは軽減された。またこれはAPI設計にもいい影響を与えた。というのは、APIの機能を細分化するのにためらいがなくなったのである。普通だと効率を考えて、あまりにもささやかな機能だけをAPI化するのはためらう。そうするとどうしても複雑なAPIが多くなる。そしてOSも複雑になる。・・・しかしAPI呼び出しのオーバヘッドを無視してもいいと思えるようになると、APIはかなり小さな機能をサポートするだけでもかまわないと思えて、複数のAPIを組み合わせて使ってもらうのを前提に考えるようになる(前処理しかしないAPI、後処理しかしないAPIなど)。結果的に小回りのきく使いやすいAPIになる。そしてOSも肥大化しない。 |
- | *** (4) | + | *** (4) [#ocebc787] |
| -以上は第一世代OSASKの話である。そして以下が第二世代OSASKの話である。 | | -以上は第一世代OSASKの話である。そして以下が第二世代OSASKの話である。 |
| + | -第二世代OSASKでも、レジスタ渡しや、一度のAPI呼び出しで複数のAPIが実行される仕組みはそのまま引き継がれた。しかし若干の手直しもある。 |
| + | -まずポインタを格納するレジスタはEBXからEDIに変更した。これはEBXがBL,BHに分割可能で使い道が多いので、これよりも使い道の少ないEDIにしたというだけである。これでアプリは少し書きやすくなるはずだ。また複数APIを呼び出す時のルールも変更した。今まではデフォルトが複数API実行で、それを打ち切るために最後に0を付加させていた。しかし実際の利用を見ると、半分以上のケースは一つのAPIを呼ぶだけであり、このために毎度0を付加するのは気になるオーバーヘッドである。したがって最初にマルチAPIファンクション(3...だったかな?)を置けば従来どおりの複数API実行、最初がそれ以外の機能番号なら一つのAPIを実行した時点で終了、とした。 |
| + | -次に第二世代OSASKでは、パラメータのエンコードを見直した。第一世代では、機能番号も引数も基本は32bitの整数だった。これはCPUにとって一番扱いやすいし、拡張性も十分にある。しかし実際の利用を見てみると、扱われる数値は8bitで十分なケースが多く、いやむしろ4bit程度で十分な場合も少なくない。 |
| + | -そこでエンコードを4bit単位のものに変更した。必要なら8bitや12bitなどより長い整数形式を使うことももちろんできる。→[[GUIGUI01/man0004]] これで無駄な上位の0は一掃され相当短くなった。 |
| + | -さらに第二世代OSASKでは、引数の一部分に対して、「ここの値はスタックの○○番目を参照」とか「ここの値は○○レジスタを参照」のような記述を許すことにした。これはパラメータに特別な数字を書くことで実現している。これは非常に強力で、今まで可変パラメータを含んだものはわざわざMOVなどで上書きしていたのだが、それが完全に不要になった。レジスタの値を利用できるので、パラメータのエンコードが上記のように複雑になっても、ほとんど問題にはならない(もしレジスタの値が利用できないのなら、それをメモリにストアするために、アプリがややこしいエンコードをしなければいけなかった)。 |
| + | -こうして結果的に、第二世代OSASKのAPIパケットは基本的に上書きしないものとなり、それゆえに.textに置いてもいいと思えるようになった。そこでEDI=0という特別形式を作り、この値でAPIが呼ばれたときには、OSはAPIパケットの先頭アドレスをEIPから取得する。そしてそのまま実行し、終了時にパケット終了アドレスの次のアドレスへreturn;する。これだとEDIへポインタを代入する手間が省ける(第二世代OSASKではEDIの初期値が0なのだが、これを一度も変更しないアプリも存在するくらいである)。 |
| + | --これはつまりCALL命令の直後にDBでAPIパケットを並べればいいということである。 |
| | | |
- | * こめんと欄 | + | *** (5) [#i98509f5] |
| + | -第二世代OSASKにおけるAPIパケットの例: |
| + | -51 "hello, world\0" |
| + | --5はコンソールへの文字列出力ファンクション。この直後に4xを書くと標準出力以外にも出力できるが、ここでは何もしてないのでデフォルトのまま。 |
| + | --1は文字列の指定方式で、パケット内部に8bitのUCHAR配列が格納されていることを意味している。そして0が終端。この終端コードも他の値にオーバーライド可能。 |
| + | --hello, worldと表示するために、文字列以外でのオーバーヘッドは2バイトである(51と終端の0)。他のOSのAPIで、API-CALLのためのパラメータ設定でここまで少ない手間でできるものがあるだろうか。普通、8bitレジスタに何か値を代入するだけでも2バイトを消費する。もしくは-128~+127の値をスタックにつむだけでも2バイトを使う。 |
| + | -50 8c "hello, world" |
| + | --これは文字列の指定方法を別のやり方にした例。0も8bitのUCHAR配列だが、配列長は終端制ではなく、事前に指定する方法。つぎの8cはgh4による0x0cを意味しているので、配列長は12バイトだと分かる。 |
| + | -55 16 0 |
| + | --最初の5はやはりコンソールへの文字列出力ファンクション。次の5は文字列モード解除。これにより、配列を利用しないか、もしくは仮に配列などが指定されても、その長さが出力すべき文字長だとは判断しなくなる。次の1は文字長。つまり1文字。次の60はEAXレジスタのこと。その値が文字コードと解釈されることとなる。ちなみに6で始まるのはレジスタやスタックの値を表す。 |
| + | --結果として、putchar(EAX);になる。・・・これをやるのに普通のOSならどのくらい手間をかけるだろう。まあ、一文字表示は他のOSのほうが短いかもしれない。しかしそれは文字コードをALで指定している場合だけだろう。第二世代OSASKなら、EAX以外にもECXやEDXやEBXなどを指定できる(それぞれ61,62,63)。55 26 08 a などとすれば、printf("%c\n", EAX); もできる。 |
| + | * こめんと欄 [#id7e1272] |
| #comment | | #comment |