6: 2004-06-07 (月) 23:04:45 |
現: 2024-01-08 (月) 12:59:03 k-tan |
- | * tek1の技術的情報 | + | TITLE:x |
| + | * tek1の技術的情報 [#fa48ccf1] |
| -(by [[K]], 2004.05.31) | | -(by [[K]], 2004.05.31) |
| + | -''以下ほとんど現状とマッチしていません。そのうち対処します。'' |
| + | |
| + | |
| -そのうち書くと思うドキュメントの下書き | | -そのうち書くと思うドキュメントの下書き |
| -フォーマットに関する情報以外は、このページではなく[[impressions]]などにお願いします。 | | -フォーマットに関する情報以外は、このページではなく[[impressions]]などにお願いします。 |
| -bim2bin4hで一部ビットの意味が反転したので訂正。 | | -bim2bin4hで一部ビットの意味が反転したので訂正。 |
| | | |
- | * tek1圧縮 | + | * tek1圧縮 [#fe9f37f8] |
| -tek1は、次の1バイトから始まります。 | | -tek1は、次の1バイトから始まります。 |
| --註:OSACMP形式はこの1バイトに先立って16バイトのシグネチャとnバイトの展開後のサイズに関する情報が付属する。これについては後述。 | | --註:OSACMP形式はこの1バイトに先立って16バイトのシグネチャとnバイトの展開後のサイズに関する情報が付属する。これについては後述。 |
- | --bit0:1です。もしここが0なら以降のバイトに何らかの拡張情報が存在します。 | + | --bit0:1です。もしここが0ならそれは拡張情報をもつ先行バイトで、以下の意味を持つのはbit0が1になっているバイトです。 |
- | ---実はこの先頭バイトがs7符号になっている。 | + | ---実はこの先頭バイト自身がs7s符号になっている。 |
- | --bit1:0です。tek2ではここが1になる場合もありますが、tek1では常に0です。 | + | --bit1:1です。tek2ではここが0になる場合もありますが、tek1では常に1です。 |
| --bit2-5:ブロックサイズです。0001ならブロックサイズ512バイト、0010なら1KB、・・・0111ならブロックサイズ32KB、・・・1111ならブロックサイズ8MBです。 | | --bit2-5:ブロックサイズです。0001ならブロックサイズ512バイト、0010なら1KB、・・・0111ならブロックサイズ32KB、・・・1111ならブロックサイズ8MBです。 |
| --bit6:通常は0です。1だとブロックごとに圧縮形式が変えられるモードです。 | | --bit6:通常は0です。1だとブロックごとに圧縮形式が変えられるモードです。 |
- | --bit7:将来の拡張のためのビットで常にゼロです。 | + | --bit7:通常は0です。1だと以下の「tek1s x ブロック数」が始まる直前に、これをスキップするためのs7s符号が先行します(ECCなどがある場合はtek1sのかたまりのあとにまとめておかれるので、そこへアクセスするために存在する)。 |
| -tek1では展開後のサイズに関する情報はフォーマットの中には含まれません。これは展開時に既知であるとします。OSACMP形式の場合はOSACMPヘッダの中に展開後のサイズが記録されているので問題ありません。 | | -tek1では展開後のサイズに関する情報はフォーマットの中には含まれません。これは展開時に既知であるとします。OSACMP形式の場合はOSACMPヘッダの中に展開後のサイズが記録されているので問題ありません。 |
| -その展開後のサイズを上記のブロックサイズで割って、いくつのブロックがアーカイブに含まれるか計算します。このブロック数によって、これ以降のフォーマットが決まります。 | | -その展開後のサイズを上記のブロックサイズで割って、いくつのブロックがアーカイブに含まれるか計算します。このブロック数によって、これ以降のフォーマットが決まります。 |
| --レベル0フォーマット:1ブロック | | --レベル0フォーマット:1ブロック |
- | --レベル1フォーマット:2~256ブロック(bit6が1なら、1ブロックでもこれになる) | + | --レベル1フォーマット:2~256ブロック |
| --レベル2フォーマット:257~65536ブロック | | --レベル2フォーマット:257~65536ブロック |
| --レベル3フォーマット:63357~16777216ブロック | | --レベル3フォーマット:63357~16777216ブロック |
| -レベル0の場合、次のバイトからtek1sフォーマットになります。 | | -レベル0の場合、次のバイトからtek1sフォーマットになります。 |
| -レベル1の場合、次のバイトからは以下のようになります。 | | -レベル1の場合、次のバイトからは以下のようになります。 |
- | --(1)s7符号で書いた(2)の長さ | + | --(1)s7s符号で書いた(2)の長さ |
| --(2)tek1h | | --(2)tek1h |
| --(3)tek1s x ブロック数 | | --(3)tek1s x ブロック数 |
| -レベル2の場合、次のバイトからは以下のようになります。 | | -レベル2の場合、次のバイトからは以下のようになります。 |
- | --(1)s7符号で書いた(2)の長さ | + | --(1)s7s符号で書いた(2)の長さ |
| --(2)tek1h | | --(2)tek1h |
- | --(3)s7符号で書いた(4)の長さ | + | --(3)s7s符号で書いた(4)の長さ |
| --(4)tek1h x (2~256個) | | --(4)tek1h x (2~256個) |
| --(5)tek1s x ブロック数 | | --(5)tek1s x ブロック数 |
| -レベル3の場合、次のバイトからは以下のようになります。 | | -レベル3の場合、次のバイトからは以下のようになります。 |
- | --(1)s7符号で書いた(2)の長さ | + | --(1)s7s符号で書いた(2)の長さ |
| --(2)tek1h | | --(2)tek1h |
- | --(3)s7符号で書いた(4)の長さ | + | --(3)s7s符号で書いた(4)の長さ |
| --(4)tek1h x (2~256個) | | --(4)tek1h x (2~256個) |
- | --(5)s7符号で書いた(6)の長さ | + | --(5)s7s符号で書いた(6)の長さ |
| --(6)tek1h x (257~65536個) | | --(6)tek1h x (257~65536個) |
| --(7)tek1s x ブロック数 | | --(7)tek1s x ブロック数 |
| -tek1hの役割は、ランダムアクセスの際にブロックがどこから始まっているかを手早く見つけるためのもので、256個以上の場合は階層を成します。 | | -tek1hの役割は、ランダムアクセスの際にブロックがどこから始まっているかを手早く見つけるためのもので、256個以上の場合は階層を成します。 |
| + | -最初のバイトでbit7が1だった場合、tek1sが始まる直前にs7s符号がおかれますが、その値は、「tek1s群の総サイズ(バイト単位)-1」です。 |
| + | -また上記で示されるtek1h群の長さは実際のバイト数から2を減じて記載されています。 |
| | | |
- | * tek1s | + | * tek1s [#yfc0130d] |
| -これが圧縮の核となる部分です。その他はヘッダのようなもので、圧縮としては本質的な部分ではありません。 | | -これが圧縮の核となる部分です。その他はヘッダのようなもので、圧縮としては本質的な部分ではありません。 |
| -tek1sの最初はs7符号になっていて、まずはこれを取得します。これはビットストリーム部分が何バイトであるかという情報で、これに2を加えたバイト数がビットストリーム部分の長さです。その直後がバイトストリームになっているので、バイトストリームが必要になったらここから1バイトずつ読んでいきます。 | | -tek1sの最初はs7符号になっていて、まずはこれを取得します。これはビットストリーム部分が何バイトであるかという情報で、これに2を加えたバイト数がビットストリーム部分の長さです。その直後がバイトストリームになっているので、バイトストリームが必要になったらここから1バイトずつ読んでいきます。 |
| -s7符号の直後がビットストリームです。バイトストリーム以外はここからビット単位で読みます。 | | -s7符号の直後がビットストリームです。バイトストリーム以外はここからビット単位で読みます。 |
| | | |
- | *** tek1s圧縮の基礎 | + | *** tek1s圧縮の基礎 [#i71e3da3] |
| -基本はtek0とまったく同じです。単に符号化の方法がUC0符号に統一されただけです。それと符号寿命という概念があるので、それが付け加えられてはいますが。 | | -基本はtek0とまったく同じです。単に符号化の方法がUC0符号に統一されただけです。それと符号寿命という概念があるので、それが付け加えられてはいますが。 |
| | | |
| --(14)(2)へ戻る。 | | --(14)(2)へ戻る。 |
| | | |
- | * s7s符号 | + | * s7s符号 [#j16c9806] |
| -これはtek0で出てきたs8符号の7bit版だと思えば理解が早いでしょう。 | | -これはtek0で出てきたs8符号の7bit版だと思えば理解が早いでしょう。 |
| --(1)1バイト読む。 | | --(1)1バイト読む。 |
| -結果的に上位下位の関係がインテル風じゃないところだけに注意。 | | -結果的に上位下位の関係がインテル風じゃないところだけに注意。 |
| | | |
- | * s7符号 | + | * s7符号 [#p8c8e030] |
| -s7s符号にちょっと細工します。 | | -s7s符号にちょっと細工します。 |
| --s7sで読み取った際に1バイトで終わったのなら0を加える。 | | --s7sで読み取った際に1バイトで終わったのなら0を加える。 |
| --以下略。 | | --以下略。 |
| | | |
- | * UC0符号 | + | * UC0符号 [#k4e3f8de] |
| -0以上の整数を符号化するものです。多くのパラメータを持っているので、そのパラメータによっていろいろな状況にマッチします。 | | -0以上の整数を符号化するものです。多くのパラメータを持っているので、そのパラメータによっていろいろな状況にマッチします。 |
| -デコード方式は基本的に次のとおりです(実際は1bitずつ読まずに数ビットずつ処理して高速化しますが)。 | | -デコード方式は基本的に次のとおりです(実際は1bitずつ読まずに数ビットずつ処理して高速化しますが)。 |
| -また小さい数はあまり出てこないけど、100くらいの数字がたくさん出てくる場合は、パラメータテーブル0を7とかにしておくわけです。そうすると0-127は1+7=8bitで符号化できます。 | | -また小さい数はあまり出てこないけど、100くらいの数字がたくさん出てくる場合は、パラメータテーブル0を7とかにしておくわけです。そうすると0-127は1+7=8bitで符号化できます。 |
| | | |
- | * OSACMP形式 | + | * OSACMP形式 [#s8a1face] |
| -16バイトのシグネチャ: | | -16バイトのシグネチャ: |
| 83 FF FF FF 01 00 00 00 4F 53 41 53 4B 43 4D 50 | | 83 FF FF FF 01 00 00 00 4F 53 41 53 4B 43 4D 50 |
| -そしてこのあとに展開後のファイルサイズがs7sでかかれている。それだけ。 | | -そしてこのあとに展開後のファイルサイズがs7sでかかれている。それだけ。 |
| | | |
- | * この他の細かいことは以下で | + | * この他の細かいことは以下で [#gaa7e9d6] |
| -[[tek1/adv0]] : 残りのフォーマット | | -[[tek1/adv0]] : 残りのフォーマット |
| -[[tek1/adv1]] : tek0からの進歩の流れ | | -[[tek1/adv1]] : tek0からの進歩の流れ |
| + | -[[tek1/adv2]] : 補助バッファ利用について |
| + | -[[tek1/comp]] : 他のフォーマットとの比較表 |
| + | |
| + | * こめんと欄 [#i9d52bf8] |
| + | - tek1 -- [[名無しさん]] &new{2009-07-10 (金) 10:25:25}; |
| | | |
- | * こめんと欄 | |
| #comment | | #comment |