2: 2004-06-02 (水) 18:36:21 [6] | 3: 2004-06-03 (木) 00:10:36 [7] | ||
---|---|---|---|
Line 25: | Line 25: | ||
1010101 : 直前の寿命の16倍 | 1010101 : 直前の寿命の16倍 | ||
1011101 : 直前の寿命の32倍 | 1011101 : 直前の寿命の32倍 | ||
- | 1100101 : 直前の寿命の1/4倍 | + | 1100101 : 直前の寿命の1/4倍(端数切捨て) |
- | 1101101 : 直前の寿命の1/8倍 | + | 1101101 : 直前の寿命の1/8倍(端数切捨て) |
- | 1110101 : 直前の寿命の1/16倍 | + | 1110101 : 直前の寿命の1/16倍(端数切捨て) |
- | 1111101 : 直前の寿命の1/32倍 | + | 1111101 : 直前の寿命の1/32倍(端数切捨て) |
* UC0符号パラメータの動的補正 | * UC0符号パラメータの動的補正 | ||
Line 64: | Line 64: | ||
--(ここでも下位を右側に書くために、ストリームを右から左へ記述していることに注意) | --(ここでも下位を右側に書くために、ストリームを右から左へ記述していることに注意) | ||
--モード0とモード1 | --モード0とモード1 | ||
- | 000 : パラメータの最大値は 4以下、モード0 | + | 000 : パラメータの最大値は 0- 4、モード0 |
- | 100 : パラメータの最大値は 4以下、モード1 | + | 100 : パラメータの最大値は 0- 4、モード1 |
- | 010 : パラメータの最大値は 8以下、モード0 | + | 010 : パラメータの最大値は 5- 8、モード0 |
- | 110 : パラメータの最大値は 8以下、モード1 | + | 110 : パラメータの最大値は 5- 8、モード1 |
- | 0001 : パラメータの最大値は12以下、モード0 | + | 0001 : パラメータの最大値は 9-12、モード0 |
- | 1001 : パラメータの最大値は12以下、モード1 | + | 1001 : パラメータの最大値は 9-12、モード1 |
- | 0101 : パラメータの最大値は16以下、モード0 | + | 0101 : パラメータの最大値は13-16、モード0 |
- | 1101 : パラメータの最大値は16以下、モード1 | + | 1101 : パラメータの最大値は13-16、モード1 |
- | 00011 : パラメータの最大値は20以下、モード0 | + | 00011 : パラメータの最大値は17-20、モード0 |
- | 10011 : パラメータの最大値は20以下、モード1 | + | 10011 : パラメータの最大値は17-20、モード1 |
- | 01011 : パラメータの最大値は24以下、モード0 | + | 01011 : パラメータの最大値は21-24、モード0 |
- | 11011 : パラメータの最大値は24以下、モード1 | + | 11011 : パラメータの最大値は21-24、モード1 |
--ここまでのまとめ: | --ここまでのまとめ: | ||
---最後のビット(一番左のビット)がモードに対応している | ---最後のビット(一番左のビット)がモードに対応している | ||
- | ---また最後から2番目のビット(左から2番目のビット)が1だとパラメータの最大値は8の倍数、0だと8の倍数+4 | + | ---また最後から2番目のビット(左から2番目のビット)が1だとパラメータの最大値の上限は8の倍数、0だと8の倍数+4 |
---残りの部分(最初の部分)については、1の数を数えて0がきたら終わりで、パラメータの最大値が8づつ増えている。 | ---残りの部分(最初の部分)については、1の数を数えて0がきたら終わりで、パラメータの最大値が8づつ増えている。 | ||
--モード2 | --モード2 | ||
- | 00111 : パラメータの最大値は 4以下、モード2 | + | 00111 : パラメータの最大値は 0- 4、モード2 |
- | 10111 : パラメータの最大値は 8以下、モード2 | + | 10111 : パラメータの最大値は 5- 8、モード2 |
- | 001111 : パラメータの最大値は12以下、モード2 | + | 001111 : パラメータの最大値は 9-12、モード2 |
- | 101111 : パラメータの最大値は16以下、モード2 | + | 101111 : パラメータの最大値は13-16、モード2 |
- | 0011111 : パラメータの最大値は20以下、モード2 | + | 0011111 : パラメータの最大値は17-20、モード2 |
- | 1011111 : パラメータの最大値は24以下、モード2 | + | 1011111 : パラメータの最大値は21-24、モード2 |
--ここまでのまとめ: | --ここまでのまとめ: | ||
---最初の3bitはすべて111 | ---最初の3bitはすべて111 | ||
---モードは2しかない | ---モードは2しかない | ||
---ちょうど上記でモードビットを外して最初に111をつけた形式になっている | ---ちょうど上記でモードビットを外して最初に111をつけた形式になっている | ||
+ | |||
*** 本体 | *** 本体 | ||
+ | -基本的な考えとしては、パラメータ値そのものではなく、前の項から次の項を求めるための差分をエンコードしていく感じになる | ||
+ | --大雑把な傾向として、パラメータ列の値はその前後の値に近くなるため | ||
+ | -モード0では、この差分値を1以上の整数のみで表す(若干の例外はある) | ||
+ | -モード1では、この差分値を0以上の整数のみで表す | ||
+ | -モード2では、この差分値に符号ビットがあるため、正と零はもちろんのこと負の整数も使える | ||
+ | -初項も統一的な方法で求めるために0番目の項より前にも仮想的な項が存在すると仮定する | ||
+ | --この仮想的な項は0とする | ||
+ | -デコード方法0: | ||
+ | --モード0で、さらに直前の項が0でない場合はこれになる | ||
+ | --"0"がくるまでの"1"の数を数えて、それにさらに1を加えたものが差分値 | ||
+ | -デコード方法1: | ||
+ | --モード1か、もしくはモード0かつ直前の項が0の場合はこれになる | ||
+ | --"0"がくるまでの"1"の数を数えたものが差分値 | ||
+ | -デコード方法2: | ||
+ | --モード2の場合はこれになる | ||
+ | --まず最初は符号ビット、これが0なら0以上、これが1なら-1以下 | ||
+ | --"0"がくるまでの"1"の数を数えて、符号ビットが1だったらさらにそれに-1をXORしたものが差分値 | ||
+ | -(註)モード0でも直前の項に限ってデコード方法1になるのは、パラメータの最初の項のほうに0をいくつか並べたいときがあるからである | ||
+ | -ターミネーション(終端処理) | ||
+ | --パラメータの終わりを表すには、いくつかの方法があり、そのどれでもよい | ||
+ | --モード0で、たとえばパラメータの最大値の範囲が9-12の場合、もし12という内容の項をデコードし終わったら、もう次の項はありえないのでターミネーションとなる | ||
+ | ---13以上になるはずがないため | ||
+ | ---この終端方法はモード0でしか使えないし、しかも最後のパラメータが4の倍数のときにしか使えない | ||
+ | --これはどのモードでも使える方法だが、たとえばパラメータの最大値の範囲が9-12の場合、次の項が13となるようなそんな差分を受け取ったとしよう、これはもちろんありえないのでターミネーションする | ||
+ | ---この場合13になるのに必要なだけの"1"を数えたら、もう"0"を待たずに打ち切る | ||
+ | ---14などをエンコードする意味はないので、もはやターミネーションのための13しかありえず、最後の"0"が省略されているとみなすのである | ||
+ | --モード2で、次の項が-1となるようなそんな差分を受け取ったとしよう、これもありえないのでターミネーションする | ||
+ | ---この場合も-1になるのに必要なだけの"1"を数えたら、もう"0"を待たずに打ち切る | ||
+ | ---前の項が0だった場合、符号ビットが1だった時点でもう打ち切る | ||
*** フッタ | *** フッタ | ||
+ | -特定の条件でのみフッタが存在する | ||
+ | --モード0かモード1で、パラメータの数が2つ以上で、さらに最後のパラメータが0ではないとき | ||
+ | -フォーマットは例によって"0"がくるまで"1"の数を数えるというものである | ||
+ | -この値を、最後のパラメータから差し引く | ||
+ | --モード0やモード1ではパラメータが増える一方で最後を小さい値にすることができないため | ||
+ | --最後だけ減少で、あとはパラメータを増加させたいという状況が結構あるのでこの仕組みがある | ||
+ | --差し引く前の最後のパラメータが10だとしたら、当然"1"の数は10より多いことはありえないので、"1"が10個続いたら"0"は省略されているとみなして1ビット節約する | ||
*** デフォルトパラメータ | *** デフォルトパラメータ | ||
- | + | -これだけの圧縮をしてパラメータを短くまとめても、それでも対tek0では小さいファイルで負ける | |
+ | --なぜならtek0はパラメータが固定されており、圧縮ファイル内に書かなくていい分だけ有利だからである | ||
+ | --ある程度の大きさ以上ではtek0に負けることはまったくないが | ||
+ | --しかしtek0を破棄してtek1への移行を推進するにはやはりほぼ全てのケースでtek1のほうが高圧縮であるべきだろう | ||
+ | -ということで考え出されたのがデフォルトパラメータである | ||
+ | --これは非常に短い形式で圧縮ファイル内に記述できる | ||
+ | --デフォルトとしては平均的な内容のものを選んでいる | ||
+ | --これにより小さいファイルでの圧縮率が改善したのはもちろんであるが、大きなファイルも必要に応じてこのパラメータを利用することでさらに圧縮率が改善した | ||
+ | -デフォルトパラメータも含めてUC0パラメータのエンコードフォーマットをストリーム順に説明すると次のようになる | ||
+ | -更新ビット | ||
+ | --このビットが0のとき、寿命にもかかわらず、パラメータを更新しないことを意味する | ||
+ | --これはたまたま圧縮対象の統計的性質が変わらなかった場合などに、同じことを何度も書くのを回避するためである | ||
+ | --このビットが0なら、以降のフィールドはすべてない | ||
+ | --ブロックの一番最初では必ずパラメータを設定しなければいけないので、このビットはない | ||
+ | -非デフォルトビット | ||
+ | --このビットが1なら、直後から上記で説明したUC0パラメータの圧縮コードが始まる | ||
+ | --このビットが0なら、デフォルトパラメータ利用ということで複数用意されたデフォルトのうちのどれなのかを記述するコードが続く | ||
+ | --(1)byかlzのとき: | ||
+ | ---3bitのパラメータがあり、仮にこれが0なら [ 1, 2, 3, 4, 5, 6, 7, 8, ... ] というのを指定したことになる。 | ||
+ | ---これが3なら [ 0, 0, 0, 1, 2, 3, 4, 5, 6, 7, 8, ... ] を意味する | ||
+ | ---すなわち、最初に0が0~7個並び、そのあとは1から順に1づつ増えるようなパラメータである | ||
+ | --(2)dsのとき: | ||
+ | ---デフォルトは一種類しかないので、追加のパラメータはない | ||
+ | ---デフォルトの内容は [ 0, 4, 8, 10, 12, 14, 16, 18, 20, 22, 24 ] である | ||
+ | --(3)cpのとき: | ||
+ | ---2bitのパラメータがあり、それぞれの意味は次の通り: | ||
+ | ---00:[ 1, 2, 3, 4, 5, 6, 7, 8, 9, ... ] | ||
+ | ---01:[ 1, 1, 2, 3, 4, 5, 6, 7, 8, 9, ... ] | ||
+ | ---10:[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, ... ] | ||
+ | ---11:リザーブ | ||
+ | -cpの場合に限り、2bitのcp最低値フィールドがある | ||
+ | --非デフォルトビットの値にかかわらず、このフィールドはある | ||
+ | --更新ビットが0の場合は、このフィールドもない | ||
+ | --ここの値に+1したものがcpの最低値となる | ||
+ | ---つまり1~4 | ||
* tek1h | * tek1h |
(This host) = http://osask.net