ページへ戻る

− Links

 印刷 

why_sar のバックアップ差分(No.10) :: OSASK計画

osaskwiki:why_sar のバックアップ差分(No.10)

« Prev[4]  Next »[5]
9: 2004-11-11 (木) 11:21:12 ソース[6] 10: 2004-11-12 (金) 18:09:48 ソース[7]
Line 37: Line 37:
*** ベンチマーク *** ベンチマーク
-いくつかのアーカイブ形式について、圧縮能力の例を示します。 -いくつかのアーカイブ形式について、圧縮能力の例を示します。
-|      |lzh|zip|tar.gz|tar.bz2|dgc|LZMA|''sar''|PPMd|paq| +|      |lzh|zip|tar.gz|tar.bz2|yz2|dgc|LZMA|''sar''|PPMd|paq| 
-|osat45i|RIGHT:532093|RIGHT:524182|RIGHT:522146|RIGHT:546988|RIGHT:529568|RIGHT:503290|RIGHT:''498125''|RIGHT:527052|RIGHT:465714| +|osat45i|RIGHT:532093|RIGHT:524182|RIGHT:522146|RIGHT:546988|RIGHT:549599|RIGHT:529568|RIGHT:503290|RIGHT:''498125''|RIGHT:527052|RIGHT:465714| 
-|sartol0g|RIGHT:46686|RIGHT:46172|RIGHT:44175|RIGHT:43202|RIGHT:41648|RIGHT:39861|RIGHT:''39014''|RIGHT:37404|RIGHT:32802| +|sartol0g|RIGHT:46686|RIGHT:46172|RIGHT:44175|RIGHT:43202|RIGHT:46315|RIGHT:41648|RIGHT:39861|RIGHT:''39014''|RIGHT:37404|RIGHT:32802| 
-|make46|RIGHT:438752|RIGHT:413707|RIGHT:398232|RIGHT:302464|RIGHT:248784|RIGHT:241575|RIGHT:''238116''|RIGHT:216140|RIGHT:168127|+|make46|RIGHT:438752|RIGHT:413707|RIGHT:398232|RIGHT:302464|RIGHT:289643|RIGHT:248784|RIGHT:241575|RIGHT:''238116''|RIGHT:216140|RIGHT:168127|
--単位はバイトです。 --単位はバイトです。
--http://arc.osask.jp/osask/pcat/osat45i.lzh --http://arc.osask.jp/osask/pcat/osat45i.lzh
--http://arc.osask.jp/osask_src/make46.lzh --http://arc.osask.jp/osask_src/make46.lzh
-以下は上記の結果について、paqの結果を100として相対指標化したものです。こちらのほうが比較がしやすいです。 -以下は上記の結果について、paqの結果を100として相対指標化したものです。こちらのほうが比較がしやすいです。
-|      |lzh|zip|tar.gz|tar.bz2|dgc|LZMA|''sar''|PPMd|paq| +|      |lzh|zip|tar.gz|tar.bz2|yz2|dgc|LZMA|''sar''|PPMd|paq| 
-|osat45i|114.3|112.6|112.1|117.5|113.7|108.1|''107.0''|113.2|100.0| +|osat45i|114.3|112.6|112.1|117.5|118.0|113.7|108.1|''107.0''|113.2|100.0| 
-|sartol0g|142.3|140.8|134.7|131.7|127.0|121.5|''118.9''|114.0|100.0| +|sartol0g|142.3|140.8|134.7|131.7|141.2|127.0|121.5|''118.9''|114.0|100.0| 
-|make46|261.0|246.1|236.9|179.9|148.0|143.7|''141.6''|128.6|100.0| +|make46|261.0|246.1|236.9|179.9|172.3|148.0|143.7|''141.6''|128.6|100.0| 
-|展開作業域|8KB未満|8KB未満|8KB未満|2.3MB|不明|28KB|''32KB''|194MB|120MB|+|展開作業域|8KB未満|8KB未満|8KB未満|2.3MB|数MB以上|不明|28KB|''32KB''|194MB|120MB|
--sar形式ではtek5圧縮を使っています。 --sar形式ではtek5圧縮を使っています。
--lzhはlh7形式です。 --lzhはlh7形式です。
 +--yz2は最終版とみられるalpha6です。
--dgcはDGCA 1.06です。 --dgcはDGCA 1.06です。
--LZMAは7zのデフォルト形式です。 --LZMAは7zのデフォルト形式です。
Line 62: Line 63:
//--bz2のブロックサイズから作業域の大きさを割り出す方法がわかりません。900KBを4倍すればいいのかな?...分かりました:100KB + (ブロックサイズ x 2.5) //--bz2のブロックサイズから作業域の大きさを割り出す方法がわかりません。900KBを4倍すればいいのかな?...分かりました:100KB + (ブロックサイズ x 2.5)
--dgcの展開作業域は不明ですが、おそらくブロックソート系なので、bz2と同程度はありそうな気がします。 --dgcの展開作業域は不明ですが、おそらくブロックソート系なので、bz2と同程度はありそうな気がします。
---PPMdは非常に得意不得意があるアルゴリズムで、ここでもその傾向がよく出ています(テキストに強いといわれている)。その能力を発揮させるには展開作業領域がたくさん必要になりますが、圧縮率を犠牲にすれば減らすこともできます。たとえばmake46でsar+tek5より若干劣る圧縮率にしてもいいのなら、26MBにできます。+--PPMdは非常に得意不得意があるアルゴリズムで、ここでもその傾向がよく出ています(テキストに強いといわれている)。その能力を発揮させるには展開作業領域がたくさん必要になりますが、圧縮率を犠牲にすれば減らすこともできます。たとえばmake46でsar+tek5より若干劣る圧縮率にしてもいいのなら、26MBに減らせます。
--個人的な見解ですが、どんな環境ででも展開できるべきだという観点から、PC向け以外にも配慮した汎用的で理想的な圧縮形式としては、作業領域は1MB未満、できれば64KB未満が好ましいと、[[K]]は考えております。 --個人的な見解ですが、どんな環境ででも展開できるべきだという観点から、PC向け以外にも配慮した汎用的で理想的な圧縮形式としては、作業領域は1MB未満、できれば64KB未満が好ましいと、[[K]]は考えております。
 +--yz2は圧縮・展開速度が速いことで有名な形式です。圧縮速度は本当に速いです。しかし展開速度はtek5よりも遅かったです(C版の展開ルーチンと比べてやっとおなじくらい)。
 +---参考:http://www.01-tec.com/yz2/c_maga_yz2.html
 +---展開作業領域は数MB以上だそうですが、詳細はわかりません。
* こめんと欄 * こめんと欄
#comment #comment
« Prev[4]  Next »[5]