1: 2004-10-19 (火) 16:54:54 |
2: 2004-10-19 (火) 22:11:10 |
| --このページは、OSASKなどをsar形式で公開するときに「sar形式についてはこちら」でリンクされる予定のページです(OSASK ver.4.7からはOSASKの一般公開版は、sarとlzhの両方で公開されます)。 | | --このページは、OSASKなどをsar形式で公開するときに「sar形式についてはこちら」でリンクされる予定のページです(OSASK ver.4.7からはOSASKの一般公開版は、sarとlzhの両方で公開されます)。 |
| --このページは肝心のsartol0hができてから書くべきなのですが、思いついた文面をどこかに書いておかないと忘れてしまいそうなので、ややフライングして書いています(sartol0hはtek5にも対応したsartolです)。 | | --このページは肝心のsartol0hができてから書くべきなのですが、思いついた文面をどこかに書いておかないと忘れてしまいそうなので、ややフライングして書いています(sartol0hはtek5にも対応したsartolです)。 |
- | --このメッセージは、OSASK ver.4.7の公開と同時にコメントアウトします。 | + | --この註は、OSASK ver.4.7の公開と同時にコメントアウトします。 |
| | | |
| -sar形式は、lzhやzipやtar.gzなどのような、書庫形式の一つです。 | | -sar形式は、lzhやzipやtar.gzなどのような、書庫形式の一つです。 |
| -しかし同じくらいの圧縮率なのに展開が他のものよりも速い形式というのがあります。そういう形式こそ、真に価値ある形式だと[[K]]は考えます。もちろん展開速度というものは展開プログラムをうまく作るかどうかで大きく左右されるものですが、どんなにうまく作っても圧縮形式(圧縮アルゴリズム)による限界があるのです。その限界速度が速い形式こそ、圧縮形式としては良い形式ではないでしょうか。 | | -しかし同じくらいの圧縮率なのに展開が他のものよりも速い形式というのがあります。そういう形式こそ、真に価値ある形式だと[[K]]は考えます。もちろん展開速度というものは展開プログラムをうまく作るかどうかで大きく左右されるものですが、どんなにうまく作っても圧縮形式(圧縮アルゴリズム)による限界があるのです。その限界速度が速い形式こそ、圧縮形式としては良い形式ではないでしょうか。 |
| -もちろん、多少のエラーを自動的に修復できることや、暗号化機能を持ったもの、アーカイブファイル分割機能の有無、OSでの標準サポート、それよりなにより使いやすいツール群が揃っていることなどこそ、使いやすいアーカイブ形式に求められる条件だという観点もあります。それはそのとおりです。エラー修復や暗号化や分割機能は、sar形式でも当初より対応を検討していて、かつそのための拡張に速やかに対応できるように準備をしてあります。OSでのサポートやツールの充実は、ユーザが増えれば自然に充実していくことでしょう。 | | -もちろん、多少のエラーを自動的に修復できることや、暗号化機能を持ったもの、アーカイブファイル分割機能の有無、OSでの標準サポート、それよりなにより使いやすいツール群が揃っていることなどこそ、使いやすいアーカイブ形式に求められる条件だという観点もあります。それはそのとおりです。エラー修復や暗号化や分割機能は、sar形式でも当初より対応を検討していて、かつそのための拡張に速やかに対応できるように準備をしてあります。OSでのサポートやツールの充実は、ユーザが増えれば自然に充実していくことでしょう。 |
- | -現在では実に多くのアーカイブ形式が開発されています。しかし圧縮率の割には展開速度が遅いような、そんな形式でCD-RやDVDにバックアップとして残していくべきでしょうか。今までのぶんはしょうがないと思いますが、これからはもっと積極的にどの形式が良いかを考えて、もし使いにくいという問題があれば、使いやすくなるようにツールを充実させていくべきだと[[K]]は思います。 | + | -現在では実に多くのアーカイブ形式が開発されています。しかし圧縮率の割には展開速度が遅いような、そんな形式でCD-RやDVDにバックアップとして残していくべきでしょうか。今までのぶんはしょうがないと思いますが、これからはもっと積極的にどの形式が良いかを考えて、もし使いにくいという問題があれば、使いやすくなるようにツールを充実させていくべきだと[[K]]は思います。その意思の反映として、sar形式での配布を行っているというわけです。 |
| -「これからはコンピュータはもっともっと速くなる、メモリだってジャブジャブつかっていい、だからとにかく圧縮率にこそこだわるべきだ」という人には、PAQARがおすすめです。でも[[K]]はその意見には賛成ではないので、PAQ形式での配布は予定していません。 | | -「これからはコンピュータはもっともっと速くなる、メモリだってジャブジャブつかっていい、だからとにかく圧縮率にこそこだわるべきだ」という人には、PAQARがおすすめです。でも[[K]]はその意見には賛成ではないので、PAQ形式での配布は予定していません。 |
- | --(PAQARのダウンロードURL) | + | --PAQARのダウンロード:http://cs.fit.edu/~mmahoney/compression/ |
| -「これからはハードディスクがもっと大容量化して、光ディスクもどんどん大容量化して、ネットワークだって途方もなく速くなるはずだから、圧縮なんて不要だ」という人は、是非無圧縮で暮らしてください。でも[[K]]はこの意見にも賛成ではないので、無圧縮形式での配布は予定していません。配布されているsarアーカイブを展開して保存したのちに、アーカイブを捨てればいいと思います。 | | -「これからはハードディスクがもっと大容量化して、光ディスクもどんどん大容量化して、ネットワークだって途方もなく速くなるはずだから、圧縮なんて不要だ」という人は、是非無圧縮で暮らしてください。でも[[K]]はこの意見にも賛成ではないので、無圧縮形式での配布は予定していません。配布されているsarアーカイブを展開して保存したのちに、アーカイブを捨てればいいと思います。 |
| | | |
| *** ベンチマーク | | *** ベンチマーク |
- | -いくつかのアーカイブ形式について、圧縮率の例を示します。 | + | -いくつかのアーカイブ形式について、圧縮能力の例を示します。 |
- | | |sar|lzh|zip|tar.gz|tar.bz2|7z|dgc|paq| | + | | |lzh|zip|tar.gz|tar.bz2|dgc|7z|''sar''|paq| |
- | |osat45i| | | | | | | | | | + | |osat45i|RIGHT:532093|RIGHT:524182|RIGHT:522146|RIGHT:546988|RIGHT:529568|RIGHT:503290|RIGHT:''498125''|RIGHT:465714| |
- | |osat46i| | | | | | | | | | + | |sartol0g|RIGHT:46686|RIGHT:46172|RIGHT:44175|RIGHT:43202|RIGHT:41648|RIGHT:39861|RIGHT:''39017''|RIGHT:32802| |
- | |osat47i| | | | | | | | | | + | |
| --単位はバイトです。 | | --単位はバイトです。 |
| + | -以下は上記の結果について、paqの結果を100として相対指標化したものです。こちらのほうが比較がしやすいです。 |
| + | | |lzh|zip|tar.gz|tar.bz2|dgc|7z|''sar''|paq| |
| + | |osat45i|114.3|112.6|112.1|117.5|113.7|108.1|''107.0''|100.0| |
| + | |sartol0g|142.3|140.8|134.7|131.7|127.0|121.5|''118.9''|100.0| |
| --sar形式ではtek5圧縮を使っています。 | | --sar形式ではtek5圧縮を使っています。 |
- | --lzhはLH5形式です。 | + | --lzhはlh7形式です。 |
| + | --dgcはDGCA 1.06です。 |
| --7zはLZMA形式を使っています。 | | --7zはLZMA形式を使っています。 |
| + | --paqはPAQAR v1.3でオプション-5を使っています(今はもっとバージョンが進んでいるようです)。 |
| --PAQAR以外は展開が速すぎて時間を測れませんでした。 | | --PAQAR以外は展開が速すぎて時間を測れませんでした。 |
| + | --ブロックソート系(bz2やdgc)は圧縮対象によって得手不得手がかなりあるのですが、どうやらこの圧縮対象は不得手のようです。 |
| | | |
| * こめんと欄 | | * こめんと欄 |
| #comment | | #comment |