contents
- Linuxで圧縮率検証
- gzipの圧縮率 ⇦今ここ
- zipの圧縮率
- bzip2の圧縮率
- 圧縮率まとめ
早速gzipコマンドを使って検証していきましょう。
使用するオプションは
-number(1〜9)
-v
の2つを使っていきます。
-number
-v
このオプションは圧縮レベルで1〜9になります。
圧縮レベルが高ければ高いほど、圧縮率が高くなる分、圧縮までにかかる時間が多くなります。
例:gzip -6 ファイル名
圧縮結果を表示します。
今回の検証結果をこのオプションで表示します。
例:gzip -v ファイル名
圧縮の時間も測っていくため、date
を組み合わせます。
date; gzip -1 -v ファイル名; date
別の画面からdstat -tam
を実行しておき、リソースが落ち着いた頃を見計らって、コマンドを実行します。
さて、実施した結果は、
ll
-rw-rw-r– 1 sooota sooota 118905404 2月 3 22:16 compress_test-2.txt.gz
-rw-rw-r– 1 sooota sooota 113818251 2月 3 22:16 compress_test-3.txt.gz
-rw-rw-r– 1 sooota sooota 23586514 2月 3 22:16 compress_test-4.txt.gz
-rw-rw-r– 1 sooota sooota 17763198 2月 3 22:16 compress_test-5.txt.gz
-rw-rw-r– 1 sooota sooota 10029486 2月 3 22:16 compress_test-6.txt.gz
-rw-rw-r– 1 sooota sooota 9967614 2月 3 22:16 compress_test-7.txt.gz
-rw-rw-r– 1 sooota sooota 9571860 2月 3 22:16 compress_test-8.txt.gz
-rw-rw-r– 1 sooota sooota 9571860 2月 3 22:16 compress_test-9.txt.gz
-rw-rw-r– 1 sooota sooota 1402715611 2月 3 22:16 compress_test.txt
ちょっとわかりづらいので、表にしてみました。
圧縮レベル | 圧縮サイズ | 圧縮率 | 時間(s) | CPU使用率(平均) |
---|---|---|---|---|
なし(圧縮前) | 1402715611 | - | - | - |
1 | 126038484 | 91.0% | 18s | 30.3% |
2 | 118905404 | 91.5% | 15s | 34.4% |
3 | 113818251 | 91.9% | 15s | 35.8% |
4 | 23586514 | 98.3% | 10s | 40.8% |
5 | 17763198 | 98.7% | 11s | 40.5% |
6 | 10029486 | 99.3% | 11s | 40.4% |
7 | 9967614 | 99.3% | 12s | 39.1% |
8 | 9571860 | 99.3% | 11s | 43.6% |
9 | 9571860 | 99.3% | 11s | 40.8% |
結果から見て見ると、圧縮レベルによっての時間はさほど変わらないです。
私の予想では時間が大幅に変わると思ったのですが、予想を覆されました。
これは、もしかしたら、サーバのディスクがSSDなので、今までサーバのデメリットであったUser I/Oの部分が、SSDによって改善されたのかもしれません。
圧縮率から見ると、レベル6以降あまり変わらない結果となりました。
リソースの消費量から見ると、
以上の観点から圧縮レベルは6以上を設定するのが一番効率良いと言えそうです。
ちなみに圧縮レベルを指定しないとデフォルトの設定は6となるようです。(圧縮率がレベル6以降さほど変わらないため、デフォルトが最適な6の設定になっているのかもしれませんね。)
gzip -v compress_test.txt
ll compress_test.txt.gz
※圧縮レベル6と同じ圧縮サイズになっています。
ここからはdstatの生ログになります。(テキスト表示だと見づらいので、画像での表示にしてます。)
圧縮レベル1のdstat結果
圧縮レベル2のdstat結果
圧縮レベル3のdstat結果
圧縮レベル4のdstat結果
圧縮レベル5のdstat結果
圧縮レベル6のdstat結果
圧縮レベル7のdstat結果
圧縮レベル8のdstat結果
圧縮レベル9のdstat結果
次回はzipの圧縮率になります。
新着情報
ブログランキングに参加しています。クリックして応援していただけると嬉しいです。
人気ブログランキング
にほんブログ村