読み込み中...アーカイブ(英:Archive)とは、コンピュータにおいて、複数のファイルを一つのファイルにまとめたファイル、もしくはそれを作成する過程を指す。実際の利用においてはアーカイブと同時にデータ圧縮も行われる場合が多いため、圧縮技術と混同されやすい。
アーカイブを行なうソフトウェアを総称してファイル・アーカイバ (file archiver)、または単にアーカイバと呼び、アーカイバで作成したファイルはアーカイブファイルと呼ぶ。また、アーカイブを書庫、アーカイブすることを「書庫化する」という場合もある。逆に元のファイルを取り出すことは抽出または展開という。
アーカイブファイルには、元のファイルを正しく復元するために、少なくとも元のファイル名やファイルサイズなどの情報が含まれなければならない。多くのアーカイバは、ファイルシステムがもつ、タイムスタンプや所有者・アクセス権などといった、ファイルに関するメタデータをも格納する。
データ圧縮と併用する際、アーカイブは圧縮に先立つ工程として行われることが多いが、これは単一のファイルを個別に符号化するよりも、関連したファイルを一つのファイルと見なして符号化を行うことで、データ圧縮の効率を高めることができるためである。これをソリッド圧縮という。
しかしながら、圧縮したファイルを展開する際に、関連ファイルの全体を展開する必要が生じるため、ZIPのようにファイルを圧縮した後にアーカイブするフォーマットや、データ圧縮時に決まったサイズのブロックに分けて符号化することで、目的のファイル周辺のみを解凍して取得することができるフォーマットが多い。アーカイブファイルが圧縮効率と展開に際しての利便性はトレードオフの関係にあるため、データ圧縮規格が乱立する要因ともなっている。
データ圧縮規格の成熟にともなってデータ圧縮機能とアーカイブ機能を統合して同時に処理できるソフトウェアが増えてきたため、そういった統合型のソフトウェアのことをアーカイバと呼ぶことが多くなったが、用語本来の意味に従えばデータ圧縮は必須の機能ではない。アーカイブのサイズが大きくても構わない場合には敢えて圧縮せずに書庫化のみを行うことで処理速度が向上する場合もある。(ストレージが低速の場合は圧縮により転送データ量を減らした方が速い場合もある。)
読み込み中...