PKZ 아카이브 형식은 PKWARE, Inc.에서 개발한 독점 압축 아카이브 형식으로 파일과 디렉토리를 패키징하고 압축하는 데 사용됩니다. 일반적으로 Microsoft Windows 시스템에서 사용되지만 다른 플랫폼에서도 사용할 수 있습니다. 이 형식은 DEFLATE 압축과 다양한 사전 처리 필터를 조합하여 속도와 메모리 사용량의 균형을 맞추면서 높은 압축률을 달성합니다.
PKZ 아카이브는 각 파일에 대한 일련의 '로컬 파일 헤더', 선택적 아카이브 암호 해독/암호화 헤더, 압축된 파일 데이터 블록, 중앙 디렉토리 구조, 중앙 디렉토리 레코드 끝으로 구성됩니다. 이를 통해 개별 압축 파일, 선택적 암호화, 데이터 무결성 검사에 빠르게 액세스할 수 있으며, 아카이브된 파일의 메타데이터를 저장할 수 있습니다.
각 로컬 파일 헤더에는 파일 이름, 크기, 타임스탬프, CRC-32 체크섬, 사용된 압축 방법과 같은 파일 정보가 포함됩니다. 헤더는 또한 암호화, 사전 처리 필터, 패칭, 여러 아카이브에 걸친 데이터 분할과 같은 파일에 적용된 선택적 기능을 지정합니다. 로컬 헤더 뒤에는 압축되거나 저장된 파일 데이터가 있습니다.
PKZ는 여러 압축 방법을 지원하며, 가장 일반적인 방법은 DEFLATE입니다. DEFLATE는 LZ77 압축과 허프만 코딩을 결합한 무손실 데이터 압축 알고리즘입니다. PKZIP은 원하는 경우 압축하지 않고 파일을 저장할 수도 있습니다. 드물게 LZMA 또는 Bzip2와 같은 다른 레거시 압축 방법이 사용될 수 있습니다.
DEFLATE로 파일을 압축하기 전에 다양한 사전 처리 필터를 적용하여 압축을 개선할 수 있습니다. 여기에는 심볼 크기 줄이기, 바이트 스와핑하여 중복성 증가, 실행 파일용 BCJ 필터, 증분 업데이트 또는 패칭용 델타 필터와 같은 방법이 포함됩니다. 필터는 데이터가 DEFLATE 압축기에 전달되기 전에 압축 프로세스의 일부로 적용됩니다.
데이터 무결성 검증을 위해 각 파일은 로컬 헤더에 압축되지 않은 데이터의 CRC-32 체크섬을 기록합니다. 동일한 체크섬이 파일의 중앙 디렉토리 항목에 기록됩니다. 이를 통해 파일이 데이터 손상 없이 올바르게 압축되고 압축 해제되었는지 확인할 수 있습니다.
PKZ 아카이브는 선택적으로 대칭 암호화를 사용하여 파일 데이터와 헤더를 암호화할 수 있습니다. 이전 버전에서는 ZipCrypto를 사용했지만 최신 버전에서는 AES 암호화를 사용합니다. 암호화할 때 선택한 암호화 방법이 아카이브에 기록되고 각 파일은 자체 암호를 지정할 수 있습니다. 인증된 암호화는 암호화된 데이터의 변조 또는 손상을 감지하는 데 사용됩니다.
중앙 디렉토리는 압축된 파일 데이터 뒤에 나오며 아카이브의 목차 역할을 합니다. 메타데이터, 로컬 헤더 오프셋, 파일 압축 해제에 필요한 기타 정보가 있는 각 파일에 대한 파일 헤더 항목이 포함되어 있습니다. 항목은 파일 이름으로 정렬됩니다. 선택적 디지털 서명을 중앙 디렉토리에 적용하여 변조로부터 추가로 보호할 수 있습니다.
마지막으로, 중앙 디렉토리 레코드 끝은 아카이브 파일의 끝을 표시합니다. 중앙 디렉토리의 항목 수, 크기 및 오프셋, 주석 필드를 저장합니다. 여러 파일에 분할된 아카이브의 경우 다른 아카이브 파일을 찾는 방법에 대한 정보도 포함됩니다.
PKZ 형식을 사용하면 아카이브 전체를 압축 해제할 필요 없이 아카이브 내의 개별 파일에 효율적으로 임의로 액세스할 수 있습니다. 이는 중앙 디렉토리를 읽고, 원하는 파일 항목을 찾은 다음, 오프셋에서 특정 로컬 파일 블록을 읽고 압축 해제하여 수행됩니다. 여러 파일을 한 번에 열고 압축 해제할 수도 있습니다.
PKZ 아카이브를 만들려면 먼저 파일을 필터링하고 개별적으로 로컬 파일 블록으로 압축합니다. 중앙 디렉토리 항목은 로컬 헤더와 파일 메타데이터에서 생성됩니다. 그런 다음 필요한 경우 중앙 디렉토리에 디지털 서명이 생성됩니다. 마지막으로, 중앙 디렉토리를 가리키는 중앙 디렉토리 레코드 끝이 작성됩니다.
PKZ 아카이브를 추출하려면 먼저 중앙 디렉토리 레코드 끝을 읽어 중앙 디렉토리 항목을 찾습니다. 원하는 파일의 항목을 찾고 각 항목은 로컬 헤더를 읽고 지정된 오프셋에서 압축된 데이터를 읽어 압축 해제됩니다. 모든 암호화가 제거되고 사전 처리 필터가 역순으로 적용되어 원래 파일 콘텐츠를 얻습니다.
PKZ 형식의 다른 기능으로는 아카이브를 여러 파일, 볼륨 또는 세그먼트로 분할하는 것, 유니코드 파일 이름 지원, NTFS 파일 시스템 권한 및 속성, 통합 업데이트/패칭 기능, 디지털 서명, 해시 다이제스트, 애플리케이션별 데이터와 같은 확장 가능한 메타데이터 등이 있습니다.
전반적으로 PKZ 형식은 파일을 압축하고 패키징하는 데 사용할 수 있는 효율적이고 유연한 아카이브 형식입니다. 파일을 개별적으로 압축하고, 사전 처리 필터를 적용하고, 아카이브 전체를 처리하지 않고도 특정 파일을 빠르게 추출할 수 있는 기능으로 인해 소프트웨어 설치 프로그램, 펌웨어 업데이트, 문서 등을 패키징하는 데 적합합니다. 암호화, 데이터 무결성 검사, 디지털 서명을 지원하여 필요한 경우 높은 수준의 보안을 제공할 수도 있습니다.
파일 압축은 데이터 파일의 크기를 효율적으로 저장하거나 전송하기 위해 줄이는 과정입니다. 다양한 알고리즘을 사용하여 데이터의 중복을 식별하고 제거함으로써 데이터를 압축하며, 이로 인해 종종 원래의 정보를 잃지 않고 데이터의 크기를 상당히 줄일 수 있습니다.
파일 압축에는 크게 두 가지 유형이 있습니다: 손실 없는 압축과 손실성 압축. 손실 없는 압축은 압축된 데이터에서 원래의 데이터를 완벽하게 재구성할 수 있어, 텍스트나 데이터베이스 파일과 같이 모든 비트의 데이터가 중요한 파일에 이상적입니다. 일반적인 예로는 ZIP과 RAR 파일 형식이 있습니다. 반면, 손실성 압축은 덜 중요한 데이터를 제거하여 파일 크기를 더 크게 줄이며, 주로 오디오, 비디오, 이미지 파일에서 사용됩니다. JPEG와 MP3는 일부 데이터 손실이 콘텐츠의 인식 품질을 크게 저하시키지 않는 예입니다.
파일 압축은 여러 가지 방법으로 유익합니다. 장치와 서버의 저장 공간을 절약하고, 비용을 줄이며, 효율성을 향상시킵니다. 또한 네트워크를 통한 파일 전송 속도를 높혀주므로, 특히 큰 파일에 대해 매우 유 valuable 합니다. 또한, 압축된 파일은 하나의 아카이브 파일로 그룹화할 수 있어, 조직화와 다중 파일의 쉬운 이동을 돕습니다.
그러나, 파일 압축에는 몇 가지 단점이 있습니다. 압축 및 해제 과정이 컴퓨팅 자원을 요구하기 때문에, 특히 큰 파일의 경우 시스템 성능을 느리게 할 수 있습니다. 또한, 손실성 압축의 경우, 일부 원래의 데이터가 압축 과정에서 손실되며, 그 결과 품질은 모든 용도, 특히 고품질을 요구하는 전문적인 애플리케이션에 대해 적합하지 않을 수 있습니다.
파일 압축은 오늘날 디지털 세계에서 필수 도구입니다. 이는 효율성을 향상시키며, 저장 공간을 절약하고, 다운로드와 업로드 시간을 줄이지만, 시스템 성능과 품질 저하의 위험 면에서 자체적인 단점을 가지고 있습니다. 따라서, 특정 데이터 요구에 맞는 적절한 압축 기법을 선택하기 위해 이러한 요소들을 유념하는 것이 중요합니다.
파일 압축은 파일 또는 파일들의 크기를 줄이는 과정으로, 일반적으로 저장 공간을 절약하거나 네트워크를 통한 전송을 가속화하기 위해 사용됩니다.
파일 압축은 데이터의 중복성을 식별하고 제거함으로써 작동합니다. 원래의 데이터를 더 작은 공간에 인코딩하기 위해 알고리즘을 사용합니다.
파일 압축의 두 가지 주요 유형은 손실 없는 압축과 손실 압축입니다. 손실 없는 압축은 원래 파일을 완벽하게 복원할 수 있게 하는 반면, 손실 압축은 데이터 품질의 일부 손실을 감수하면서 더 큰 크기 축소를 가능하게 합니다.
파일 압축 도구의 인기 있는 예는 ZIP과 RAR 같은 다양한 압축 형식을 지원하는 WinZip입니다.
손실 없는 압축에서는 품질이 변하지 않습니다. 그러나 손실 압축에서는 파일 크기를 더욱 크게 줄이기 위해 중요하지 않은 데이터를 제거하기 때문에 품질 저하가 눈에 띄게 될 수 있습니다.
네, 특히 손실 없는 압축에서는 데이터 무결성 측면에서 파일 압축이 안전합니다. 그러나 모든 파일과 마찬가지로, 압축된 파일도 멀웨어나 바이러스의 대상이 될 수 있으므로, 항상 신뢰할 수 있는 보안 소프트웨어를 갖추는 것이 중요합니다.
거의 모든 종류의 파일들은 압축이 가능하며, 이에는 텍스트 파일, 이미지, 오디오, 비디오, 소프트웨어 파일이 포함됩니다. 그러나, 압축 가능한 수준은 파일 유형에 따라 크게 달라질 수 있습니다.
ZIP 파일은 파일의 크기를 줄이는 데 손실 없는 압축을 사용하는 파일 형식의 일종입니다. ZIP 파일 안에는 여러 파일이 효과적으로 한 개의 파일로 묶여 있어 공유가 더욱 쉽습니다.
기술적으로는 가능합니다, 그러나 추가적인 크기 줄임은 최소한이거나 심지어 역효과일 수 있습니다. 이미 압축된 파일을 다시 압축하려고 하면, 압축 알고리즘이 추가하는 메타데이터 때문에 파일의 크기가 증가하기도 합니다.
파일을 압축 해제하려면 일반적으로 압축 해제 또는 압축 풀기 도구, 예를 들면 WinZip이나 7-Zip 같은 도구가 필요합니다. 이러한 도구들은 원래의 파일을 압축된 형식에서 추출할 수 있습니다.