ZIP 파일 추출

무제한작업. 파일 크기는 최대 2.5GB. 항상 무료입니다.

비공개 및 보안

모든 것이 브라우저에서 발생합니다. 파일은 서버에 닿지 않습니다.

엄청나게 빠른

업로드도, 기다림도 없습니다. 파일을 놓는 순간 변환하세요.

정말로 무료

계정이 필요 없습니다. 숨겨진 비용이 없습니다. 파일 크기 트릭이 없습니다.

ZIP 형식이란 무엇인가요?

집 아카이브

XAR(eXtensible ARchive)는 macOS에서 소프트웨어를 번들링하고 배포하기 위해 Apple Inc.에서 개발한 파일 형식입니다. 향상된 보안, 더 작은 파일 크기, 더 나은 성능과 같은 여러 가지 이점을 제공하는 .pkg 및 .dmg와 같은 이전 형식을 대체합니다. XAR 파일은 .xar 파일 확장자를 사용하며 macOS에 포함된 xar 명령줄 유틸리티를 사용하여 생성하고 추출할 수 있습니다.

XAR 형식은 XML(eXtensible Markup Language) 표준을 기반으로 합니다. XAR 아카이브는 세 가지 주요 구성 요소로 구성됩니다. 아카이브의 내용을 설명하는 XML 형식의 목차(TOC), 아카이브에 저장된 실제 파일 및 디렉토리, 보안을 위한 디지털 서명입니다. TOC는 아카이브의 각 파일에 대한 경로, 크기 및 기타 메타데이터를 지정하는 인덱스 역할을 합니다. 이 XML 기반 구조는 Apple이나 타사가 새로운 기능을 지원하기 위해 사용자 지정 태그를 추가할 수 있으므로 확장성을 제공합니다.

XAR 형식의 핵심적인 측면 중 하나는 압축을 사용한다는 것입니다. 기본적으로 XAR은 zlib 압축을 사용하여 아카이브된 파일의 크기를 줄입니다. TOC 자체도 압축됩니다. 이를 통해 파일을 압축되지 않은 상태로 저장하는 .pkg와 같은 이전 형식에 비해 더 작은 아카이브 크기를 얻을 수 있습니다. 그러나 XAR은 원하는 경우 파일을 압축되지 않은 상태로 저장하는 것도 지원합니다. 각 파일에 적용되는 압축은 TOC에서 개별적으로 지정할 수 있습니다.

XAR 아카이브의 무결성과 진위성을 보장하기 위해 이 형식은 디지털 서명을 통합합니다. 각 XAR 파일에는 전체 TOC를 포함하는 하나 이상의 서명이 포함됩니다. 이러한 서명은 일반적으로 RSA 또는 DSA 알고리즘을 사용하여 공개 키 암호화를 사용하여 생성됩니다. 서명을 통해 수신자는 아카이브가 변조되지 않았고 신뢰할 수 있는 출처에서 생성되었음을 확인할 수 있습니다. Apple은 Mac App Store에서 소프트웨어 업데이트와 애플리케이션을 배포하는 데 XAR 서명을 사용합니다.

XAR 아카이브를 열면 먼저 TOC가 압축 해제되고 구문 분석됩니다. TOC는 Unix 시스템에서 사용되는 'tar' 형식과 유사한 디렉토리 구조와 파일 메타데이터를 제공합니다. 실제 파일 데이터는 아카이브의 TOC 다음에 저장됩니다. 각 파일의 데이터는 TOC의 해당 항목에 표시된 대로 압축되거나 압축되지 않을 수 있습니다. 파일을 추출하려면 TOC의 오프셋 및 크기 정보를 사용하여 데이터를 찾습니다.

XAR 형식은 기본 아카이빙 외에도 여러 가지 고급 기능을 지원합니다. 그러한 기능 중 하나는 단일 아카이브에 여러 TOC를 포함할 수 있는 기능입니다. 이를 통해 변경된 파일만 업데이트 아카이브에 포함하면 되는 증분 업데이트를 생성할 수 있습니다. 여러 TOC는 소프트웨어의 여러 버전에 걸친 아카이브 상태를 설명할 수 있습니다. 스마트 업데이트 메커니즘은 이 정보를 사용하여 증분 패치를 효율적으로 적용할 수 있습니다.

또한 XAR 아카이브는 아카이브된 파일에 연결된 확장 속성과 액세스 제어 목록(ACL)을 저장할 수 있습니다. 확장 속성은 앱별 메타데이터를 저장할 수 있는 키-값 쌍입니다. ACL은 파일에 액세스하기 위한 세분화된 권한을 정의합니다. XAR은 아카이브에 이 정보를 보존함으로써 추출 시 대상 시스템에서 원래 파일 속성이 복원되도록 합니다.

XAR 형식에는 코드 서명에 대한 조항도 포함됩니다. TOC를 포함하는 아카이브 수준 서명 외에도 아카이브 내의 개별 파일은 자체 서명을 가질 수 있습니다. 이는 독립적으로 확인되어야 하는 소프트웨어 구성 요소를 배포하는 데 유용합니다. 예를 들어, 플러그인 아키텍처는 코드 서명을 사용하여 신뢰할 수 있는 플러그인만 애플리케이션에 의해 로드되도록 할 수 있습니다.

XAR의 또 다른 기능은 하드 링크를 저장할 수 있는 기능입니다. 하드 링크를 사용하면 여러 디렉토리 항목이 디스크에서 동일한 파일 데이터를 참조할 수 있습니다. XAR TOC에서 하드 링크는 원래 파일 항목을 가리키는 특수 XML 요소를 사용하여 표현됩니다. 아카이브가 추출되면 하드 링크가 다시 생성되어 디스크 공간을 절약하고 원래 디렉토리 구조를 유지합니다.

개발자는 xar 명령줄 도구나 libxar와 같은 라이브러리를 사용하여 XAR 아카이브를 프로그래밍 방식으로 작업할 수 있습니다. xar 도구는 XAR 아카이브를 생성, 추출, 조작하기 위한 명령을 제공합니다. 압축, 서명, 확인을 위한 다양한 옵션을 지원합니다. Libxar는 XAR 형식을 구현하고 XAR 아카이브를 읽고 쓰기 위한 API를 제공하는 C 라이브러리입니다. 개발자는 Libxar를 사용하여 자체 애플리케이션에 XAR 지원을 통합할 수 있습니다.

요약하자면, XAR 형식은 macOS에서 소프트웨어 패키징 및 배포에 대한 현대적이고 확장 가능한 접근 방식을 제공합니다. 목차에 XML을 사용하고, 더 작은 파일 크기를 위한 압축, 보안을 위한 디지털 서명, 증분 업데이트 및 코드 서명과 같은 고급 기능을 지원하여 개발자와 시스템 관리자에게 강력한 도구가 됩니다. Apple이 이 형식을 지속적으로 개선하고 홍보함에 따라 XAR은 macOS에서 소프트웨어 배포의 표준이 될 가능성이 높습니다.

파일 압축은 동일한 정보가 더 적은 비트를 차지하도록 중복성을 줄입니다. 얼마나 멀리 갈 수 있는지에 대한 상한선은 정보 이론에 의해 결정됩니다. 무손실 압축의 경우, 한계는 소스의 엔트로피입니다(섀넌의 소스 코딩 정리 와 그의 1948년 원본 논문 “통신의 수학적 이론”참조). 손실 압축의 경우, 속도와 품질 간의 절충은 속도-왜곡 이론에 의해 포착됩니다.

두 기둥: 모델링과 코딩

대부분의 압축기에는 두 단계가 있습니다. 첫째, 모델이 데이터의 구조를 예측하거나 노출합니다. 둘째, 코더가 이러한 예측을 거의 최적의 비트 패턴으로 변환합니다. 고전적인 모델링 계열은 렘펠-지브입니다. LZ77 (1977) 과 LZ78 (1978)은 반복되는 하위 문자열을 감지하고 원시 바이트 대신 참조를 내보냅니다. 코딩 측면에서는 허프만 코딩 (원본 논문 1952참조)이 더 가능성 있는 기호에 더 짧은 코드를 할당합니다. 산술 코딩 범위 코딩 은 엔트로피 한계에 더 가깝게 압축하는 더 세분화된 대안이며, 현대적인 비대칭 숫자 체계(ANS) 는 빠른 테이블 기반 구현으로 유사한 압축을 달성합니다.

일반적인 형식은 실제로 무엇을 하는가

DEFLATE(gzip, zlib, ZIP에서 사용)는 LZ77과 허프만 코딩을 결합합니다. 사양은 공개되어 있습니다. DEFLATE RFC 1951, zlib 래퍼 RFC 1950, gzip 파일 형식 RFC 1952. Gzip은 스트리밍을 위해 구성되었으며 명시적으로 임의 접근을 시도하지 않습니다. PNG 이미지는 PNG 사양에 따라 DEFLATE를 유일한 압축 방법으로 표준화합니다(최대 32KiB 창). “압축 방법 0… deflate/inflate… 최대 32768바이트” W3C/ISO PNG 제2판.

Zstandard (zstd): 매우 빠른 압축 해제와 높은 비율을 위해 설계된 최신 범용 압축기입니다. 형식은 RFC 8878 (또한 HTML 미러) 및 참조 사양 GitHub에 문서화되어 있습니다. gzip과 마찬가지로 기본 프레임은 임의 접근을 목표로 하지 않습니다. zstd의 초능력 중 하나는 사전입니다. 코퍼스에서 가져온 작은 샘플로, 작거나 유사한 많은 파일에서 압축을 극적으로 향상시킵니다( python-zstandard 사전 문서 Nigel Tao의 작업 예제참조). 구현은 “비정형” 및 “정형” 사전을 모두 허용합니다 (토론).

Brotli: 웹 콘텐츠(예: WOFF2 글꼴, HTTP)에 최적화되어 있습니다. 정적 사전과 DEFLATE와 유사한 LZ+엔트로피 코어를 혼합합니다. 사양은 RFC 7932이며, WBITS가 [10, 24]인 2WBITS−16의 슬라이딩 윈도우(1KiB−16B ~ 16MiB−16B)와 임의 접근을 시도하지 않음을 명시합니다. Brotli는 웹 텍스트에서 gzip을 자주 능가하며 빠르게 디코딩됩니다.

ZIP 컨테이너: ZIP은 다양한 압축 방법 (deflate, store, zstd 등)으로 항목을 저장할 수 있는 파일 아카이브입니다. 사실상의 표준은 PKWARE의 APPNOTE입니다( APPNOTE 포털, 호스팅된 사본, LC 개요 ZIP 파일 형식(PKWARE) / ZIP 6.3.3참조).

속도 대 비율: 형식이 어디에 위치하는지

LZ4는 적당한 비율로 원시 속도를 목표로 합니다. 프로젝트 페이지 (「매우 빠른 압축」)와 프레임 형식을 참조하십시오. 압축 해제가 RAM 속도에 가까워야 하는 인메모리 캐시, 원격 측정 또는 핫 경로에 이상적입니다.

XZ / LZMA는 비교적 느린 압축으로 밀도(훌륭한 비율)를 추구합니다. XZ는 컨테이너입니다. 무거운 작업은 일반적으로 LZMA/LZMA2(LZ77과 유사한 모델링 + 범위 코딩)에 의해 수행됩니다. .xz 파일 형식, LZMA 사양(Pavlov), 리눅스 커널 노트 XZ 임베디드를 참조하십시오. XZ는 일반적으로 gzip보다 압축률이 높으며 종종 높은 비율의 최신 코덱과 경쟁하지만 인코딩 시간이 더 깁니다.

bzip2 버로우즈-휠러 변환(BWT), move-to-front, RLE 및 허프만 코딩을 적용합니다. 일반적으로 gzip보다 작지만 느립니다. 공식 설명서 와 man 페이지 (리눅스)를 참조하십시오.

창, 블록 및 임의 접근

“창 크기”가 중요합니다. DEFLATE 참조는 32KiB만 되돌아볼 수 있습니다 (RFC 1951 및 PNG의 32KiB 상한 여기에 명시됨). Brotli의 창은 약 1KiB에서 16MiB까지 다양합니다 (RFC 7932). Zstd는 레벨별로 창과 검색 깊이를 조정합니다 (RFC 8878). 기본 gzip/zstd/brotli 스트림은 순차적 디코딩을 위해 설계되었습니다. 기본 형식은 임의 접근을 약속하지 않습니다. 하지만 컨테이너(예: tar 인덱스, 청크 프레이밍 또는 형식별 인덱스)를 통해 계층화할 수 있습니다.

무손실 대 손실

위의 형식은 무손실입니다. 정확한 바이트를 재구성할 수 있습니다. 미디어 코덱은 종종 손실입니다. 더 낮은 비트 전송률을 달성하기 위해 감지할 수 없는 세부 정보를 버립니다. 이미지에서 클래식 JPEG(DCT, 양자화, 엔트로피 코딩)는 ITU-T T.81 / ISO/IEC 10918-1에 표준화되어 있습니다. 오디오에서 MP3(MPEG-1 Layer III) 및 AAC(MPEG-2/4)는 지각 모델 및 MDCT 변환에 의존합니다( ISO/IEC 11172-3, ISO/IEC 13818-7, MDCT 개요 여기참조). 손실 및 무손실은 공존할 수 있습니다(예: UI 자산용 PNG, 이미지/비디오/오디오용 웹 코덱).

실용적인 팁

  • 작업에 맞게 선택하십시오. 웹 텍스트 및 글꼴: brotli. 일반 파일 및 백업: zstd (훌륭한 압축 해제 속도와 시간 대 비율을 교환할 수 있는 수준). 초고속 파이프 및 원격 측정: lz4. 인코딩 시간이 괜찮은 장기 아카이브의 최대 밀도: xz/LZMA.
  • 작은 파일? zstd (문서) / (예)로 사전을 훈련하고 배포하십시오. 수십 개의 작고 유사한 개체를 극적으로 줄일 수 있습니다.
  • 상호 운용성. 여러 파일을 교환할 때는 컨테이너(ZIP, tar)와 압축기를 사용하는 것이 좋습니다. ZIP의 APPNOTE는 메서드 ID와 기능을 정의합니다. PKWARE APPNOTE 및 LC 개요 여기를 참조하십시오.
  • 데이터로 측정하십시오. 비율과 속도는 코퍼스에 따라 다릅니다. 많은 리포지토리에서 벤치마크를 게시합니다(예: LZ4의 README는 실레지아 코퍼스를 여기에서 인용합니다). 하지만 항상 로컬에서 확인하십시오.

주요 참고 자료(심층 분석)

이론: 섀넌 1948 · 속도-왜곡 · 코딩: 허프만 1952 · 산술 코딩 · 범위 코딩 · ANS. 형식: DEFLATE · zlib · gzip · Zstandard · Brotli · LZ4 프레임 · XZ 형식. BWT 스택: 버로우즈-휠러(1994) · bzip2 설명서. 미디어: JPEG T.81 · MP3 ISO/IEC 11172-3 · AAC ISO/IEC 13818-7 · MDCT.

결론: 데이터와 제약 조건에 맞는 압축기를 선택하고, 실제 입력으로 측정하고, 사전과 스마트 프레이밍의 이점을 잊지 마십시오. 올바른 조합으로 정확성이나 이식성을 희생하지 않고 더 작은 파일, 더 빠른 전송, 더 빠른 앱을 얻을 수 있습니다.

자주 묻는 질문

파일 압축이란 무엇입니까?

파일 압축은 파일 또는 파일들의 크기를 줄이는 과정으로, 일반적으로 저장 공간을 절약하거나 네트워크를 통한 전송을 가속화하기 위해 사용됩니다.

파일 압축은 어떻게 작동합니까?

파일 압축은 데이터의 중복성을 식별하고 제거함으로써 작동합니다. 원래의 데이터를 더 작은 공간에 인코딩하기 위해 알고리즘을 사용합니다.

파일 압축의 다른 유형은 무엇입니까?

파일 압축의 두 가지 주요 유형은 손실 없는 압축과 손실 압축입니다. 손실 없는 압축은 원래 파일을 완벽하게 복원할 수 있게 하는 반면, 손실 압축은 데이터 품질의 일부 손실을 감수하면서 더 큰 크기 축소를 가능하게 합니다.

파일 압축 도구의 예는 무엇입니까?

파일 압축 도구의 인기 있는 예는 ZIP과 RAR 같은 다양한 압축 형식을 지원하는 WinZip입니다.

파일 압축이 파일의 품질에 영향을 미칩니까?

손실 없는 압축에서는 품질이 변하지 않습니다. 그러나 손실 압축에서는 파일 크기를 더욱 크게 줄이기 위해 중요하지 않은 데이터를 제거하기 때문에 품질 저하가 눈에 띄게 될 수 있습니다.

파일 압축이 안전합니까?

네, 특히 손실 없는 압축에서는 데이터 무결성 측면에서 파일 압축이 안전합니다. 그러나 모든 파일과 마찬가지로, 압축된 파일도 멀웨어나 바이러스의 대상이 될 수 있으므로, 항상 신뢰할 수 있는 보안 소프트웨어를 갖추는 것이 중요합니다.

어떤 종류의 파일이 압축 가능합니까?

거의 모든 종류의 파일들은 압축이 가능하며, 이에는 텍스트 파일, 이미지, 오디오, 비디오, 소프트웨어 파일이 포함됩니다. 그러나, 압축 가능한 수준은 파일 유형에 따라 크게 달라질 수 있습니다.

ZIP 파일이라는 것은 무엇을 의미합니까?

ZIP 파일은 파일의 크기를 줄이는 데 손실 없는 압축을 사용하는 파일 형식의 일종입니다. ZIP 파일 안에는 여러 파일이 효과적으로 한 개의 파일로 묶여 있어 공유가 더욱 쉽습니다.

이미 압축된 파일을 다시 압축할 수 있습니까?

기술적으로는 가능합니다, 그러나 추가적인 크기 줄임은 최소한이거나 심지어 역효과일 수 있습니다. 이미 압축된 파일을 다시 압축하려고 하면, 압축 알고리즘이 추가하는 메타데이터 때문에 파일의 크기가 증가하기도 합니다.

파일을 어떻게 압축 해제합니까?

파일을 압축 해제하려면 일반적으로 압축 해제 또는 압축 풀기 도구, 예를 들면 WinZip이나 7-Zip 같은 도구가 필요합니다. 이러한 도구들은 원래의 파일을 압축된 형식에서 추출할 수 있습니다.