แยกไฟล์ TARXZ

ไม่จำกัด งาน. ขนาดไฟล์สูงสุด 2.5GB. เป็นของฟรี, ตลอดไป.

ส่วนตัวและปลอดภัย

ทุกอย่างเกิดขึ้นในเบราว์เซอร์ของคุณ ไฟล์ของคุณไม่เคยสัมผัสเซิร์ฟเวอร์ของเรา

เร็วสุดขีด

ไม่มีการอัปโหลด ไม่ต้องรอ แปลงทันทีที่คุณวางไฟล์

ฟรีจริงๆ

ไม่ต้องใช้บัญชี ไม่มีค่าใช้จ่ายแอบแฝง ไม่มีลูกเล่นขนาดไฟล์

รูปแบบ TARXZ คืออะไร?

TAR XZ

รูปแบบ Web ARChive (WARC) เป็นรูปแบบไฟล์มาตรฐานที่ใช้สำหรับการเก็บถาวรข้อมูลการรวบรวมข้อมูลเว็บ พัฒนาโดย International Internet Preservation Consortium (IIPC) เพื่อปรับปรุงรูปแบบ Internet Archive ARC ที่เก่ากว่า ไฟล์ WARC ประกอบด้วยลำดับบล็อกเนื้อหาที่เชื่อมต่อกัน โดยแต่ละบล็อกประกอบด้วยส่วนหัวข้อความธรรมดาและข้อมูลเนื้อหาไบนารี ทำให้เหมาะสำหรับการเก็บรักษาและการเข้าถึงทรัพยากรบนเว็บในระยะยาว

ไฟล์ WARC ออกแบบมาเพื่อจัดเก็บทั้งเนื้อหาเพย์โหลดและข้อมูลควบคุมจากโปรโตคอลเลเยอร์แอปพลิเคชันอินเทอร์เน็ตหลัก เช่น HTTP, DNS และ FTP ไฟล์ WARC แต่ละไฟล์เป็นที่เก็บถาวรที่แยกตัวออกมา ทำให้สามารถจัดเก็บทรัพยากรที่แยกจากกันหลายรายการในไฟล์เดียวได้ ซึ่งทำให้เป็นรูปแบบที่มีประสิทธิภาพและสะดวกสำหรับเว็บครอว์เลอร์ในการจัดเก็บและประมวลผลข้อมูลเว็บจำนวนมาก

ข้อกำหนดรูปแบบ WARC กำหนดประเภทของเรกคอร์ดหลายประเภท โดยแต่ละประเภทมีวัตถุประสงค์เฉพาะในการเก็บถาวร: - `warcinfo`: มีข้อมูลเมตาเกี่ยวกับไฟล์ WARC เอง เช่น ซอฟต์แวร์ที่ใช้สร้าง วันที่สร้าง และข้อมูลเพิ่มเติมใดๆ เกี่ยวกับการรวบรวมข้อมูล - `response`: จัดเก็บข้อความการตอบกลับ HTTP รวมถึงส่วนหัวและเนื้อหาตามที่เว็บเซิร์ฟเวอร์ส่งกลับ - `request`: จัดเก็บข้อความคำขอ HTTP ที่ส่งโดยครอว์เลอร์ไปยังเว็บเซิร์ฟเวอร์ - `metadata`: มีข้อมูลเพิ่มเติมเกี่ยวกับทรัพยากร เช่น ผลลัพธ์ของการสแกนไวรัสหรือข้อความที่ดึงมาจากหน้า HTML - `revisit`: ระบุว่าเนื้อหาของทรัพยากรยังไม่เปลี่ยนแปลงไปตั้งแต่การจับภาพครั้งก่อน ซึ่งช่วยให้สามารถจัดเก็บและเล่นซ้ำเว็บที่เก็บถาวรได้อย่างมีประสิทธิภาพมากขึ้น - `conversion`: จัดเก็บผลลัพธ์ของการแปลงทรัพยากรจากรูปแบบหนึ่งไปยังอีกรูปแบบหนึ่ง เช่น การแปลงหน้า HTML เป็นข้อความธรรมดา

แต่ละเรกคอร์ด WARC ประกอบด้วยส่วนหัวข้อความธรรมดาและบล็อกเนื้อหาไบนารี ส่วนหัวมีคู่ค่าคีย์ที่ให้ข้อมูลเมตาเกี่ยวกับเรกคอร์ด เช่น ประเภทเรกคอร์ด WARC, URI ของทรัพยากร, วันและเวลาที่จับภาพ และความยาวเนื้อหา บล็อกเนื้อหาไบนารีจัดเก็บข้อมูลจริงของทรัพยากร เช่น เนื้อหาตอบกลับ HTTP หรือเพย์โหลดของการถ่ายโอน FTP

ข้อได้เปรียบหลักประการหนึ่งของรูปแบบ WARC คือความสามารถในการจัดเก็บทรัพยากรหลายรายการในไฟล์เดียว ในขณะที่ยังคงรักษาความสมบูรณ์และบริบทของแต่ละทรัพยากรไว้ได้ ซึ่งทำได้โดยใช้รูปแบบการตั้งชื่อแบบลำดับชั้นสำหรับเรกคอร์ดภายในไฟล์ WARC แต่ละเรกคอร์ดได้รับการกำหนดตัวระบุที่ไม่ซ้ำกัน ซึ่งประกอบด้วยชื่อไฟล์ที่จำเป็นและ ID เรคคอร์ดแบบไม่บังคับ ซึ่งช่วยให้สามารถดึงข้อมูลและจัดการทรัพยากรแต่ละรายการภายในไฟล์ WARC ได้อย่างง่ายดาย

ไฟล์ WARC ยังรองรับการบีบอัด ซึ่งช่วยลดความต้องการพื้นที่จัดเก็บและเพิ่มความเร็วในการถ่ายโอน อัลกอริทึมการบีบอัดที่ใช้กับไฟล์ WARC ทั่วไปคือ gzip และ bzip2 ไฟล์ WARC ที่บีบอัดแล้วโดยทั่วไปจะมีนามสกุล `.warc.gz` หรือ `.warc.bz2` ตามลำดับ

เพื่ออำนวยความสะดวกในการประมวลผลและวิเคราะห์ไฟล์ WARC จึงมีการพัฒนาเครื่องมือซอฟต์แวร์และไลบรารีต่างๆ ซึ่งรวมถึงเว็บครอว์เลอร์ เช่น Heritrix ซึ่งสามารถส่งออกไฟล์ WARC ได้โดยตรง และเครื่องมือ เช่น OpenWayback ซึ่งสามารถเล่นซ้ำหน้าเว็บที่เก็บถาวรจากไฟล์ WARC ไลบรารีการเขียนโปรแกรม เช่น Java Web Archive Toolkit (JWAT) และไลบรารี Python WarcIO ให้ API สำหรับการอ่าน การเขียน และการจัดการไฟล์ WARC

รูปแบบ WARC ได้กลายเป็นมาตรฐานโดยพฤตินัยสำหรับการเก็บถาวรเว็บ เนื่องจากความแข็งแกร่ง ความยืดหยุ่น และการนำไปใช้ในวงกว้างโดยสถาบันและองค์กรต่างๆ ที่เกี่ยวข้องกับการเก็บรักษาเว็บ ช่วยให้สามารถสร้างเว็บที่เก็บถาวรขนาดใหญ่ เช่น Wayback Machine ของ Internet Archive ซึ่งมีหน้าเว็บที่จับภาพไว้กว่า 475,000 ล้านหน้าตั้งแต่ปี 1996

โดยสรุปแล้ว รูปแบบ WARC เป็นเครื่องมือสำคัญสำหรับการเก็บรักษาและเข้าถึงข้อมูลบนเว็บสำหรับคนรุ่นต่อๆ ไป โครงสร้างมาตรฐาน การรองรับประเภทเรกคอร์ดหลายประเภท และความสามารถในการจัดเก็บทั้งเนื้อหาและข้อมูลเมตา ทำให้เป็นรูปแบบที่เหมาะสำหรับการเก็บถาวรเว็บที่เติบโตและพัฒนาอย่างต่อเนื่อง เมื่ออินเทอร์เน็ตยังคงมีบทบาทสำคัญในชีวิตของเรา รูปแบบ WARC จะยังคงเป็นส่วนประกอบสำคัญของความพยายามในการเก็บรักษาเว็บอย่างไม่ต้องสงสัย

การบีบอัดไฟล์ช่วยลดความซ้ำซ้อนเพื่อให้ข้อมูลเดียวกันใช้บิตน้อยลง ขีดจำกัดสูงสุดของระยะทางที่คุณสามารถไปได้ถูกควบคุมโดยทฤษฎีข้อมูล: สำหรับการบีบอัดแบบไม่สูญเสียข้อมูล ขีดจำกัดคือเอนโทรปีของแหล่งที่มา (ดู ทฤษฎีบทการเข้ารหัสต้นทาง ของแชนนอนและบทความต้นฉบับของเขาในปี 1948 “ทฤษฎีทางคณิตศาสตร์ของการสื่อสาร”) สำหรับการบีบอัดแบบสูญเสียข้อมูล การแลกเปลี่ยนระหว่างอัตราและคุณภาพถูกจับโดย ทฤษฎีอัตรา-ความผิดเพี้ยน.

สองเสาหลัก: การสร้างแบบจำลองและการเข้ารหัส

คอมเพรสเซอร์ส่วนใหญ่มีสองขั้นตอน ขั้นแรก แบบจำลอง จะทำนายหรือเปิดเผยโครงสร้างในข้อมูล ประการที่สอง ตัวเข้ารหัส จะเปลี่ยนการคาดการณ์เหล่านั้นให้เป็นรูปแบบบิตที่เกือบจะเหมาะสมที่สุด ตระกูลการสร้างแบบจำลองแบบคลาสสิกคือ Lempel–Ziv: LZ77 (1977) และ LZ78 (1978) ตรวจจับสตริงย่อยที่ซ้ำกันและส่งออกการอ้างอิงแทนไบต์ดิบ ในด้านการเข้ารหัส การเข้ารหัสฮัฟฟ์แมน (ดูบทความต้นฉบับ 1952) กำหนดรหัสที่สั้นกว่าให้กับสัญลักษณ์ที่มีแนวโน้มมากกว่า การเข้ารหัสเลขคณิต และ การเข้ารหัสช่วง เป็นทางเลือกที่ละเอียดกว่าซึ่งบีบเข้าใกล้ขีดจำกัดเอนโทรปีมากขึ้น ในขณะที่ ระบบเลขไม่สมมาตร (ANS) ที่ทันสมัยบรรลุการบีบอัดที่คล้ายกันด้วยการใช้งานที่ขับเคลื่อนด้วยตารางที่รวดเร็ว

รูปแบบทั่วไปทำอะไรได้บ้าง

DEFLATE (ใช้โดย gzip, zlib และ ZIP) รวม LZ77 เข้ากับการเข้ารหัสฮัฟฟ์แมน ข้อกำหนดของมันเป็นแบบสาธารณะ: DEFLATE RFC 1951, zlib wrapper RFC 1950, และรูปแบบไฟล์ gzip RFC 1952. Gzip ถูกจัดเฟรมสำหรับการสตรีมและอย่างชัดเจน ไม่พยายามให้การเข้าถึงแบบสุ่ม. รูปภาพ PNG กำหนดมาตรฐาน DEFLATE เป็นวิธีการบีบอัดเพียงวิธีเดียว (โดยมีหน้าต่างสูงสุด 32 KiB) ตามข้อกำหนด PNG “วิธีการบีบอัด 0… deflate/inflate… มากที่สุด 32768 ไบต์” และ W3C/ISO PNG ฉบับที่ 2.

Zstandard (zstd): คอมเพรสเซอร์สำหรับวัตถุประสงค์ทั่วไปรุ่นใหม่ที่ออกแบบมาสำหรับอัตราส่วนที่สูงพร้อมการคลายการบีบอัดที่รวดเร็วมาก รูปแบบ được ghi lại trong RFC 8878 (cũng gương HTML) và thông số kỹ thuật tham chiếu trên GitHub. Giống như gzip, khung cơ bản không nhắm đến truy cập ngẫu nhiên. Một trong những siêu năng lực của zstd là từ điển: các mẫu nhỏ từ kho dữ liệu của bạn giúp cải thiện đáng kể việc nén trên nhiều tệp nhỏ hoặc tương tự (xem tài liệu từ điển python-zstandard ví dụ làm việc của Nigel Tao). Các triển khai chấp nhận cả từ điển “không có cấu trúc” và “có cấu trúc” (thảo luận).

Brotli: เหมาะสำหรับเนื้อหาเว็บ (เช่น แบบอักษร WOFF2, HTTP) มันผสมพจนานุกรมคงที่กับ แกน LZ+เอนโทรปีที่คล้ายกับ DEFLATE ข้อกำหนดคือ RFC 7932ซึ่งยังบันทึกหน้าต่างเลื่อนของ 2WBITS−16 โดย WBITS อยู่ใน [10, 24] (1 KiB−16 B ถึง 16 MiB−16 B) และ ไม่พยายามเข้าถึงแบบสุ่ม. Brotli มักจะเอาชนะ gzip ในข้อความเว็บในขณะที่ถอดรหัสได้อย่างรวดเร็ว

คอนเทนเนอร์ ZIP: ZIP เป็น ไฟล์เก็บถาวร ที่สามารถจัดเก็บรายการด้วยวิธีการบีบอัดต่างๆ (deflate, store, zstd, etc.) มาตรฐานโดยพฤตินัยคือ APPNOTE ของ PKWARE (ดู พอร์ทัล APPNOTE, สำเนาที่โฮสต์, และภาพรวม LC รูปแบบไฟล์ ZIP (PKWARE) / ZIP 6.3.3).

ความเร็วเทียบกับอัตราส่วน: รูปแบบต่างๆ อยู่ที่ไหน

LZ4 มุ่งเป้าไปที่ความเร็วล้วนๆ ด้วยอัตราส่วนที่พอประมาณ ดู หน้าโครงการ (“การบีบอัดที่รวดเร็วอย่างยิ่ง”) และ รูปแบบเฟรม. เหมาะอย่างยิ่งสำหรับแคชในหน่วยความจำ, telemetry, หรือ hot paths ที่การคลายการบีบอัดต้องใกล้เคียงกับความเร็วของ RAM

XZ / LZMA ผลักดันความหนาแน่น (อัตราส่วนที่ดี) ด้วยการบีบอัดที่ค่อนข้างช้า XZ เป็นคอนเทนเนอร์; งานหนักส่วนใหญ่มักทำโดย LZMA/LZMA2 (การสร้างแบบจำลองคล้าย LZ77 + การเข้ารหัสช่วง) ดู รูปแบบไฟล์ .xz, ข้อมูลจำเพาะของ LZMA (Pavlov), และบันทึกเคอร์เนลของลินุกซ์ บน XZ Embedded. XZ มักจะบีบอัดได้ดีกว่า gzip และมักจะแข่งขันกับตัวแปลงสัญญาณที่ทันสมัยที่มีอัตราส่วนสูง แต่ใช้เวลาเข้ารหัสนานกว่า

bzip2 ใช้ การแปลง Burrows–Wheeler (BWT), move-to-front, RLE, และการเข้ารหัสฮัฟฟ์แมน โดยทั่วไปจะมีขนาดเล็กกว่า gzip แต่ช้ากว่า; ดู คู่มืออย่างเป็นทางการ และหน้า man (Linux).

หน้าต่าง บล็อก และการเข้าถึงแบบสุ่ม

“ขนาดหน้าต่าง” มีความสำคัญ การอ้างอิง DEFLATE สามารถมองย้อนกลับไปได้เพียง 32 KiB (RFC 1951 และขีดจำกัด 32 KiB ของ PNG ที่ระบุไว้ที่นี่). หน้าต่างของ Brotli มีตั้งแต่ประมาณ 1 KiB ถึง 16 MiB (RFC 7932). Zstd ปรับแต่งหน้าต่างและความลึกของการค้นหาตามระดับ (RFC 8878). สตรีมพื้นฐานของ gzip/zstd/brotli ได้รับการออกแบบมาสำหรับการถอดรหัสตามลำดับ; รูปแบบพื้นฐาน ไม่รับประกันการเข้าถึงแบบสุ่ม, แม้ว่าคอนเทนเนอร์ (เช่น ดัชนี tar, เฟรมแบบแบ่งส่วน, หรือดัชนีเฉพาะรูปแบบ) สามารถแบ่งชั้นได้

ไม่สูญเสียข้อมูลเทียบกับสูญเสียข้อมูล

รูปแบบข้างต้นคือ ไม่สูญเสียข้อมูล: คุณสามารถสร้างไบต์ที่แน่นอนขึ้นมาใหม่ได้ ตัวแปลงสัญญาณสื่อมักเป็น สูญเสียข้อมูล: พวกเขาทิ้งรายละเอียดที่มองไม่เห็นเพื่อให้อัตราบิตต่ำลง ในภาพ, JPEG แบบคลาสสิก (DCT, การหาปริมาณ, การเข้ารหัสเอนโทรปี) ถูกกำหนดมาตรฐานใน ITU-T T.81 / ISO/IEC 10918-1. ในด้านเสียง, MP3 (MPEG-1 Layer III) และ AAC (MPEG-2/4) อาศัยแบบจำลองการรับรู้และการแปลง MDCT (ดู ISO/IEC 11172-3, ISO/IEC 13818-7, และภาพรวม MDCT ที่นี่). การสูญเสียและไม่สูญเสียข้อมูลสามารถอยู่ร่วมกันได้ (เช่น PNG สำหรับเนื้อหา UI; ตัวแปลงสัญญาณเว็บสำหรับภาพ/วิดีโอ/เสียง)

เคล็ดลับที่เป็นประโยชน์

  • เลือกให้เหมาะกับงาน ข้อความเว็บและแบบอักษร: brotli. ไฟล์ทั่วไปและข้อมูลสำรอง: zstd (ความเร็วในการคลายการบีบอัดที่ยอดเยี่ยมและระดับในการแลกเปลี่ยนเวลากับอัตราส่วน) ท่อส่งข้อมูลและ telemetry ที่รวดเร็วเป็นพิเศษ: lz4. ความหนาแน่นสูงสุดสำหรับไฟล์เก็บถาวรระยะยาวที่เวลาเข้ารหัสไม่เป็นไร: xz/LZMA.
  • ไฟล์ขนาดเล็ก? ฝึกอบรมและจัดส่งพจนานุกรมด้วย zstd (เอกสาร) / (ตัวอย่าง). พวกเขาสามารถย่อขนาดวัตถุขนาดเล็กที่คล้ายกันหลายสิบชิ้นได้อย่างมาก
  • ความสามารถในการทำงานร่วมกัน เมื่อแลกเปลี่ยนไฟล์หลายไฟล์ ให้เลือกใช้คอนเทนเนอร์ (ZIP, tar) พร้อม คอมเพรสเซอร์ APPNOTE ของ ZIP กำหนดรหัสวิธีการและคุณสมบัติ; ดู PKWARE APPNOTE และภาพรวม LC ที่นี่.
  • วัดจากข้อมูลของคุณ อัตราส่วนและความเร็วแตกต่างกันไปตามคลังข้อมูล หลาย repos เผยแพร่เกณฑ์มาตรฐาน (เช่น README ของ LZ4 อ้างอิงคลังข้อมูล Silesia ที่นี่) แต่ตรวจสอบความถูกต้องในเครื่องเสมอ

ข้อมูลอ้างอิงที่สำคัญ (เจาะลึก)

ทฤษฎี: แชนนอน 1948 · อัตรา-ความผิดเพี้ยน · การเข้ารหัส: ฮัฟฟ์แมน 1952 · การเข้ารหัสเลขคณิต · การเข้ารหัสช่วง · ANS. รูปแบบ: DEFLATE · zlib · gzip · Zstandard · Brotli · เฟรม LZ4 · รูปแบบ XZ. สแต็ก BWT: Burrows–Wheeler (1994) · คู่มือ bzip2. สื่อ: JPEG T.81 · MP3 ISO/IEC 11172-3 · AAC ISO/IEC 13818-7 · MDCT.

สรุป: เลือกคอมเพรสเซอร์ที่ตรงกับข้อมูลและข้อจำกัดของคุณ วัดผลจากข้อมูลจริง และ อย่าลืมประโยชน์จากพจนานุกรมและการจัดเฟรมอย่างชาญฉลาด ด้วยการจับคู่ที่เหมาะสม คุณจะได้รับ ไฟล์ขนาดเล็กลง, การถ่ายโอนที่เร็วขึ้น, และแอปที่เร็วขึ้น — โดยไม่สูญเสียความถูกต้องหรือการพกพา

คำถามที่พบบ่อย

การบีบอัดไฟล์คืออะไร?

การบีบอัดไฟล์คือกระบวนการที่ลดขนาดไฟล์หรือไฟล์ทั้งหมด โดยทั่วไปจะใช้เพื่อประหยัดพื้นที่จัดเก็บหรือเร่งความเร็วในการส่งผ่านเครือข่าย

การบีบอัดไฟล์ทำงานอย่างไร?

การบีบอัดไฟล์ทำงานโดยระบุและการนำข้อมูลที่ซ้ำซ้อนออก มันใช้อัลกอริทึมเพื่อเข้ารหัสข้อมูลเดิมในพื้นที่ที่เล็กกว่า

มีการบีบอัดไฟล์แบบไหนบ้าง?

สองประเภทหลักของการบีบอัดไฟล์คือการบีบอัดแบบสูญเสียและแบบไม่สูญเสีย การบีบอัดแบบไม่สูญเสียอนุญาตให้ไฟล์เดิมสามารถถูกกู้คืนได้แบบสมบูรณ์เมื่อการบีบอัดแบบสูญเสียช่วยลดขนาดไฟล์อย่างมากด้วยการสูญเสียคุณภาพข้อมูลบางส่วน

สามารถให้ตัวอย่างเครื่องมือการบีบอัดไฟล์ได้มั้ย?

ตัวอย่างของเครื่องมือการบีบอัดไฟล์ที่นิยมคือ WinZip ซึ่งรองรับรูปแบบการบีบอัดหลายรูปแบบ รวมถึง ZIP และ RAR

การบีบอัดไฟล์จะส่งผลต่อคุณภาพของไฟล์หรือไม่?

ด้วยการบีบอัดแบบไม่สูญเสีย คุณภาพจะไม่เปลี่ยนแปลง หากแต่ด้วยการบีบอัดแบบสูญเสีย อาจมีการลดลงของคุณภาพเพราะการกำจัดข้อมูลที่ไม่สำคัญเพื่อลดขนาดไฟล์มากขึ้น

การบีบอัดไฟล์ปลอดภัยหรือไม่?

ใช่ การบีบอัดไฟล์ปลอดภัยในเชิงของความไม่เปล่าเสีย โดยเฉพาะด้วยการบีบอัดแบบไม่สูญเสีย แต่เหมือนกับไฟล์ใด ๆ ไฟล์ที่ถูกบีบอัดสามารถถูกกลายเป็นเป้าหมายของมัลแวร์หรือไวรัส ดังนั้นเสมอแล้วควรมีซอฟต์แวร์ความปลอดภัยที่น่าเชื่อถือ

ประเภทของไฟล์ที่สามารถบีบอัดได้มีอะไรบ้าง?

แทบทุกประเภทของไฟล์สามารถบีบอัดได้ รวมถึงไฟล์ข้อความ ภาพ ข้อมูลเสียง วิดีโอ และไฟล์ซอฟต์แวร์ อย่างไรก็ตาม ระดับการบีบอัดที่สามารถทำได้สามารถแตกต่างกันอย่างมากขึ้นอยู่กับประเภทไฟล์

ZIP ไฟล์หมายถึงอะไร?

ไฟล์ ZIP เป็นประเภทของรูปแบบไฟล์ที่ใช้การบีบอัดแบบไม่สูญเสียเพื่อลดขนาดไฟล์หนึ่งหรือหลายไฟล์ ไฟล์หลายไฟล์ในไฟล์ ZIP ถูกจัดรวมเข้าด้วยกันเป็นไฟล์เดียวทำให้การแบ่งปันง่ายขึ้น

ฉันสามารถบีบอัดไฟล์ที่ถูกบีบอัดแล้วได้หรือไม่?

จริงแล้วด้วยทางเทคนิค คุณสามารถบีบอัดไฟล์ที่ถูกบีบอัดแล้ว แต่การลดขนาดเพิ่มเติมอาจจะมีน้อยหรือแม้แต่ทำงานตรงข้าม การบีบอัดไฟล์ที่ถูกบีบอัดแล้วอาจทำให้ขนาดของมันเพิ่มขึ้นเนื่องจากมีการเพิ่มข้อมูลเมตาดาตาโดยอัลกอริทึมการบีบอัด

ฉันสามารถถอดการบีบอัดไฟล์อย่างไร?

เพื่อถอดการบีบอัดไฟล์ คุณโดยทั่วไปจะต้องมีเครื่องมือการถอดความกดหรือ unzip เช่น WinZip หรือ 7-Zip เครื่องมือเหล่านี้สามารถแยกไฟล์เดิมออกจากรูปแบบที่ถูกบีบอัด