รูปแบบไฟล์เก็บถาวร PKZ เป็นรูปแบบไฟล์เก็บถาวรที่บีบอัดเป็นกรรมสิทธิ์ที่พัฒนาโดย PKWARE, Inc. เพื่อใช้ในการแพ็กเกจและบีบอัดไฟล์และไดเร็กทอรี โดยทั่วไปจะใช้ในระบบ Microsoft Windows แต่ก็สามารถใช้ในแพลตฟอร์มอื่นๆ ได้เช่นกัน รูปแบบนี้ใช้การผสมผสานของการบีบอัด DEFLATE และตัวกรองการประมวลผลล่วงหน้าต่างๆ เพื่อให้ได้อัตราการบีบอัดสูงในขณะที่ยังคงความสมดุลของความเร็วและการใช้หน่วยความจำ
ไฟล์เก็บถาวร PKZ ประกอบด้วยชุดของ 'ส่วนหัวไฟล์ท้องถิ่น' สำหรับแต่ละไฟล์ ส่วนหัวการถอดรหัส/เข้ารหัสไฟล์เก็บถาวรแบบเลือกได้ บล็อกข้อมูลไฟล์ที่บีบอัด โครงสร้างไดเร็กทอรีส่วนกลาง และเรกคอร์ดจุดสิ้นสุดของไดเร็กทอรีส่วนกลาง สิ่งนี้ช่วยให้เข้าถึงไฟล์ที่บีบอัดแต่ละไฟล์ได้อย่างรวดเร็ว การเข้ารหัสแบบเลือก ได้ การตรวจสอบความสมบูรณ์ของข้อมูล และความสามารถในการจัดเก็บข้อมูลเมตาเกี่ยวกับไฟล์ที่เก็บถาวร
ส่วนหัวไฟล์ท้องถิ่นแต่ละส่วนมีข้อมูลเกี่ยวกับไฟล์ เช่น ชื่อ ขนาด แสตมป์เวลา ผลรวมตรวจสอบ CRC-32 และวิธีการบีบอัดที่ใช้ ส่วนหัวยังระบุคุณสมบัติเสริมใดๆ ที่ใช้กับไฟล์ เช่น การเข้ารหัส ตัวกรองการประมวลผลล่วงหน้า การแพตช์ หรือการกระจายข้อมูลไปยังไฟล์เก็บถาวรหลายไฟล์ ส่วนหัวท้องถิ่นตามด้วยข้อมูลไฟล์ที่บีบอัดหรือจัดเก็บ
PKZ รองรับวิธีการบีบอัดหลายวิธี โดย DEFLATE เป็นวิธีที่ใช้กันมากที่สุด DEFLATE เป็นอัลกอริธึมการบีบอัดข้อมูลแบบไม่สูญเสียที่รวมการบีบอัด LZ77 และการเข้ารหัส Huffman PKZIP ยังสามารถจัดเก็บไฟล์โดยไม่ต้องบีบอัดหากต้องการ ในบางครั้ง อาจมีการใช้วิธีการบีบอัดแบบเก่าอื่นๆ เช่น LZMA หรือ Bzip2
ก่อนที่จะบีบอัดไฟล์ด้วย DEFLATE ตัวกรองกา รประมวลผลล่วงหน้าต่างๆ สามารถนำมาใช้เพื่อปรับปรุงการบีบอัดได้ ตัวกรองเหล่านี้รวมถึงวิธีการต่างๆ เช่น การลดขนาดสัญลักษณ์ การสลับไบต์เพื่อเพิ่มความซ้ำซ้อน ตัวกรอง BCJ สำหรับไฟล์ที่ปฏิบัติการได้ และตัวกรองเดลต้าสำหรับการอัปเดตแบบเพิ่มหน่วยหรือการแพตช์ ตัวกรองจะถูกนำมาใช้เป็นส่วนหนึ่งของกระบวนการบีบอัดก่อนที่ข้อมูลจะถูกส่งไปยังตัวบีบอัด DEFLATE
สำหรับการตรวจสอบความสมบูรณ์ของข้อมูล แต่ละไฟล์จะบันทึกผลรวมตรวจสอบ CRC-32 ของข้อมูลที่ไม่ได้บีบอัดในส่วนหัวท้องถิ่น ผลรวมตรวจสอบเดียวกันนี้จะถูกบันทึกไว้ในรายการไดเร็กทอรีส่วนกลางสำหรับไฟล์ สิ่งนี้ช่วยให้สามารถตรวจสอบได้ว่าไฟล์ถูกบีบอัดและคลายการบีบอัดอย่างถูกต้องโดยไม่มีข้อมูลเสียหาย
ไฟล์เก็บถาวร PKZ สามารถเข้ารหัสข้อมูลไฟล์และส่วนหัวโดยใช้การเข้ารหัสแบบสมมา ตรได้แบบเลือกได้ เวอร์ชันเก่ากว่าใช้ ZipCrypto ในขณะที่เวอร์ชันใหม่กว่าใช้การเข้ารหัส AES เมื่อเข้ารหัส วิธีการเข้ารหัสที่เลือกจะถูกบันทึกไว้ในไฟล์เก็บถาวร และแต่ละไฟล์สามารถระบุรหัสผ่านของตัวเองได้ การเข้ารหัสที่มีการรับรองความถูกต้องจะใช้เพื่อตรวจหาการปลอมแปลงหรือการเสียหายของข้อมูลที่เข้ารหัส
ไดเร็กทอรีส่วนกลางตามหลังข้อมูลไฟล์ที่บีบอัดและทำหน้าที่เป็นสารบัญสำหรับไฟล์เก็บถาวร ไดเร็กทอรีนี้มีรายการส่วนหัวไฟล์สำหรับแต่ละไฟล์พร้อมข้อมูลเมตา ออฟเซ็ตไปยังส่วนหัวท้องถิ่น และข้อมูลอื่นๆ ที่จำเป็นสำหรับการคลายการบีบอัดไฟล์ รายการจะเรียงลำดับตามชื่อไฟล์ ลายเซ็นดิจิทัลแบบเลือกได้สามารถนำไปใช้กับไดเร็กทอรีส่วนกลางเพื่อป้องกันการปลอมแปลงเพิ่มเติม
ในที่สุด เร็กคอร์ดจุดสิ้นสุดของไดเร็กทอรีส่วนกลางจะทำเครื่องหมายจุดสิ้นสุดของไฟล์เก็บถาวร เร็กคอร์ดนี้จะจัดเก็บจำนวนรายการในไดเร็กทอรีส่วนกลาง ขนาดและออฟเซ็ต และฟิลด์ความคิดเห็น สำหรับไฟล์เก็บถาวรที่แบ่งออกเป็นหลายไฟล์ เร็กคอร์ดนี้ยังมีข้อมูลเกี่ยวกับวิธีการค้นหาไฟล์เก็บถาวรอื่นๆ
รูปแบบ PKZ ช่วยให้สามารถเข้าถึงไฟล์แต่ละไฟล์ภายในไฟล์เก็บถาวรได้อย่างมีประสิทธิภาพแบบสุ่มโดยไม่จำเป็นต้องคลายการบีบอัดไฟล์เก็บถาวรทั้งหมด สิ่งนี้ทำได้โดยการอ่านไดเร็กทอรีส่วนกลาง ค้นหารายการไฟล์ที่ต้องการ จากนั้นอ่านและคลายการบีบอัดบล็อกไฟล์ท้องถิ่นเฉพาะจากออฟเซ็ตของบล็อกนั้น นอกจากนี้ยังสามารถเปิดและคลายการบีบอัดไฟล์หลายไฟล์ได้พร้อมกัน
ในการสร้างไฟล์เก็บถาวร PKZ ไฟล์จะถูกกรองและบีบอัดทีละไฟล์เป็นบล็อกไฟล์ท้องถิ่น รายการไดเร็กทอรีส่วนกลางจะสร้างขึ้นจากส่วนหัวท ้องถิ่นและข้อมูลเมตาของไฟล์ จากนั้นไดเร็กทอรีส่วนกลางจะได้รับการลงนามแบบดิจิทัลหากจำเป็น ในที่สุด เร็กคอร์ดจุดสิ้นสุดของไดเร็กทอรีส่วนกลางจะถูกเขียนโดยชี้ไปที่ไดเร็กทอรีส่วนกลาง
การแยกไฟล์เก็บถาวร PKZ เริ่มต้นด้วยการอ่านจุดสิ้นสุดของไดเร็กทอรีส่วนกลางเพื่อค้นหารายการไดเร็กทอรีส่วนกลาง รายการไฟล์ที่ต้องการจะถูกค้นหาและแต่ละรายการจะถูกคลายการบีบอัดโดยการอ่านส่วนหัวท้องถิ่นและข้อมูลที่บีบอัดจากออฟเซ็ตที่ระบุ การเข้ารหัสใดๆ จะถูกลบออกและตัวกรองที่ผ่านการประมวลผลล่วงหน้าจะถูกย้อนกลับเพื่อรับเนื้อหาไฟล์ต้นฉบับ
คุณสมบัติอื่นๆ บางประการของรูปแบบ PKZ ได้แก่ การแบ่งไฟล์เก็บถาวรออกเป็นหลายไฟล์ ไดรฟ์ข้อมูล หรือเซ็กเมนต์ การรองรับชื่อไฟล์ Unicode สิทธิ์และแอตทริบิวต์ของระบบไฟล์ NTFS ฟังก์ชันการทำงานการอัปเดต/การแพตช์แบบรวม และข้อมูลเมตาที่ขยายได้ เช่น ลายเซ็นดิจิทัล ไดเจสต์แฮช และข้อมูลเฉพาะแอปพลิเคชัน
โดยรวมแล้ว รูปแบบ PKZ เป็นรูปแบบไฟล์เก็บถาวรที่มีประสิทธิภาพและยืดหยุ่นสำหรับการบีบอัดและการแพ็กเกจไฟล์ ความสามารถในการบีบอัดไฟล์ทีละไฟล์ ใช้ตัวกรองการประมวลผลล่วงหน้า และแยกไฟล์เฉพาะได้อย่างรวดเร็วโดยไม่ต้องประมวลผลไฟล์เก็บถาวรทั้งหมด ทำให้เหมาะสำหรับการแพ็กเกจตัวติดตั้งซอฟต์แวร์ การอัปเดตเฟิร์มแวร์ เอกสาร และอื่นๆ อีกมากมาย การรองรับการเข้ารหัส การตรวจสอบความสมบูรณ์ของข้อมูล และลายเซ็นดิจิทัลยังช่วยให้สามารถให้ระดับความปลอดภัยสูงเมื่อจำเป็น
การบีบอัดไฟล์คือกระบวนการที่ลดขนาดของไฟล์ข้อมูลเพื่อการจัดเก็บหรือการส่งที่มีประสิทธิภาพ มันใช้อัลกอริทึมต่างๆเพื่อทำให้ข้อมูลเ ข้มข้นโดยการตรวจสอบและการกำจัดส่วนซ้ำซ้อน ซึ่งมักจะลดขนาดข้อมูลลงอย่างมากโดยไม่สูญเสียข้อมูลเดิม
มีประเภทการบีบอัดไฟล์สองประเภทหลัก: ปราศจากข้อผิดพลาด และมีข้อผิดพลาด การบีบอัดปราศจากข้อผิดพลาดช่วยให้ข้อมูลเดิมสามารถสร้างขึ้นมาใหม่ได้ดีจากข้อมูลที่ถูกบีบอัด ซึ่งเหมาะสำหรับไฟล์ที่ทุกซองข้อมูลเป็นสถานะที่สำคัญ เช่น ข้อความหรือไฟล์ฐานข้อมูล ตัวอย่างทั่วไปรวมถึงรูปแบบไฟล์ ZIP และ RAR อย่างไรก็ตาม การบีบอัดที่มีข้อผิดพลาดจะยกเลิกข้อมูลที่ไม่สำคัญเพื่อลดขนาดไฟล์มากขึ้น มักจะใช้กับไฟล์เสียง วิดีโอ และแฟ้มภาพ JPEG และ MP3 เป็นตัวอย่างที่การสูญเสียข้อมูลบางส่วนไม่ลดคุณภาพทางการรับรู้ของเนื้อหาอย่างมาก
การบีบอัดไฟล์มีผลประโยชน์ในหลาย ๆ ทาง มันช่วยประหยัดพื้นที่จัดเก็บบนอุปกรณ์และเซิร์ฟเวอร์ ลดราคาและปรับปร ุงประสิทธิภาพ มันยังเร่งการถ่ายโอนไฟล์ผ่านเครือข่าย รวมถึงอินเทอร์เน็ต ซึ่งเหมาะสมอย่างยิ่งสำหรับไฟล์ขนาดใหญ่ นอกจากนี้ ไฟล์ที่ถูกบีบอัดก็สามารถรวมเข้าด้วยกันเป็นไฟล์เก็บถาวรหนึ่ง ช่วยในการจัดระเบียบและการนำข้อมูลหลาย ๆ ไฟล์ไปที่อื่นได้ง่ายขึ้น
อย่างไรก็ตาม การบีบอัดไฟล์มีข้อเสียบางอย่าง การบีบอัดและการบีบอัดไฟล์ต้องใช้ทรัพยากรการคำนวณ ซึ่งอาจทำให้ประสิทธิภาพของระบบช้าลง โดยเฉพาะสำหรับไฟล์ขนาดใหญ่ และในกรณีการบีบอัดที่มีข้อผิดพลาด บางส่วนของข้อมูลเดิมจะหายไปในระหว่างการบีบอัด และคุณภาพที่ได้อาจไม่เหมาะสมสำหรับการใช้งานทั้งหมด โดยเฉพาะการใช้งานเชิงวิชาชีพที่ต้องการคุณภาพสูง
การบีบอัดไฟล์เป็นเครื่องมือที่สำคัญในโลกดิจิตอลในปัจจุบัน มันเพิ่มประสิทธิภาพ ประหยัดพื้นที่จัดเก็บและลดเวลาดาวน์โหลดและอัปโหลด อย่างไรก็ตาม มันมาพร้อมกับข้อเสียของตัวเองในเรื่องได้ผลของระบบและความเสี่ยงของการตกต่ำของคุณภาพ ดังนั้น จึงจำเป็นต้องระมัดระวังเหล่านี้เพื่อเลือกวิธีการบีบอัดที่เหมาะสมสำหรับความต้องการข้อมูลเฉพาะ
การบีบอัดไฟล์คือกระบวนการที่ลดขนาดไฟล์หรือไฟล์ทั้งหมด โดยทั่วไปจะใช้เพื่อประหยัดพื้นที่จัดเก็บหรือเร่งความเร็วในการส่งผ่านเครือข่าย
การบีบอัดไฟล์ทำงานโดยระบุและการนำข้อมูลที่ซ้ำซ้อนออก มันใช้อัลกอริทึมเพื่อเข้ารหัสข้อมูลเดิมในพื้นที่ที่เล็กกว่า
สองประเภทหลักของการบีบอัดไฟล์คือการบีบอัดแบบสูญเสียและแบบไม่สูญเสีย การบีบอัดแบบไม่สูญเสียอนุญาตให้ไฟล์เดิมสามารถถูกกู้คืนได้แบบสมบูรณ์เมื่อการบีบอัดแบบสูญเสียช่วยลดขนาดไฟล์อย่างมากด้วยการสูญเสียคุณภาพข้อมูลบางส่วน
ตัวอย่างของเครื่องมือการบีบอัดไฟล์ที่นิยมคือ WinZip ซึ่งรองรับรูปแบบการบีบอัดหลายรูปแบบ รวมถึง ZIP และ RAR
ด้วยการบีบอัดแบบไม่สูญเสีย คุณภาพจะไม่เปลี่ยนแปลง หากแต่ด้วยการบีบอัดแบบสูญเสีย อาจมีการลดลงของคุณภาพเพราะการกำจัดข้อมูลที่ไม่สำคัญเพื่อลดขนาดไฟล์มากขึ้น
ใช่ การบีบอัดไฟล์ปลอดภัยในเชิงของความไม่เปล่าเสีย โดยเฉพาะด้วยการบีบอัดแบบไม่สูญเสีย แต่เหมือนกับไฟล์ใด ๆ ไฟล์ที่ถูกบีบอัดสามารถถูกกลายเป็นเป้าหมายของมัลแวร์หรือไวรัส ดังนั้นเสมอแล้วควรมีซอฟต์แวร์ความปลอดภัยที่น่าเชื่อถือ
แทบทุกประเภทของไฟล์สามารถบีบอัดได้ รวมถึงไฟล์ข้อความ ภาพ ข้อมูลเสียง วิดีโอ และไฟล์ซอฟต์แวร์ อย่างไรก็ตาม ระดับการบีบอัดที่สามารถทำได้สามารถแตกต่างกันอย่างมากขึ้นอยู่กับประเภทไฟล์
ไฟล์ ZIP เป็นประเภทของรูปแบบไฟล์ที่ใช้การบีบอัดแบบไม่สูญเสียเพื่อลดขนาดไฟล์หนึ่งหรือหลายไฟล์ ไฟล์หลายไฟล์ในไฟล์ ZIP ถูกจัดรวมเข้าด้วยกันเป็นไฟล์เดียวทำให้การแบ่งปันง่ายขึ้น
จริงแล้วด้วยทางเทคนิค คุณสามารถบีบอัดไฟล์ที่ถูกบีบอัดแล้ว แต่การลดขนาดเพิ่มเติมอาจจะมีน้อยหรือแม้แต่ทำงานตรงข้าม การบีบอัดไฟล์ที่ถูกบีบอัดแล้วอาจทำให้ขนาดของมันเพิ่มขึ้นเนื่องจากมีการเพิ่มข้อมูลเมตาดาตาโดยอัลกอริทึมการบีบอัด
เพื่อถอดการบีบอัดไฟล์ คุณโดยทั่วไปจะต้องมีเครื่องมือการถอดความกดหรือ unzip เช่น WinZip หรือ 7-Zip เครื่องมือเหล่านี้สามารถแยกไฟล์เดิมออกจากรูปแบบที่ถูกบีบอัด