USTAR (Unix Standard Tape Archive) เป็นรูปแบบไฟล์ที่ใช้สำหรับการเก็บถาวรและการแจกจ่ายไฟล์บน Unix และระบบปฏิบัติการที่คล้าย Unix รูปแบบนี้เปิดตัวในช่วงทศวรรษ 1980 ในฐานะวิธีมาตรฐานสำหรับการสร้างเทปเก็บถาวรที่สามารถแลกเปลี่ยนได้อย่างง่ายดายระหว่างระบบ Unix ที่แตกต่างกัน ตั้งแต่นั้นมา รูปแบบ USTAR ก็ได้กลายเป็นมาตรฐานที่ใช้กันอย่างแพร่หลายสำหรับการจัดแพ็กเกจและการแจกจ่ายซอฟต์แวร์ ข้อมูล และไฟล์อื่นๆ บนแพลตฟอร์มต่างๆ
รูปแบบ USTAR เป็นส่วนขยายของรูปแบบ TAR (Tape Archive) ก่อนหน้า ซึ่งใช้สำหรับการสร้างไฟล์เก็บถาวรบนเทปแม่เหล็ก รูปแบบ TAR อนุญาตให้รวมไฟล์หลายไฟล์เข้าเป็นไฟล์เก็บถาวรเดียว ทำให้จัดเก็บและถ่ายโอนคอลเลกชันไฟล์ขนาดใหญ่ได้ง่ายขึ้น อย่างไรก็ตาม รูปแบบ TAR เดิมมีข้อจำกัด เช่น ความยาวชื่อไฟล์สูงสุด 99 อักขระ และขนาด ไฟล์สูงสุด 8 GB
เพื่อแก้ไขข้อจำกัดเหล่านี้ จึงได้พัฒนารูปแบบ USTAR ขึ้นมาเพื่อปรับปรุงรูปแบบ TAR เดิม รูปแบบ USTAR ได้นำการปรับปรุงหลายอย่างมาใช้ รวมถึงการรองรับชื่อไฟล์ที่ยาวขึ้น (สูงสุด 255 อักขระ) ขนาดไฟล์ที่ใหญ่ขึ้น (สูงสุด 8 EB หรือ 8 เอ็กซาไบต์) และฟิลด์เมตาข้อมูลเพิ่มเติมสำหรับการจัดเก็บแอตทริบิวต์และสิทธิ์ของไฟล์
ไฟล์เก็บถาวร USTAR ประกอบด้วยชุดของเรกคอร์ดไฟล์ โดยแต่ละเรกคอร์ดแสดงถึงไฟล์หรือไดเร็กทอรีที่จัดเก็บอยู่ในไฟล์เก็บถาวร แต่ละเรกคอร์ดไฟล์ประกอบด้วยส่วนหัวและข้อมูลไฟล์จริง ส่วนหัวมีเมตาข้อมูลเกี่ยวกับไฟล์ เช่น ชื่อ ขนาด ความเป็นเจ้าของ สิทธิ์ และเวลาที่แก้ไข ข้อมูลไฟล์ตามหลังส่วนหัวและจัดเก็บเป็นบล็อกไบต์ที่ต่อเนื่องกัน
ส่วนหัว USTAR มีขนาดคงที่ 512 ไบต์ และแบ่งออกเป็นหลายฟิลด์ ฟิลด์ที่สำคัญบางอย่างในส่วนหัว ได้แก่:
1. ชื่อไฟล์: สตริงที่สิ้นสุดด้วย null ซึ่งมีชื่อไฟล์หรือไดเร็กทอรี ความยาวสูงสุด 255 อักขระ
2. โหมดไฟล์: ตัวเลขเลขฐานแปด 12 อักขระที่แสดงสิทธิ์และบิตโหมดของไฟล์
3. ID ของเจ้าของและกลุ่ม: ID ผู้ใช้และกลุ่มตัวเลขที่เกี่ยวข้องกับไฟล์
4. ขนาดไฟล์: ตัวเลขเลขฐานแปด 12 อักขระที่แสดงขนาดของไฟล์เป็นไบต์
5. เวลาที่แก้ไข: ตัวเลขเลขฐานแปด 12 อักขระที่แสดงเวลาที่แก้ไขไฟล์ล่าสุดเป็นจำนวนวินาทีตั้งแต่วันที่ 1 มกราคม 1970
6. เช็คซัมส่วนหัว: ตัวเลขเลขฐานแปด 8 อักขระที่ใช้สำหรับการตรวจจับข้อผิดพลาด
รูปแบบ USTAR ยังรองรับประเภทไฟล์พิเศษ เช่น ลิงก์สัญลักษณ์ ลิงก์แบบคงที่ และไฟล์อุปกรณ์ ไฟล์พิเศษเหล่านี้แสดงโดยใช้ฟิลด์ส่วนหัวเฉพาะ และจัดการแตกต่างกันในระหว่างการแยก
เมื่อสร้างไฟล์เก็บถาวร USTAR ยูทิลิตี้การเก็บถาวร (เช่น คำสั่ง `tar`) จะอ่านไฟล ์และไดเร็กทอรีที่ระบุ สร้างส่วนหัวที่เหมาะสมสำหรับแต่ละไฟล์ และต่อส่วนหัวและข้อมูลไฟล์เข้าด้วยกันเป็นไฟล์เก็บถาวรเดียว ไฟล์เก็บถาวรที่ได้สามารถบีบอัดได้โดยใช้อัลกอริทึมการบีบอัดต่างๆ เช่น gzip หรือ bzip2 เพื่อลดขนาด
ในการแยกไฟล์จากไฟล์เก็บถาวร USTAR ยูทิลิตี้การแยกจะอ่านไฟล์เก็บถาวรตามลำดับ โดยวิเคราะห์ส่วนหัวเพื่อรับข้อมูลเกี่ยวกับแต่ละไฟล์ จากนั้นจะสร้างไฟล์และไดเร็กทอรีที่จำเป็นตามเมตาข้อมูลที่จัดเก็บไว้ในส่วนหัว และเขียนข้อมูลไฟล์ไปยังตำแหน่งที่เหมาะสม
รูปแบบ USTAR ได้รับการนำมาใช้กันอย่างแพร่หลายและรองรับโดยเครื่องมือการเก็บถาวรและการบีบอัดต่างๆ บนระบบปฏิบัติการต่างๆ รูปแบบนี้ให้วิธีมาตรฐานและพกพาสำหรับการจัดแพ็กเกจและการแจกจ่ายไฟล์ โดยรับรองความเข้ากันได้และความง่ายในการใช้งาน
อย่างไรก็ตา ม ควรสังเกตว่ารูปแบบ USTAR มีข้อจำกัดบางประการ ตัวอย่างเช่น ไม่รองรับชื่อไฟล์ที่ยาวกว่า 255 อักขระหรือขนาดไฟล์ที่ใหญ่กว่า 8 EB นอกจากนี้ ยังไม่มีฟีเจอร์การเข้ารหัสหรือการตรวจสอบความสมบูรณ์ในตัว ซึ่งอาจจำเป็นสำหรับการถ่ายโอนและการจัดเก็บไฟล์ที่ปลอดภัย
แม้จะมีข้อจำกัดเหล่านี้ แต่รูปแบบ USTAR ยังคงเป็นตัวเลือกยอดนิยมสำหรับการเก็บถาวรและการแจกจ่ายไฟล์เนื่องจากความเรียบง่าย การรองรับอย่างแพร่หลาย และความเข้ากันได้กับระบบปฏิบัติการ Unix และระบบปฏิบัติการที่คล้าย Unix เป็นจำนวนมาก
โดยสรุป รูปแบบไฟล์เก็บถาวร USTAR เป็นส่วนขยายของรูปแบบ TAR ที่ให้วิธีมาตรฐานสำหรับการจัดแพ็กเกจและการแจกจ่ายไฟล์บนระบบ Unix และระบบที่คล้าย Unix รูปแบบนี้รองรับชื่อไฟล์ที่ยาวขึ้น ขนาดไฟล์ที่ใหญ่ขึ้น และเมตาข้อมูลเพิ่มเติมเมื่อเปรียบเทียบกับรูปแบบ TAR เ ดิม ไฟล์เก็บถาวร USTAR ประกอบด้วยชุดของเรกคอร์ดไฟล์ โดยแต่ละเรกคอร์ดมีส่วนหัวพร้อมเมตาข้อมูลไฟล์และข้อมูลไฟล์จริง รูปแบบนี้ได้รับการรองรับอย่างแพร่หลายโดยเครื่องมือการเก็บถาวรและการบีบอัด และใช้กันทั่วไปสำหรับการแจกจ่ายซอฟต์แวร์และการแลกเปลี่ยนข้อมูล
การบีบอัดไฟล์คือกระบวนการที่ลดขนาดของไฟล์ข้อมูลเพื่อการจัดเก็บหรือการส่งที่มีประสิทธิภาพ มันใช้อัลกอริทึมต่างๆเพื่อทำให้ข้อมูลเข้มข้นโดยการตรวจสอบและการกำจัดส่วนซ้ำซ้อน ซึ่งมักจะลดขนาดข้อมูลลงอย่างมากโดยไม่สูญเสียข้อมูลเดิม
มีประเภทการบีบอัดไฟล์สองประเภทหลัก: ปราศจากข้อผิดพลาด และมีข้อผิดพลาด การบีบอัดปราศจากข้อผิดพลาดช่วยให้ข้อมูลเดิมสามารถสร้างขึ้นมาใหม่ได้ดีจากข้อมูลที่ถูกบีบอัด ซึ่งเหมาะสำหรับไฟล์ที่ทุกซองข้อ มูลเป็นสถานะที่สำคัญ เช่น ข้อความหรือไฟล์ฐานข้อมูล ตัวอย่างทั่วไปรวมถึงรูปแบบไฟล์ ZIP และ RAR อย่างไรก็ตาม การบีบอัดที่มีข้อผิดพลาดจะยกเลิกข้อมูลที่ไม่สำคัญเพื่อลดขนาดไฟล์มากขึ้น มักจะใช้กับไฟล์เสียง วิดีโอ และแฟ้มภาพ JPEG และ MP3 เป็นตัวอย่างที่การสูญเสียข้อมูลบางส่วนไม่ลดคุณภาพทางการรับรู้ของเนื้อหาอย่างมาก
การบีบอัดไฟล์มีผลประโยชน์ในหลาย ๆ ทาง มันช่วยประหยัดพื้นที่จัดเก็บบนอุปกรณ์และเซิร์ฟเวอร์ ลดราคาและปรับปรุงประสิทธิภาพ มันยังเร่งการถ่ายโอนไฟล์ผ่านเครือข่าย รวมถึงอินเทอร์เน็ต ซึ่งเหมาะสมอย่างยิ่งสำหรับไฟล์ขนาดใหญ่ นอกจากนี้ ไฟล์ที่ถูกบีบอัดก็สามารถรวมเข้าด้วยกันเป็นไฟล์เก็บถาวรหนึ่ง ช่วยในการจัดระเบียบและการนำข้อมูลหลาย ๆ ไฟล์ไปที่อื่นได้ง่ายขึ้น
อย่างไรก็ตาม การบีบอัดไฟล์มีข้อเสียบางอย่าง การบีบอัดและการบีบอัดไฟล์ต้องใช้ทรัพยากรการคำนวณ ซึ่งอาจทำให้ประสิทธิภาพของระบบช้าลง โดยเฉพาะสำหรับไฟล์ขนาดใหญ่ และในกรณีการบีบอัดที่มีข้อผิดพลาด บางส่วนของข้อมูลเดิมจะหายไปในระหว่างการบีบอัด และคุณภาพที่ได้อาจไม่เหมาะสมสำหรับการใช้งานทั้งหมด โดยเฉพาะการใช้งานเชิงวิชาชีพที่ต้องการคุณภาพสูง
การบีบอัดไฟล์เป็นเครื่องมือที่สำคัญในโลกดิจิตอลในปัจจุบัน มันเพิ่มประสิทธิภาพ ประหยัดพื้นที่จัดเก็บและลดเวลาดาวน์โหลดและอัปโหลด อย่างไรก็ตาม มันมาพร้อมกับข้อเสียของตัวเองในเรื่องได้ผลของระบบและความเสี่ยงของการตกต่ำของคุณภาพ ดังนั้น จึงจำเป็นต้องระมัดระวังเหล่านี้เพื่อเลือกวิธีการบีบอัดที่เหมาะสมสำหรับความต้องการข้อมูลเฉพาะ
การบีบอัดไฟล์คือกระบวนการที่ลดขนาดไฟล์หรือไฟล์ทั้งหมด โดยทั่วไปจะใช้เพื่อประหยัดพื้นที่จัดเก็บหรือเร่งความเร็วในการส่งผ่านเครือข่าย
การบีบอัดไฟล์ทำงานโดยระบุและการนำข้อมูลที่ซ้ำซ้อนออก มันใช้อัลกอริทึมเพื่อเข้ารหัสข้อมูลเดิมในพื้นที่ที่เล็กกว่า
สองประเภทหลักของการบีบอัดไฟล์คือการบีบอัดแบบสูญเสียและแบบไม่สูญเสีย การบีบอัดแบบไม่สูญเสียอนุญาตให้ไฟล์เดิมสามารถถูกกู้คืนได้แบบสมบูรณ์เมื่อการบีบอัดแบบสูญเสียช่วยลดขนาดไฟล์อย่างมากด้วยการสูญเสียคุณภาพข้อมูลบางส่วน
ตัวอย่างของเครื่องมือการบีบอัดไฟล์ที่นิยมคือ WinZip ซึ่งรองรับรูปแบบการบีบอัดหลายรูปแบบ รวมถึง ZIP และ RAR
ด้วยการบีบอัดแบบไม่สูญเสีย คุณภาพจะไม่เปลี่ยนแปลง หากแต่ด้วยการบีบอัดแบบสูญเสีย อาจมีการลดลงของคุณภาพเพราะการกำจัดข้อมูลที่ไม่สำคัญเพื่อลดขนาดไฟล์มากขึ้น
ใช่ การบีบอัดไฟล์ปลอดภัยในเชิงของความไม่เปล่าเสีย โดยเฉพาะด้วยการบีบอัดแบบไม่สูญเสีย แต่เหมือนกับไฟล์ใด ๆ ไฟล์ที่ถูกบีบอัดสามารถถูกกลายเป็นเป้าหมายของมัลแวร์หรือไวรัส ดังนั้นเสมอแล้วควรมีซอฟต์แวร์ความปลอดภัยที่น่าเชื่อถือ
แทบทุกประเภทของไฟล์สามารถบีบอัดได้ รวมถึงไฟล์ข้อความ ภาพ ข้อมูลเสียง วิดีโอ และไฟล์ซอฟต์แวร์ อย่างไรก็ตาม ระดับการบีบอัดที่สามารถทำได้สามารถแตกต่างกันอย่างมากขึ้นอยู่กับประเภทไฟล์
ไฟล์ ZIP เป็นประเภทของรูปแบบไฟล์ที่ใช้การบีบอัดแบบไม่สูญเสียเพื่อลดขนาดไฟล์หนึ่งหรือหลายไฟล์ ไฟล์หลายไฟล์ในไฟล์ ZIP ถูกจัดรวมเข้าด้วยกันเป็นไฟล์เดียวทำให้การแบ่งปันง่ายขึ้น
จริงแล้วด้วยทางเทคนิค คุณสามารถบีบอัดไฟล์ที่ถูกบีบอัดแล้ว แต่การลดขนาดเพิ่มเติมอาจจะมีน้อยหรือแม้แต่ทำงานตรงข้าม การบีบอัดไฟล์ที่ถูกบีบอัดแล้วอาจทำให้ขนาดของมันเพิ่มขึ้นเนื่องจากมีการเพิ่มข้อมูลเมตาดาตาโดยอัลกอ ริทึมการบีบอัด
เพื่อถอดการบีบอัดไฟล์ คุณโดยทั่วไปจะต้องมีเครื่องมือการถอดความกดหรือ unzip เช่น WinZip หรือ 7-Zip เครื่องมือเหล่านี้สามารถแยกไฟล์เดิมออกจากรูปแบบที่ถูกบีบอัด