BSD TAR (टेप आर्काइव) फॉर्मेट फाइलों और डायरेक्ट्री के संग्रह को आर्काइव करने और कंप्रेस करने के लिए व्यापक रूप से इस्तेमाल किया जाने वाला फाइल फॉर्मेट है। इसे मूल रूप से मैग्नेटिक टेप जैसे अनुक्रमिक एक्सेस डिवाइस पर डेटा का बैकअप लेने के लिए विकसित किया गया था, लेकिन अब आमतौर पर सॉफ़्टवेयर पैकेज वितरित करने और विभिन्न स्टोरेज मीडिया पर बैकअप आर्काइव बनाने के लिए उपयोग किया जाता है। TAR फॉर्मेट कई फाइलों को एक ही आर्काइव फाइल में बंडल करने की अनुमति देता है जबकि डायरेक्ट्री स्ट्रक्चर, फाइल एट्रिब्यूट और अनुमतियों को संरक्षित रखता है।
एक TAR आर्काइव में फाइल हेडर और फाइल डेटा ब्लॉक की एक श्रृंखला होती है जो एक साथ जुड़ी होती है। आर्काइव में प्रत्येक फाइल को 512-बाइट हेडर ब्लॉक द्वारा दर्शाया जाता है जिसके बाद फाइल का डेटा होता है, जिसे 512 बाइट के गुणक तक पैड किया जाता है। हेडर ब्लॉक में फाइल के बारे में मेटाडेटा होता है, जैसे उसका नाम, आकार, स्वामित्व, अनुमतियाँ और संशोधन टाइमस्टैम्प।
फाइल हेडर ब्लॉक में पूर्वनिर्धारित आकार के फ़ील्ड के साथ एक निश्चित संरचना होती है। कुछ प्रमुख फ़ील्ड में शामिल हैं:
- फाइल का नाम (100 बाइट): फाइल का नाम, आमतौर पर 255 वर्णों तक सीमित, एक नल बाइट द्वारा समाप्त किया जाता है।
- फाइल मोड (8 बाइट): फाइल की अनुमतियाँ और प्रकार, एक अष्टक संख्या के रूप में संग्रहीत।
- स्वामी की उपयोगकर्ता आईडी (8 बाइट): फाइल के स्वामी की संख्यात्मक उपयोगकर्ता आईडी।
- समूह की उपयोगकर्ता आईडी (8 बाइट): फाइल के स्वामी की संख्यात्मक समूह आईडी।
- फाइल का आकार (12 बाइट): बाइट में फाइल का आकार, एक अष्टक संख्या के रूप में संग्रहीत।
- संशोधन समय (12 बाइट): फाइल के अं तिम संशोधन का टाइमस्टैम्प, 1 जनवरी, 1970 से सेकंड की संख्या के रूप में संग्रहीत, अष्टक में।
- हेडर चेकसम (8 बाइट): हेडर ब्लॉक का एक चेकसम, भ्रष्टाचार का पता लगाने के लिए उपयोग किया जाता है।
हेडर ब्लॉक के बाद, फाइल का डेटा सन्निहित 512-बाइट ब्लॉक में संग्रहीत किया जाता है। यदि फाइल का आकार 512 बाइट का गुणक नहीं है, तो अंतिम ब्लॉक को नल बाइट से पैड किया जाता है। आर्काइव का अंत नल बाइट से भरे दो लगातार 512-बाइट ब्लॉक द्वारा चिह्नित किया जाता है।
मूल TAR फॉर्मेट की सीमाओं में से एक यह है कि यह 12-बाइट फाइल साइज फील्ड के कारण 8 GB से बड़ी फाइलों का समर्थन नहीं करता है। इस सीमा को दूर करने के लिए, POSIX.1-2001 (pax) फॉर्मेट जैसे बाद के एक्सटेंशन ने बड़ी फाइलों के आकार का समर्थन करने के लिए अतिरिक्त हेडर फ़ील्ड पेश किए।
TAR फॉर्मेट स्वयं डेटा संपीड़न प्रदान नहीं करता है। हालाँकि, gzip, bzip2 या xz जैसे संपीड़न एल्गोरिदम का उप योग करके TAR आर्काइव को संपीड़ित करना आम बात है। परिणामी फाइलों को अक्सर इस्तेमाल की गई संपीड़न विधि को इंगित करने के लिए .tar.gz, .tgz, .tar.bz2, .tbz2, .tar.xz या .txz जैसे एक्सटेंशन दिए जाते हैं।
TAR आर्काइव बनाना और निकालना अधिकांश ऑपरेटिंग सिस्टम द्वारा समर्थित है और इसे कमांड-लाइन टूल या ग्राफिकल यूजर इंटरफेस का उपयोग करके किया जा सकता है। यूनिक्स जैसे सिस्टम पर, tar कमांड आमतौर पर उपयोग किया जाता है। उदाहरण के लिए:
- TAR आर्काइव बनाने के लिए: `tar -cf archive.tar file1 file2 directory/`
- TAR आर्काइव निकालने के लिए: `tar -xf archive.tar`
- एक संपीड़ित TAR आर्काइव बनाने के लिए: `tar -czf archive.tar.gz file1 file2 directory/`
मूल TAR फॉर्मेट के अतिरिक्त, कई भिन्नताएँ और एक्सटेंशन हैं, जैसे कि GNU TAR फॉर्मेट, जो स्पार्स फाइलों, लंबे फाइल नामों और विस्तारित विशेषताओं के लिए समर्थन जोड़ता है। ये एक्सटेंशन मूल TAR फॉर्मेट के साथ संगतता बनाए रखते हुए अतिरिक्त कार्यक्षमता प्रदान करते हैं।
TAR फॉर्मेट की सरलता और पोर्टेबिलिटी ने विभिन्न प्लेटफॉर्म और उपयोग के मामलों में इसके व्यापक अपनाने में योगदान दिया है। यह आर्काइविंग, बैकअप और सॉफ़्टवेयर वितरण के लिए एक लोकप्रिय विकल्प बना हुआ है, अक्सर स्टोरेज आवश्यकताओं और ट्रांसमिशन समय को कम करने के लिए संपीड़न विधियों के संयोजन में।
फ़ाइल संपीड़न एक प्रक्रिया है जो डेटा फ़ाइलों के आकार को कुशलता के लिए कम करती है। इसका उपयोग विभिन्न एल्गोरिदमों का उपयोग करके डेटा को संकुचित करने के लिए होता है, जो अक्सर डेटा के आकार को मूल जानकारी के बिना चौंकसी से कम करता है।
फ़ाइल संपीड़न के दो मुख्य प्रकार हैं: नुकसानरहित और नुकसानदायक। जहाँ हर बिट डेटा महत्वपूर्ण हो, वहां नुकसानरहित संपीड़न की अनुमति देता है कि मूल डेटा को संपीडित डेटा से सही रूप से पुनर्निर्माण किया जा सके, जैसे कि पाठ या ड ेटाबेस फ़ाइलें। आम उदाहरण में ZIP और RAR फ़ाइल फ़ॉर्मेट्स शामिल हैं। दूसरी ओर, नुकसानदायक संपीड़न अधिक महत्वपूर्ण डेटा को हटाकर फ़ाइल आकार को अधिक गहराई से कम करता है, जो अक्सर ऑडियो, वीडियो, और चित्र फ़ाइलों में इस्तेमाल होता है। JPEGs और MP3s उन उदाहरणों में हैं जहां कुछ डेटा हानि सामग्री की अनुभूति गुणवत्ता को महत्वपूर्ण रूप से घटा नहीं सकती है।
फ़ाइल संपीड़न कई तरीकों से लाभकारी होता है। यह उपकरणों और सर्वरों पर संग्रहण स्थान की बचत करता है, लागत को कम करता है और कुशलता को बढ़ाता है। यह नेटवर्कों, इंटरनेट सहित, पर फ़ाइल स्थानांतरण समय को तेज करता है, जो विशेष रूप से बड़ी फ़ाइलों के लिए महत्वपूर्ण है। साथ ही, संपीड़ित फ़ाइलें एक आर्काइव फ़ाइल में एकत्र की जा सकती हैं, जो संगठनात्मक और आसानी से परिवहन के लिए सहायता देता है।
हालांकि, फ़ाइल संपीड़न में कुछ नकारात्मक पहलू भी होते हैं। संपीड़न और विस्तारण प्रक्रिया के लिए संगणकीय संसाधनों की आवश्यकता होती है, जो विशेष रूप से बड़ी फ़ाइलों के लिए सिस्टम की प्रदर्शन को धीमा कर सकता है। साथ ही, नुकसानदायक संपीड़न के मामले में, कुछ मूल डेटा संपीड़न के दौरान खो जाता है, और परिणामस्वरूप गुणवत्ता सभी उपयोगों के लिए स्वीकार्य नहीं हो सकती है, विशेषकर उन पेशेवर अनुप्रयोगों के लिए जो उच्च गुणवत्ता मांगते हैं।
फ़ाइल संपीड़न आज की डिजिटल दुनिया में एक महत्वपूर्ण उपकरण है। इसने कुशलता में सुधार किया, संग्रहण स्थान की बचत की और डाउनलोड और अपलोड समयों को घटाया। फिर भी, यह स्वयं की सिस्टम प्रदर्शन और गुणवत्ता हानि की जोखिम लाता है। इसलिए, विशेष डेटा आवश्यकताओं के लिए सही संपीड़न तकनीक को चुनने के लिए इन कारकों का ध्यान रखना आवश्यक है।
फ़ाइल संकुचन एक प्रक्रिया है जो फ़ाइल या फ़ाइलों का आकार घटाती है, आमतौर पर संग्रहण स्थान को बचाने या नेटवर्क पर संचार को तेज करने के लिए।
फ़ाइल संकुचन डाटा में रिडंडेंसी की पहचान और हटाने के द्वारा काम करता है। यह एल्गोरिदम का उपयोग करके मूल डेटा को एक छोटे स्थान में कोड करता है।
फ़ाइल संकुचन के दो मुख्य प्रकार हैं - नुकसान रहित और नुकसानदायक संकुचन। नुकसान रहित संकुचन की अनुमति है कि मूल फ़ाइल को पूरी तरह से बहाल किया जा सके, जबकि नुकसानदायक संकुचन डेटा की गुणवत्ता में कुछ हानि की लागत पर अधिक आकार घटाव की अनुमति देता है।
फाइल संकुचन उपकरण का एक लोकप्रिय उदाहरण WinZip है, जो ZIP और RAR सहित कई संकुचन प्रारूपों का समर्थन करता है।
नुकसान रहित संकुचन के साथ, गुणवत्ता अपरिवर्तित रहती है। हालांकि, नुकसानदायक संकुचन के साथ, फ़ाइल का आकार अधिक ध्यान से घटाने के लिए कुछ कम महत्वपूर्ण डेटा को हटाने के कारण गुणवत्ता में ध्यान देने योग्य कमी हो सकती है।
हां, डेटा संरक्षण के संबंध में फ़ाइल संकुचन सुरक्षित है, खासकर नुकसान रहित संकुचन के साथ। हालांकि, किसी भी फ़ाइल की तरह, संकुचित फ़ाइलों को मैलवेयर या वायरस के लक्ष्य के रूप में लिया जा सकता है, इसलिए यह हमेशा महत्त्वपूर्ण होता है कि प्रमुख सुरक्षा सॉफ़्टवेयर स्थापित हो।
लगभग सभी प्रकार की फ़ाइलें संकुचित की जा सकती हैं, जिसमें पाठ फ़ाइलें, चित्र, ऑडियो, वीडियो, और सॉफ़्टवेयर फ़ाइलें शामिल हैं। हालांकि, प्राप्त करने योग्य संकुचन का स्तर फ़ाइल प्रकारों के बीच महत्वपूर्ण रूप से अलग हो सकता है।
ZIP फ़ाइल एक प्रकार की फ़ाइल प्रारूप है जो नुकसान रहित संकुचन का उपयोग करके एक या अधिक फ़ाइलों के आकार को घटाती है। ZIP फ़ाइल में अनेक फ़ाइलें प्रभावी रूप से एक ही फ़ाइल में संग्रहित की जाती हैं, जो साझा करना भी आसान बनाती है।
तकनीकी रूप से, हां, हालांकि अतिरिक्त आकार घटाव न्यूनतम हो सकता है या यहां तक कि प्रतिकूल हो सकता है। पहले से संकुचित फ़ाइल को संकुचित करना कभी-कभी इसका आकार बढ़ सकता है क्योंकि संकुचन एल्गोरिदम द्वारा जोड़ी गई मेटाडाटा।
फ़ाइल को डिकम्प्रेस करने के लिए, आपको आमतौर पर एक डिकम्प्रेसन या अनज़िपिंग उपकरण की आवश्यकता होती है, जैसे WinZip या 7-Zip। ये उपकरण संपीडित प्रारूप से मूल फ़ाइलों को निकाल सकते हैं।