GNU TAR (टेप आर्काइव) फॉर्मेट यूनिक्स जैसे ऑपरेटिंग सिस्टम पर व्यापक रूप से इस्तेमाल किया जाने वाला एक फाइल आर्काइव और कंप्रेशन फॉर्मेट है। इसे मूल रूप से मैग्नेटिक टेप पर फाइलों का बैकअप लेने के लिए डिजाइन किया गया था, लेकिन अब आमतौर पर कुशल स्टोरेज और ट्रांसमिशन के लिए कई फाइलों को एक ही कंप्रेस्ड आर्काइव फाइल में इकट्ठा करने के लिए उपयोग किया जाता है। TAR फॉर्मेट फाइल एट्रिब्यूट, डायरेक्ट्री स्ट्रक्चर को संरक्षित करने की अनुमति देता है और विभिन्न कंप्रेशन एल्गोरिदम को सपोर्ट करता है।
एक TAR आर्काइव फाइल में फाइल हेडर रिकॉर्ड और फाइल डेटा ब्लॉक की एक श्रृंखला होती है। आर्काइव में प्रत्येक फाइल को एक हेडर रिकॉर्ड द्वारा दर्शाया जाता है जिसमें फाइल के बारे में मेटाडेटा होता है, उसके बाद फाइल डेटा होता है। हेडर रिकॉर्ड 512 बाइट्स का होता है और इसमें फाइल का नाम, फाइल मोड (अनुमतियाँ), स्वामी और समूह आईडी, फाइल का आकार, संशोधन समय और चेकसम जैसे फ़ील्ड होते हैं।
हेडर रिकॉर्ड में फाइल का नाम फ़ील्ड 100 वर्णों तक लंबा हो सकता है। यदि कोई फ़ाइल का नाम 100 वर्णों से अधिक है, तो इसे 'उपसर्ग' फ़ील्ड का उपयोग करके संग्रहीत किया जाता है, जो अतिरिक्त 155 बाइट्स का होता है। पूर्ण पथ बनाने के लिए उपसर्ग को फ़ाइल के नाम के साथ जोड़ा जाता है। फ़ाइल मोड फ़ील्ड में यूनिक्स फ़ाइल अनुमतियाँ और फ़ाइल प्रकार (नियमित फ़ाइल, निर्देशिका, प्रतीकात्मक लिंक, आदि) होते हैं।
हेडर रिकॉर्ड के बाद फ़ाइल डेटा होता है, जिसे सन्निहित 512-बाइट ब्लॉक में संग्रहीत किया जाता है। यदि फ़ाइल का आकार 512 बाइट्स का गुणक नहीं है, तो अंतिम ब्लॉक को नल बाइट्स से भरा जाता है। प्रत्येक फ़ाइल के डेटा ब्लॉक को आर्का इव में क्रमिक रूप से लिखा जाता है, जिसमें फ़ाइलों के बीच कोई विभाजक या सीमांकक नहीं होता है।
TAR आर्काइव नियमित फ़ाइलों और निर्देशिकाओं के अतिरिक्त कई प्रकार के हेडर रिकॉर्ड का समर्थन करते हैं। प्रतीकात्मक लिंक और हार्ड लिंक को विशेष हेडर रिकॉर्ड का उपयोग करके दर्शाया जाता है जो लक्ष्य फ़ाइल को संदर्भित करते हैं। डिवाइस फ़ाइलें, नामित पाइप और अन्य विशेष फ़ाइल प्रकार भी समर्थित हैं। विस्तारित विशेषताएँ और ACL को पैक्स इंटरचेंज फॉर्मेट हेडर का उपयोग करके संग्रहीत किया जा सकता है।
TAR फॉर्मेट की एक प्रमुख विशेषता लंबे फ़ाइल नामों और पथों के लिए इसका समर्थन है। TAR के शुरुआती संस्करण 100-वर्ण फ़ाइल नामों तक सीमित थे, लेकिन बाद के संस्करणों, जैसे कि व्यापक रूप से उपयोग किए जाने वाले USTAR (यूनिक्स स्टैंडर्ड TAR) फॉर्मेट ने इसे लंबे नामों का समर्थन करने के लिए विस्तारित किया। POSIX.1-2001 मानक ने ए क नया एक्स्टेंसिबल फॉर्मेट पेश किया जो और भी लंबे फ़ाइल नामों और पथों के साथ-साथ अतिरिक्त मेटाडेटा फ़ील्ड की अनुमति देता है।
फ़ाइल के आकार को कम करने के लिए TAR आर्काइव के साथ आमतौर पर कंप्रेशन का उपयोग किया जाता है। सबसे लोकप्रिय कंप्रेशन विधियाँ gzip (.tar.gz या .tgz), bzip2 (.tar.bz2) और xz (.tar.xz) हैं। ये कंप्रेस्ड TAR आर्काइव पहले एक नियमित TAR आर्काइव बनाकर और फिर इसे चुने हुए कंप्रेशन एल्गोरिदम से कंप्रेस करके बनाए जाते हैं। कंप्रेस्ड TAR आर्काइव को निकालते समय, पहले कंप्रेशन को हटाया जाता है, और फिर नियमित TAR निष्कर्षण प्रक्रिया लागू की जाती है।
TAR फॉर्मेट में बिल्ट-इन त्रुटि का पता लगाने और पुनर्प्राप्ति तंत्र भी शामिल हैं। प्रत्येक हेडर रिकॉर्ड में एक चेकसम फ़ील्ड होता है जिसकी गणना तब की जाती है जब आर्काइव बनाया जाता है। TAR आर्काइव से फ़ाइलें निकालते समय, डेटा अखंडता सुनिश्चित करने के लिए चेकसम को सत्यापित किया जाता है। यदि चेकसम बेमेल का पता चलता है, तो एक त्रुटि रिपोर्ट की जाती है, और निष्कर्षण या तो प्रभावित फ़ाइल को छोड़ सकता है या यथासंभव अधिक डेटा पुनर्प्राप्त करने का प्रयास कर सकता है।
मूल TAR फॉर्मेट के अतिरिक्त, उपयोग में कई भिन्नताएँ और एक्सटेंशन हैं। TAR का GNU संस्करण, जो लिनक्स वितरणों में व्यापक रूप से उपयोग किया जाता है, में मल्टी-वॉल्यूम आर्काइव, स्पार्स फ़ाइल समर्थन और वृद्धिशील बैकअप जैसी अतिरिक्त विशेषताएँ शामिल हैं। स्टार और पैक्स जैसे अन्य एक्सटेंशन बेहतर प्रदर्शन, गैर-यूनिक्स सिस्टम के साथ संगतता और विस्तारित मेटाडेटा के लिए समर्थन प्रदान करते हैं।
अपनी उम्र और सीमाओं के बावजूद, TAR फॉर्मेट विभिन्न प्लेटफॉर्म और टूल पर अपनी सादगी, पोर्टेबिलिटी और व्यापक समर्थन के कारण व्यापक रूप से उपयोग किया जाता है। यह कई उच्च-स्तरीय बैकअप और आर्काइविंग समाधानो ं की नींव के रूप में कार्य करता है, और अक्सर सॉफ़्टवेयर पैकेज और सोर्स कोड वितरित करने के लिए एक कंटेनर फॉर्मेट के रूप में उपयोग किया जाता है। जैसे-जैसे नई तकनीकें और स्टोरेज मीडिया उभरे हैं, TAR फॉर्मेट बदलती जरूरतों को पूरा करने के लिए अनुकूलित और विकसित हुआ है, आधुनिक कंप्यूटिंग वातावरण में इसकी निरंतर प्रासंगिकता सुनिश्चित करता है।
फ़ाइल संपीड़न एक प्रक्रिया है जो डेटा फ़ाइलों के आकार को कुशलता के लिए कम करती है। इसका उपयोग विभिन्न एल्गोरिदमों का उपयोग करके डेटा को संकुचित करने के लिए होता है, जो अक्सर डेटा के आकार को मूल जानकारी के बिना चौंकसी से कम करता है।
फ़ाइल संपीड़न के दो मुख्य प्रकार हैं: नुकसानरहित और नुकसानदायक। जहाँ हर बिट डेटा महत्वपूर्ण हो, वहां नुकसानरहित संपीड़न की अनुमति देता है कि मूल डेटा को संपीडित डेटा से सही रूप से पुनर् निर्माण किया जा सके, जैसे कि पाठ या डेटाबेस फ़ाइलें। आम उदाहरण में ZIP और RAR फ़ाइल फ़ॉर्मेट्स शामिल हैं। दूसरी ओर, नुकसानदायक संपीड़न अधिक महत्वपूर्ण डेटा को हटाकर फ़ाइल आकार को अधिक गहराई से कम करता है, जो अक्सर ऑडियो, वीडियो, और चित्र फ़ाइलों में इस्तेमाल होता है। JPEGs और MP3s उन उदाहरणों में हैं जहां कुछ डेटा हानि सामग्री की अनुभूति गुणवत्ता को महत्वपूर्ण रूप से घटा नहीं सकती है।
फ़ाइल संपीड़न कई तरीकों से लाभकारी होता है। यह उपकरणों और सर्वरों पर संग्रहण स्थान की बचत करता है, लागत को कम करता है और कुशलता को बढ़ाता है। यह नेटवर्कों, इंटरनेट सहित, पर फ़ाइल स्थानांतरण समय को तेज करता है, जो विशेष रूप से बड़ी फ़ाइलों के लिए महत्वपूर्ण है। साथ ही, संपीड़ित फ़ाइलें एक आर्काइव फ़ाइल में एकत्र की जा सकती हैं, जो संगठनात्मक और आसानी से परिवहन के लिए सहायता देता है।
हालांकि, फ़ाइल संपीड़न में कुछ नकारात्मक पहलू भी होते हैं। संपीड़न और विस्तारण प्रक्रिया के लिए संगणकीय संसाधनों की आवश्यकता होती है, जो विशेष रूप से बड़ी फ़ाइलों के लिए सिस्टम की प्रदर्शन को धीमा कर सकता है। साथ ही, नुकसानदायक संपीड़न के मामले में, कुछ मूल डेटा संपीड़न के दौरान खो जाता है, और परिणामस्वरूप गुणवत्ता सभी उपयोगों के लिए स्वीकार्य नहीं हो सकती है, विशेषकर उन पेशेवर अनुप्रयोगों के लिए जो उच्च गुणवत्ता मांगते हैं।
फ़ाइल संपीड़न आज की डिजिटल दुनिया में एक महत्वपूर्ण उपकरण है। इसने कुशलता में सुधार किया, संग्रहण स्थान की बचत की और डाउनलोड और अपलोड समयों को घटाया। फिर भी, यह स्वयं की सिस्टम प्रदर्शन और गुणवत्ता हानि की जोखिम लाता है। इसलिए, विशेष डेटा आवश्यकताओं के लिए सही संपीड़न तकनीक को चुनने के लिए इन कारकों का ध्यान रखना आवश्यक है।
फ़ाइल संकुचन एक प्रक्रिया है जो फ़ाइल या फ़ाइलों का आकार घटाती है, आमतौर पर संग्रहण स्थान को बचाने या नेटवर्क पर संचार को तेज करने के लिए।
फ़ाइल संकुचन डाटा में रिडंडेंसी की पहचान और हटाने के द्वारा काम करता है। यह एल्गोरिदम का उपयोग करके मूल डेटा को एक छोटे स्थान में कोड करता है।
फ़ाइल संकुचन के दो मुख्य प्रकार हैं - नुकसान रहित और नुकसानदायक संकुचन। नुकसान रहित संकुचन की अनुमति है कि मूल फ़ाइल को पूरी तरह से बहाल किया जा सके, जबकि नुकसानदायक संकुचन डेटा की गुणवत्ता में कुछ हानि की लागत पर अधिक आकार घटाव की अनुमति देता है।
फाइल संकुचन उपकरण का एक लोकप्रिय उदाहरण WinZip है, जो ZIP और RAR सहित कई संकुचन प्रारूपों का समर्थन करता है।
नुकसान रहित संकुचन के साथ, गुणवत्ता अपरिवर्तित रहती है। हालांकि, नुकसानदायक संकुचन के साथ, फ़ाइल का आकार अधिक ध्यान से घटाने के लिए कुछ कम महत्वपूर्ण डेटा को हटाने के कारण गुणवत्ता में ध्यान देने योग्य कमी हो सकती है।
हां, डेटा संरक्षण के संबंध में फ़ाइल संकुचन सुरक्षित है, खासकर नुकसान रहित संकुचन के साथ। हालांकि, किसी भी फ़ाइल की तरह, संकुचित फ़ाइलों को मैलवेयर या वायरस के लक्ष्य के रूप में लिया जा सकता है, इसलिए यह हमेशा महत्त्वपूर्ण होता है कि प्रमुख सुरक्षा सॉफ़्टवेयर स्थापित हो।
लगभग सभी प्रकार की फ़ाइलें संकुचित की जा सकती हैं, जिसमें पाठ फ़ाइलें, चित्र, ऑडियो, वीडियो, और सॉफ़्टवेयर फ़ाइलें शामिल हैं। हालांकि, प्राप्त करने योग्य संकुचन का स्तर फ़ाइल प्रकारों के बीच महत्वपूर्ण रूप से अलग हो सकता है।
ZIP फ़ाइल एक प्रकार की फ़ाइल प्रारूप है जो नुकसान रहित संकुचन का उपयोग करके एक या अधिक फ़ाइलों के आकार को घटाती है। ZIP फ़ाइल में अनेक फ़ाइलें प्रभावी रूप से एक ही फ़ाइल में संग्रहित की जाती हैं, जो साझा करना भी आसान बनाती है।
तकनीकी रूप से, हां, हालांकि अतिरिक्त आकार घटाव न्यूनतम हो सकता है या यहां तक कि प्रतिकू ल हो सकता है। पहले से संकुचित फ़ाइल को संकुचित करना कभी-कभी इसका आकार बढ़ सकता है क्योंकि संकुचन एल्गोरिदम द्वारा जोड़ी गई मेटाडाटा।
फ़ाइल को डिकम्प्रेस करने के लिए, आपको आमतौर पर एक डिकम्प्रेसन या अनज़िपिंग उपकरण की आवश्यकता होती है, जैसे WinZip या 7-Zip। ये उपकरण संपीडित प्रारूप से मूल फ़ाइलों को निकाल सकते हैं।