निकालें WARC

असीमित कार्य। फ़ाइल साइज़ अधिकतम 2.5GB। मुफ्त, हमेशा के लिए।

निजी और सुरक्षित

सब कुछ आपके ब्राउज़र में होता है। आपकी फ़ाइलें हमारे सर्वर को कभी नहीं छूती हैं।

अत्यंत तेज़

कोई अपलोडिंग नहीं, कोई प्रतीक्षा नहीं। फ़ाइल छोड़ते ही कनवर्ट करें।

वास्तव में मुफ्त

कोई खाता आवश्यक नहीं। कोई छिपी हुई लागत नहीं। कोई फ़ाइल आकार की चाल नहीं।

WARC प्रारूप क्या है?

वेब आर्काइव

XAR (eXtensible ARchive) एक फ़ाइल प्रारूप है जिसे Apple Inc. ने macOS पर सॉफ़्टवेयर को बंडल करने और वितरित करने के लिए विकसित किया है। यह .pkg और .dmg जैसे पुराने प्रारूपों के प्रतिस्थापन के रूप में कार्य करता है, जो बेहतर सुरक्षा, छोटे फ़ाइल आकार और बेहतर प्रदर्शन जैसे कई लाभ प्रदान करता है। XAR फ़ाइलें .xar फ़ाइल एक्सटेंशन का उपयोग करती हैं और macOS के साथ शामिल xar कमांड-लाइन उपयोगिता का उपयोग करके बनाई और निकाली जा सकती हैं।

XAR प्रारूप XML (eXtensible Markup Language) मानक पर आधारित है। एक XAR संग्रह में तीन मुख्य घटक होते हैं: एक सामग्री तालिका (TOC) XML प्रारूप में संग्रह की सामग्री का वर्णन करती है, संग्रह में संग्रहीत वास्तविक फ़ाइलें और निर्देशिकाएँ और सुरक्षा के लिए डिजिटल हस्ताक्षर। TOC एक इंडेक्स के रूप में कार्य करता है, जो संग्रह में प्रत्येक फ़ाइल के लिए पथ, आकार और अन्य मेटाडेटा निर्दिष्ट करता है। यह XML-आधारित संरचना एक्स्टेंसिबिलिटी की अनुमति देती है, क्योंकि Apple या तृतीय पक्ष नई सुविधाओं का समर्थन करने के लिए कस्टम टैग जोड़ सकते हैं।

XAR प्रारूप का एक प्रमुख पहलू संपीड़न का उपयोग है। डिफ़ॉल्ट रूप से, XAR संग्रहीत फ़ाइलों के आकार को कम करने के लिए zlib संपीड़न का उपयोग करता है। TOC स्वयं भी संपीड़ित है। इससे .pkg जैसे पुराने प्रारूपों की तुलना में छोटे संग्रह आकार प्राप्त होते हैं, जो फ़ाइलों को असम्पीडित रूप से संग्रहीत करते हैं। हालाँकि, XAR वांछित होने पर फ़ाइलों को असम्पीडित रूप से संग्रहीत करने का भी समर्थन करता है। प्रत्येक फ़ाइल पर लागू संपीड़न को TOC में व्यक्तिगत रूप से निर्दिष्ट किया जा सकता है।

XAR संग्रह की अखंडता और प्रामाणिकता सुनिश्चित करने के लिए, प्रारूप में डिजिटल हस्ताक्षर शामिल हैं। प्रत्येक XAR फ़ाइल में एक या अधिक हस्ताक्षर शामिल होते हैं जो संपूर्ण TOC को कवर करते हैं। ये हस्ताक्षर सार्वजनिक-कुंजी क्रिप्टोग्राफ़ी का उपयोग करके बनाए जाते हैं, आमतौर पर RSA या DSA एल्गोरिदम के साथ। हस्ताक्षर प्राप्तकर्ताओं को यह सत्यापित करने की अनुमति देते हैं कि संग्रह के साथ छेड़छाड़ नहीं की गई है और यह एक विश्वसनीय स्रोत से उत्पन्न हुआ है। Apple मैक ऐप स्टोर पर सॉफ़्टवेयर अपडेट और एप्लिकेशन वितरित करने के लिए XAR हस्ताक्षरों का उपयोग करता है।

जब एक XAR संग्रह खोला जाता है, तो TOC को पहले डीकंप्रेस और पार्स किया जाता है। TOC एक निर्देशिका संरचना और फ़ाइल मेटाडेटा प्रदान करता है, जो यूनिक्स सिस्टम पर उपयोग किए जाने वाले 'tar' प्रारूप के समान है। वास्तविक फ़ाइल डेटा संग्रह में TOC के बाद संग्रहीत किया जाता है। प्रत्येक फ़ाइल का डेटा संपीड़ित या असम्पीडित हो सकता है, जैसा कि TOC में संबंधित प्रविष्टि द्वारा इंगित किया गया है। किसी फ़ाइल को निकालने के लिए, उसके डेटा को TOC से ऑफ़सेट और आकार की जानकारी का उपयोग करके स्थित किया जाता है।

XAR प्रारूप बुनियादी संग्रह से परे कई उन्नत सुविधाओं का समर्थन करता है। ऐसी ही एक विशेषता एक ही संग्रह में कई TOC शामिल करने की क्षमता है। यह वृद्धिशील अपडेट बनाने की अनुमति देता है जहां केवल बदली हुई फ़ाइलों को अपडेट संग्रह में शामिल करने की आवश्यकता होती है। कई TOC सॉफ़्टवेयर के विभिन्न संस्करणों में संग्रह की स्थिति का वर्णन कर सकते हैं। स्मार्ट अपडेटिंग तंत्र वृद्धिशील पैच को कुशलतापूर्वक लागू करने के लिए इस जानकारी का उपयोग कर सकते हैं।

इसके अतिरिक्त, XAR संग्रह संग्रहीत फ़ाइलों से जुड़े विस्तारित विशेषताओं और एक्सेस कंट्रोल सूचियों (ACL) को संग्रहीत कर सकते हैं। विस्तारित विशेषताएँ कुंजी-मान युग्म हैं जो ऐप-विशिष्ट मेटाडेटा संग्रहीत कर सकते हैं। ACL फ़ाइलों तक पहुँचने के लिए दानेदार अनुमतियाँ परिभाषित करते हैं। संग्रह में इस जानकारी को संरक्षित करके, XAR यह सुनिश्चित करता है कि लक्ष्य प्रणाली पर निकाले जाने पर मूल फ़ाइल विशेषताएँ पुनर्स्थापित हो जाती हैं।

XAR प्रारूप में कोड हस्ताक्षर के लिए प्रावधान भी शामिल हैं। TOC को कवर करने वाले संग्रह-स्तरीय हस्ताक्षरों के अतिरिक्त, संग्रह के भीतर अलग-अलग फ़ाइलों के अपने हस्ताक्षर हो सकते हैं। यह सॉफ़्टवेयर घटकों को वितरित करने के लिए उपयोगी है जिन्हें स्वतंत्र रूप से सत्यापित करने की आवश्यकता होती है। उदाहरण के लिए, एक प्लगइन आर्किटेक्चर यह सुनिश्चित करने के लिए कोड हस्ताक्षर का उपयोग कर सकता है कि किसी एप्लिकेशन द्वारा केवल विश्वसनीय प्लगइन लोड किए जाते हैं।

XAR की एक अन्य विशेषता हार्ड लिंक को संग्रहीत करने की इसकी क्षमता है। हार्ड लिंक कई निर्देशिका प्रविष्टियों को डिस्क पर एक ही फ़ाइल डेटा को संदर्भित करने की अनुमति देते हैं। XAR TOC में, हार्ड लिंक को विशेष XML तत्वों का उपयोग करके दर्शाया जाता है जो मूल फ़ाइल प्रविष्टि की ओर इशारा करते हैं। जब संग्रह निकाला जाता है, तो हार्ड लिंक को फिर से बनाया जाता है, डिस्क स्थान को संरक्षित किया जाता है और मूल निर्देशिका संरचना को बनाए रखा जाता है।

XAR संग्रह के साथ प्रोग्रामेटिक रूप से काम करने के लिए, डेवलपर्स xar कमांड-लाइन टूल या libxar जैसी लाइब्रेरी का उपयोग कर सकते हैं। xar टूल XAR संग्रह बनाने, निकालने और हेरफेर करने के लिए कमांड प्रदान करता है। यह संपीड़न, हस्ताक्षर और सत्यापन के लिए विभिन्न विकल्पों का समर्थन करता है। Libxar एक C लाइब्रेरी है जो XAR प्रारूप को लागू करती है और XAR संग्रह को पढ़ने और लिखने के लिए एक API प्रदान करती है। यह डेवलपर्स को अपने स्वयं के अनुप्रयोगों में XAR समर्थन को एकीकृत करने की अनुमति देता है।

सारांश में, XAR प्रारूप macOS पर सॉफ़्टवेयर पैकेजिंग और वितरण के लिए एक आधुनिक और एक्स्टेंसिबल दृष्टिकोण प्रदान करता है। सामग्री तालिका के लिए XML का उपयोग, छोटे फ़ाइल आकार के लिए संपीड़न, सुरक्षा के लिए डिजिटल हस्ताक्षर और वृद्धिशील अपडेट और कोड हस्ताक्षर जैसी उन्नत सुविधाओं के लिए समर्थन इसे डेवलपर्स और सिस्टम प्रशासकों के लिए एक शक्तिशाली उपकरण बनाता है। जैसे-जैसे Apple प्रारूप में सुधार और प्रचार करना जारी रखता है, XAR macOS पर सॉफ़्टवेयर वितरण के लिए मानक बनने की संभावना है।

फ़ाइल कंप्रेशन রিডन्डेंसी को कम करता है ताकि वही जानकारी कम बिट्स ले। आप कितनी दूर जा सकते हैं इसकी ऊपरी सीमा सूचना सिद्धांत द्वारा नियंत्रित होती है: दोषरहित कंप्रेशन के लिए, सीमा स्रोत की एन्ट्रॉपी है (शैनन का स्रोत कोडिंग प्रमेय और उनका मूल 1948 का पेपर “संचार का एक गणितीय सिद्धांत”देखें)। दोषपूर्ण कंप्रेशन के लिए, दर और गुणवत्ता के बीच का ट्रेड-ऑफ दर-विरूपण सिद्धांत द्वारा कब्जा कर लिया गया है।

दो स्तंभ: मॉडलिंग और कोडिंग

अधिकांश कंप्रेशर्स के दो चरण होते हैं। सबसे पहले, एक मॉडल डेटा में संरचना की भविष्यवाणी करता है या उजागर करता है। दूसरा, एक कोडर उन भविष्यवाणियों को लगभग-इष्टतम बिट पैटर्न में बदल देता है। एक क्लासिक मॉडलिंग परिवार लेम्पेल-ज़िव है: LZ77 (1977) और LZ78 (1978) बार-बार आने वाले सबस्ट्रिंग का पता लगाते हैं और कच्चे बाइट्स के बजाय संदर्भ उत्सर्जित करते हैं। कोडिंग पक्ष पर, हफमैन कोडिंग (मूल पेपर देखें 1952) अधिक संभावित प्रतीकों को छोटे कोड प्रदान करता है। अरिथमैटिक कोडिंग और रेंज कोडिंग बारीक-बारीक विकल्प हैं जो एन्ट्रॉपी सीमा के करीब निचोड़ते हैं, जबकि आधुनिक असममित अंक प्रणाली (ANS) तेज तालिका-चालित कार्यान्वयन के साथ समान कंप्रेशन प्राप्त करता है।

आम प्रारूप वास्तव में क्या करते हैं

DEFLATE (gzip, zlib, और ZIP द्वारा उपयोग किया जाता है) LZ77 को हफमैन कोडिंग के साथ जोड़ता है। इसके स्पेक्स सार्वजनिक हैं: DEFLATE RFC 1951, zlib रैपर RFC 1950, और gzip फ़ाइल प्रारूप RFC 1952. Gzip स्ट्रीमिंग के लिए बनाया गया है और स्पष्ट रूप से यादृच्छिक पहुँच प्रदान करने का प्रयास नहीं करता है. PNG छवियां DEFLATE को अपनी एकमात्र कंप्रेशन विधि के रूप में मानकीकृत करती हैं (अधिकतम 32 KiB विंडो के साथ), PNG स्पेक के अनुसार “संपीड़न विधि 0… डिफ्लेट/इन्फ्लेट… अधिकतम 32768 बाइट्स” और W3C/ISO PNG दूसरा संस्करण.

Zstandard (zstd): एक नया सामान्य-उद्देश्य कंप्रेसर है जिसे बहुत तेज डीकंप्रेसन के साथ उच्च अनुपात के लिए डिज़ाइन किया गया है। प्रारूप RFC 8878 (यह भी HTML मिरर) और संदर्भ स्पेक GitHub परमें प्रलेखित है। Gzip की तरह, मूल फ्रेम यादृच्छिक पहुँच का लक्ष्य नहीं रखता है. zstd की महाशक्तियों में से एक शब्दकोश है: आपके कॉर्पस से छोटे नमूने जो कई छोटी या समान फ़ाइलों पर संपीड़न में नाटकीय रूप से सुधार करते हैं (देखें python-zstandard शब्दकोश डॉक्स और निगेल ताओ का काम किया हुआ उदाहरण)। कार्यान्वयन “असंरचित” और “संरचित” दोनों शब्दकोशों को स्वीकार करते हैं (चर्चा).

Brotli: वेब सामग्री के लिए अनुकूलित (जैसे, WOFF2 फोंट, HTTP)। यह एक स्थिर शब्दकोश को एक DEFLATE-जैसे LZ+एन्ट्रॉपी कोर के साथ मिलाता है। स्पेक RFC 7932है, जो 2WBITS−16 की एक स्लाइडिंग विंडो को भी नोट करता है जिसमें WBITS [10, 24] (1 KiB−16 B से 16 MiB−16 B तक) में है और यह यादृच्छिक पहुँच का प्रयास नहीं करता है. Brotli अक्सर वेब टेक्स्ट पर gzip को मात देता है जबकि जल्दी से डीकोड करता है।

ZIP कंटेनर: ZIP एक फ़ाइल संग्रह है जो विभिन्न संपीड़न विधियों (deflate, store, zstd, आदि) के साथ प्रविष्टियों को संग्रहीत कर सकता है। वास्तविक मानक PKWARE का APPNOTE है (देखें APPNOTE पोर्टल, एक होस्ट की गई प्रति, और LC अवलोकन ज़िप फ़ाइल प्रारूप (PKWARE) / ज़िप 6.3.3).

गति बनाम अनुपात: प्रारूप कहाँ उतरते हैं

LZ4 मामूली अनुपात के साथ कच्ची गति को लक्षित करता है। इसकी परियोजना पृष्ठ (“अत्यंत तेज संपीड़न”) और फ्रेम प्रारूपदेखें। यह इन-मेमोरी कैश, टेलीमेट्री, या हॉट पाथ के लिए आदर्श है जहां डीकंप्रेसन को रैम की गति के करीब होना चाहिए।

XZ / LZMA अपेक्षाकृत धीमी संपीड़न के साथ घनत्व (महान अनुपात) के लिए धक्का देते हैं। XZ एक कंटेनर है; भारी उठाने का काम आमतौर पर LZMA/LZMA2 (LZ77-जैसा मॉडलिंग + रेंज कोडिंग) द्वारा किया जाता है। देखें .xz फ़ाइल प्रारूप, LZMA स्पेक (पावलोव), और लिनक्स कर्नेल नोट्स XZ एंबेडेड पर. XZ आमतौर पर gzip को आउट-कंप्रेस करता है और अक्सर उच्च-अनुपात वाले आधुनिक कोडेक्स के साथ प्रतिस्पर्धा करता है, लेकिन धीमी एन्कोड समय के साथ।

bzip2 बरोज़-व्हीलर ट्रांसफ़ॉर्म (BWT), मूव-टू-फ्रंट, RLE, और हफ़मैन कोडिंग लागू करता है। यह आमतौर पर gzip से छोटा लेकिन धीमा होता है; देखें आधिकारिक मैनुअल और मैन पेज (लिनक्स).

विंडोज़, ब्लॉक और रैंडम एक्सेस

“विंडो का आकार” मायने रखता है। DEFLATE संदर्भ केवल 32 KiB पीछे देख सकते हैं (RFC 1951 और PNG की 32 KiB कैप यहाँ उल्लेख किया गया है)। ब्रोटली की विंडो लगभग 1 KiB से 16 MiB तक होती है (RFC 7932). Zstd स्तर के अनुसार विंडो और खोज गहराई को ट्यून करता है (RFC 8878). बेसिक gzip/zstd/brotli स्ट्रीम अनुक्रमिक डिकोडिंग के लिए डिज़ाइन किए गए हैं; आधार प्रारूप रैंडम एक्सेस का वादा नहीं करते हैं, हालांकि कंटेनर (जैसे, टार इंडेक्स, चंक्ड फ्रेमिंग, या प्रारूप-विशिष्ट इंडेक्स) इसे परत कर सकते हैं।

दोषरहित बनाम दोषपूर्ण

उपरोक्त प्रारूप दोषरहित हैं: आप सटीक बाइट्स का पुनर्निर्माण कर सकते हैं। मीडिया कोडेक्स अक्सर दोषपूर्ण होते हैं: वे कम बिटरेट हिट करने के लिए अगोचर विवरण को त्याग देते हैं। छवियों में, क्लासिक जेपीईजी (डीसीटी, क्वांटिज़ेशन, एन्ट्रॉपी कोडिंग) ITU-T T.81 / ISO/IEC 10918-1में मानकीकृत है। ऑडियो में, एमपी3 (MPEG-1 लेयर III) और एएसी (MPEG-2/4) अवधारणात्मक मॉडल और एमडीसीटी ट्रांसफ़ॉर्म पर निर्भर करते हैं (देखें ISO/IEC 11172-3, ISO/IEC 13818-7, और एक एमडीसीटी अवलोकन यहाँ)। दोषपूर्ण और दोषरहित सह-अस्तित्व में हो सकते हैं (जैसे, यूआई संपत्ति के लिए पीएनजी; छवियों/वीडियो/ऑडियो के लिए वेब कोडेक्स)।

व्यावहारिक सुझाव

  • काम के लिए चुनें। वेब टेक्स्ट और फोंट: brotli. सामान्य फ़ाइलें और बैकअप: zstd (शानदार डीकंप्रेसन गति और अनुपात के लिए समय का व्यापार करने के स्तर)। अल्ट्रा-फास्ट पाइप और टेलीमेट्री: lz4. लंबी अवधि के अभिलेखागार के लिए अधिकतम घनत्व जहां एन्कोड समय ठीक है: xz/LZMA.
  • छोटी फ़ाइलें? zstd (डॉक्स) / (उदाहरण)के साथ शब्दकोशों को प्रशिक्षित और शिप करें। वे दर्जनों छोटी, समान वस्तुओं को नाटकीय रूप से सिकोड़ सकते हैं।
  • अंतरसंचालनीयता। कई फ़ाइलों का आदान-प्रदान करते समय, एक कंटेनर (ZIP, tar) और एक कंप्रेसर को प्राथमिकता दें। ज़िप का APPNOTE विधि आईडी और सुविधाओं को परिभाषित करता है; देखें PKWARE APPNOTE और LC अवलोकन यहाँ.
  • अपने डेटा पर मापें। अनुपात और गति कॉर्पस के अनुसार भिन्न होती है। कई रेपो बेंचमार्क प्रकाशित करते हैं (जैसे, LZ4 का README सिलेसिया कॉर्पस यहाँका हवाला देता है), लेकिन हमेशा स्थानीय रूप से मान्य करें।

मुख्य संदर्भ (गहरी गोता)

सिद्धांत: शैनन 1948 · दर-विरूपण · कोडिंग: हफमैन 1952 · अरिथमैटिक कोडिंग · रेंज कोडिंग · ANS. प्रारूप: DEFLATE · zlib · gzip · Zstandard · Brotli · LZ4 फ्रेम · XZ प्रारूप. BWT स्टैक: बरोज़-व्हीलर (1994) · bzip2 मैनुअल. मीडिया: जेपीईजी T.81 · एमपी3 ISO/IEC 11172-3 · एएसी ISO/IEC 13818-7 · एमडीसीटी.

निष्कर्ष: एक कंप्रेसर चुनें जो आपके डेटा और बाधाओं से मेल खाता हो, वास्तविक इनपुट पर मापें, और शब्दकोशों और स्मार्ट फ्रेमिंग से होने वाले लाभों को न भूलें। सही जोड़ी के साथ, आप प्राप्त कर सकते हैं छोटी फाइलें, तेज स्थानान्तरण, और तेज ऐप्स - शुद्धता या पोर्टेबिलिटी का त्याग किए बिना।

अक्सर पूछे जाने वाले प्रश्न

फाइल संकुचन क्या है?

फ़ाइल संकुचन एक प्रक्रिया है जो फ़ाइल या फ़ाइलों का आकार घटाती है, आमतौर पर संग्रहण स्थान को बचाने या नेटवर्क पर संचार को तेज करने के लिए।

फाइल संकुचन कैसे काम करता है?

फ़ाइल संकुचन डाटा में रिडंडेंसी की पहचान और हटाने के द्वारा काम करता है। यह एल्गोरिदम का उपयोग करके मूल डेटा को एक छोटे स्थान में कोड करता है।

फाइल संकुचन के कौन से प्रकार हैं?

फ़ाइल संकुचन के दो मुख्य प्रकार हैं - नुकसान रहित और नुकसानदायक संकुचन। नुकसान रहित संकुचन की अनुमति है कि मूल फ़ाइल को पूरी तरह से बहाल किया जा सके, जबकि नुकसानदायक संकुचन डेटा की गुणवत्ता में कुछ हानि की लागत पर अधिक आकार घटाव की अनुमति देता है।

फाइल संकुचन उपकरण का उदाहरण क्या है?

फाइल संकुचन उपकरण का एक लोकप्रिय उदाहरण WinZip है, जो ZIP और RAR सहित कई संकुचन प्रारूपों का समर्थन करता है।

क्या फाइल संकुचन फ़ाइलों की गुणवत्ता को प्रभावित करता है?

नुकसान रहित संकुचन के साथ, गुणवत्ता अपरिवर्तित रहती है। हालांकि, नुकसानदायक संकुचन के साथ, फ़ाइल का आकार अधिक ध्यान से घटाने के लिए कुछ कम महत्वपूर्ण डेटा को हटाने के कारण गुणवत्ता में ध्यान देने योग्य कमी हो सकती है।

क्या फाइल संकुचन सुरक्षित है?

हां, डेटा संरक्षण के संबंध में फ़ाइल संकुचन सुरक्षित है, खासकर नुकसान रहित संकुचन के साथ। हालांकि, किसी भी फ़ाइल की तरह, संकुचित फ़ाइलों को मैलवेयर या वायरस के लक्ष्य के रूप में लिया जा सकता है, इसलिए यह हमेशा महत्त्वपूर्ण होता है कि प्रमुख सुरक्षा सॉफ़्टवेयर स्थापित हो।

कौन सी फ़ाइलों को संकुचित किया जा सकता है?

लगभग सभी प्रकार की फ़ाइलें संकुचित की जा सकती हैं, जिसमें पाठ फ़ाइलें, चित्र, ऑडियो, वीडियो, और सॉफ़्टवेयर फ़ाइलें शामिल हैं। हालांकि, प्राप्त करने योग्य संकुचन का स्तर फ़ाइल प्रकारों के बीच महत्वपूर्ण रूप से अलग हो सकता है।

ZIP फ़ाइल से क्या मतलब है?

ZIP फ़ाइल एक प्रकार की फ़ाइल प्रारूप है जो नुकसान रहित संकुचन का उपयोग करके एक या अधिक फ़ाइलों के आकार को घटाती है। ZIP फ़ाइल में अनेक फ़ाइलें प्रभावी रूप से एक ही फ़ाइल में संग्रहित की जाती हैं, जो साझा करना भी आसान बनाती है।

क्या मैं पहले से संकुचित फ़ाइल को दोबारा संकुचित कर सकता हूँ?

तकनीकी रूप से, हां, हालांकि अतिरिक्त आकार घटाव न्यूनतम हो सकता है या यहां तक कि प्रतिकूल हो सकता है। पहले से संकुचित फ़ाइल को संकुचित करना कभी-कभी इसका आकार बढ़ सकता है क्योंकि संकुचन एल्गोरिदम द्वारा जोड़ी गई मेटाडाटा।

मैं फाइल को कैसे डिकम्प्रेस कर सकता हूं?

फ़ाइल को डिकम्प्रेस करने के लिए, आपको आमतौर पर एक डिकम्प्रेसन या अनज़िपिंग उपकरण की आवश्यकता होती है, जैसे WinZip या 7-Zip। ये उपकरण संपीडित प्रारूप से मूल फ़ाइलों को निकाल सकते हैं।