GNU TAR (টেপ আর্কাইভ) ফরম্যাট হল ইউনিক্স-জাতীয় অপারেটিং সিস্টেমে ব্যাপকভাবে ব্যবহৃত একটি ফাইল আর্কাইভ এবং কম্প্রেশন ফরম্যাট। এটি মূলত ম্যাগনেটিক টেপে ফাইল ব্যাকআপ করার জন্য ডিজাইন করা হয়েছিল, কিন্তু এখন সাধারণত দক্ষ স্টোরেজ এবং ট্রান্সমিশনের জন্য একাধিক ফাইলকে একটি একক কম্প্রেসড আর্কাইভ ফাইলে সংগ্রহ করার জন্য ব্যবহৃত হয়। TAR ফরম্যাট ফাইল অ্যাট্রিবিউট, ডিরেক্টরি স্ট্রাকচার সংরক্ষণের অনুমতি দেয় এবং বিভিন্ন কম্প্রেশন অ্যালগরিদমকে সমর্থন করে।
একটি TAR আর্কাইভ ফাইল ফাইল হেডার রেকর্ড এবং ফাইল ডেটা ব্লকের একটি সিরিজ নিয়ে গঠিত। আর্কাইভের প্রতিটি ফাইল একটি হেডার রেকর্ড দ্বারা উপস্থাপিত হয় যা ফাইল সম্পর্কে মেটাডেটা ধারণ করে, তা রপরে ফাইল ডেটা নিজেই থাকে। হেডার রেকর্ডটি 512 বাইট আকারের এবং ফাইলের নাম, ফাইল মোড (অনুমতি), মালিক এবং গ্রুপ আইডি, ফাইলের আকার, সংশোধন সময় এবং চেকসামের মতো ক্ষেত্রগুলি ধারণ করে।
হেডার রেকর্ডে ফাইলের নামের ক্ষেত্রটি সর্বাধিক 100 অক্ষর দীর্ঘ হতে পারে। যদি কোনও ফাইলের নাম 100 অক্ষর ছাড়িয়ে যায়, তবে এটি 'প্রিফিক্স' ক্ষেত্রটি ব্যবহার করে সংরক্ষণ করা হয়, যা অতিরিক্ত 155 বাইট। পূর্ণ পাথ তৈরি করতে প্রিফিক্সটি ফাইলের নামের সাথে সংযুক্ত করা হয়। ফাইল মোড ক্ষেত্রটি ইউনিক্স ফাইল অনুমতি এবং ফাইলের ধরন (নियमিত ফাইল, ডিরেক্টরি, প্রতীকী লিঙ্ক ইত্যাদি) ধারণ করে।
হেডার রেকর্ডের পরে ফাইল ডেটা থাকে, যা সংলগ্ন 512-বাইট ব্লকে সংরক্ষণ করা হয়। যদি ফাইলের আকার 512 বাইটের গুণিতক না হয়, তবে শেষ ব্লকটি নাল বাইট দ্বারা প্যাড করা হয়। প্রতিটি ফাইলের ডেটা ব্লকগুলি আর্কাইভে ক্রমানুসারে লেখা হয়, ফাইলগুলির মধ্য ে কোনও পৃথককারী বা সীমাবদ্ধকারী নেই।
TAR আর্কাইভগুলি নিয়মিত ফাইল এবং ডিরেক্টরি ছাড়াও বিভিন্ন ধরনের হেডার রেকর্ডকে সমর্থন করে। প্রতীকী লিঙ্ক এবং হার্ড লিঙ্কগুলি লক্ষ্য ফাইলকে রেফারেন্স করে এমন বিশেষ হেডার রেকর্ড ব্যবহার করে উপস্থাপিত হয়। ডিভাইস ফাইল, নামযুক্ত পাইপ এবং অন্যান্য বিশেষ ফাইলের ধরনও সমর্থিত। প্যাক্স ইন্টারচেঞ্জ ফরম্যাট হেডার ব্যবহার করে বর্ধিত অ্যাট্রিবিউট এবং ACL গুলি সংরক্ষণ করা যেতে পারে।
TAR ফরম্যাটের একটি মূল বৈশিষ্ট্য হল দীর্ঘ ফাইলের নাম এবং পাথের জন্য এর সমর্থন। TAR এর প্রাথমিক সংস্করণগুলি 100-অক্ষরের ফাইলের নামে সীমাবদ্ধ ছিল, তবে পরবর্তী সংস্করণগুলি, যেমন ব্যাপকভাবে ব্যবহৃত USTAR (ইউনিক্স স্ট্যান্ডার্ড TAR) ফরম্যাট, দীর্ঘ নামকে সমর্থন করার জন্য এটিকে প্রসারিত করেছে। POSIX.1-2001 স্ট্যান্ডার্ড একটি নতুন এক্সটেনসিবল ফরম্যাট চালু করেছে যা আরও দীর্ঘ ফাইলের ন াম এবং পাথের পাশাপাশি অতিরিক্ত মেটাডেটা ক্ষেত্রগুলির অনুমতি দেয়।
ফাইলের আকার কমানোর জন্য TAR আর্কাইভের সাথে সাধারণত কম্প্রেশন ব্যবহার করা হয়। সবচেয়ে জনপ্রিয় কম্প্রেশন পদ্ধতিগুলি হল গজিপ (.tar.gz বা .tgz), বিজিপ2 (.tar.bz2) এবং এক্সজেড (.tar.xz)। এই কম্প্রেসড TAR আর্কাইভগুলি প্রথমে একটি নিয়মিত TAR আর্কাইভ তৈরি করে এবং তারপরে নির্বাচিত কম্প্রেশন অ্যালগরিদম দ্বারা এটিকে কম্প্রেস করে তৈরি করা হয়। একটি কম্প্রেসড TAR আর্কাইভ বের করার সময়, প্রথমে কম্প্রেশনটি সরানো হয় এবং তারপরে নিয়মিত TAR নিষ্কাশন প্রক্রিয়াটি প্রয়োগ করা হয়।
TAR ফরম্যাটে অন্তর্নির্মিত ত্রুটি সনাক্তকরণ এবং পুনরুদ্ধারের প্রক্রিয়াগুলিও অন্তর্ভুক্ত রয়েছে। প্রতিটি হেডার রেকর্ডে একটি চেকসাম ক্ষেত্র থাকে যা আর্কাইভ তৈরি হওয়ার সময় গণনা করা হয়। একটি TAR আর্কাইভ থেকে ফাইলগুলি বের করার সময়, ডেটা অখণ্ডতা নিশ্চিত করার জন্য চেকসামটি যাচাই করা হয়। যদি একটি চেকসাম মিল না পাওয়া যায়, তবে একটি ত্রুটি রিপোর্ট করা হয় এবং নিষ্কাশনটি প্রভাবিত ফাইলটি এড়িয়ে যেতে পারে বা যতটা সম্ভব ডেটা পুনরুদ্ধার করার চেষ্টা করতে পারে।
মূল TAR ফরম্যাট ছাড়াও, ব্যবহারে বেশ কয়েকটি বৈচিত্র এবং এক্সটেনশন রয়েছে। TAR এর GNU সংস্করণ, যা লিনাক্স ডিস্ট্রিবিউশনগুলিতে ব্যাপকভাবে ব্যবহৃত হয়, এতে মাল্টি-ভলিউম আর্কাইভ, স্পার্স ফাইল সমর্থন এবং বৃদ্ধিমূলক ব্যাকআপের মতো অতিরিক্ত বৈশিষ্ট্য রয়েছে। স্টার এবং প্যাক্সের মতো অন্যান্য এক্সটেনশন উন্নত কর্মক্ষমতা, ইউনিক্স-বহির্ভূত সিস্টেমের সাথে সামঞ্জস্য এবং বর্ধিত মেটাডেটার জন্য সমর্থন অফার করে।
তার বয়স এবং সীমাবদ্ধতা সত্ত্বেও, TAR ফরম্যাট বিভিন্ন প্ল্যাটফর্ম এবং সরঞ্জাম জুড়ে এর সরলতা, পোর্টেবিলিটি এবং ব্যাপক সমর্থনের কারণে ব্যাপকভাবে ব্যবহৃত হয়। এটি অনেক উচ্চ-স্তরের ব্য
ফাইল সংকোচন হলো কোন ডেটা ফাইলের আকার সংগ্রহ অথবা সম্প্রেষণের জন্য ক্ষুদ্র করা একটি প্রক্রিয়া। এটি বিভিন্ন এলগরিদম ব্যবহার করে ডেটা সংকোচন করে অপরিহার্যতা চিহ্নিত করে এবং অপসারণ করে যা প্রায়শই মূল তথ্যগুলি হারানো ছাড়াই ডেটার আকারকে ব্যাপক ভাবে কমিয়ে দেয়।
ফাইল সংকোচনের দুটি প্রধান ধরন রয়েছে: লসলেস এবং লসি। লসলেস সংকোচন মূল ডেটা কে সংকোচিত ডেটা থেকে সম্পূর্ণভাবে পুনর্নির্মাণ করার অবকাঠামো দেয়, যা প্রতিটি ডেটা গুরুত্বপূর্ণ হিসাবে গণনা করা হয়, যেমন টেক্সট অথবা ডাটাবেস ফাইল। সাধারণ উদাহরণ হলে জিপ এবং আরএআর ফাইল ফরম্যাট। অন্যদিকে, লসি সংকোচন অগুরুত্বপূর্ণ ডেটা মুছে ফেলে ফাইলের আকারকে আরও গুরুত্ব সহকারে হ্রাস করে, যা প্রায়শই অডিও, ভিডিও এবং চিত্র ফাইলে ব্যবহৃত হয়। জেপেগস এবং এমপিথ্রি এমন উদাহরণ যেখানে কিছু ডেটা হ্রাস সামগ্রীর আপাত্তিকর গুণমান ব্যাপকভাবে ক্ষয় করে না।
ফাইল সংকোচন অনেকগুলি উপায়ে সুবিধাজনক। এটি ডিভাইস এবং সার্ভারের উপর স্টোরেজ স্পেস সংরক্ষণ করে, যা খরচ হ্রাস করে এবং কার্যক্ষমতা বাড়ায়। এটি নেটওয়ার্কের মাধ্যমে ফাইল স্থানান্তর সময়কে ত্বরান্বিত করে, যা বিশেষ গুরুত্ব সহকারে বড় ফাইলের জন্য। আরও তাই, সংকোচিত ফাইল একটি আর্কাইভ ফাইলে একত্রিত করা যেতে পারে, যা সংগঠন এবং একাধিক ফাইলের সহজ পরিবহনে সাহায্য করে।
তবে, ফাইল সংকোচনের কিছু অনুকূলতা রয়েছে। সংকোচন এবং সংকোচন মুক্তি প্রক্রিয়া গণনায়ন সম্পদ প্রয়োজন করে, যা বিশেষ করে বড় ফাইলের জন্য সিস্টেমের কার্যক্ষমতা ধীর করতে পারে। এছাড়া, লসি সংকোচনের ক্ষেত্রে, কিছু মূল ডেটা সংকোচন সময়ে হারিয়ে যায়, এবং ফলাফলের মান সমস্ত ব্যবহারের জন্য স্বীকার্য হতে পারে না, বিশেষ করে সেই পেশাদার অ্যাপ্লিকেশন যা উচ্চ মান চাই।
ফাইল সংকোচন আজকের ডিজিটাল পৃথি বীতে একটি গুরুত্বপূর্ণ সরঞ্জাম। এটি কার্যক্ষমতা বাড়ায়, স্টোরেজ স্পেস সংরক্ষণ করে এবং ডাউনলোড এবং আপলোড সময় হ্রাস করে। তবে, এর সঙ্গে সিস্টেম কার্যক্ষমতা এবং গুণগত মান হ্রাসের জোখিম বিপরীতে এটি নিজের একটি সেট নিয়ে আসে। তাই, এটি স্পেসিফিক ডেটা প্রয়োজনীয়তার জন্য সঠিক সংকোচন পদ্ধতি চয়নের ক্ষেত্রে এই ঘটনাগুলির প্রতি সচেতন হতে প্রয়োজন।
ফাইল কম্প্রেশন হলো একটি প্রক্রিয়া যা একটি বা একাধিক ফাইলের সাইজ কমানো, সাধারণত স্টোরেজ স্পেস সংরক্ষণ বা নেটওয়ার্কের মাধ্যমে সংপ্রেষণ দ্রুততর করার জন্য।
ফাইল কম্প্রেশন ডেটায় পুনরাবৃত্তিতে চিন্হিত এবং অপ সারণ এর মাধ্যমে কাজ করে। এটি অ্যালগরিদম ব্যবহার করে মূল ডেটা ক্ষুদ্র স্পেস এ এনকোড করে।
ফাইল কম্প্রেশনের দুটি প্রধান নিধিবিধিই হ্লসলস এবং লসই কম্প্রেশন। লসলেস কম্প্রেশন মূল ফাইলটি সম্পূর্ণ পুনরুদ্ধার করতে সহায়তা করে, জবাবদিহিতা লসই কম্প্রেশন ডেটা মানের কিছু হ্রাসের মূল্যায় আরও বেশি সাইজের কমানো সম্ভব।
ফাইল কম্প্রেশন সরঞ্জামের একটি জনপ্রিয় উদাহরণ হলো WinZip, যা ZIP এবং RAR সহ একাধিক কম্প্রেশন ফরম্যাট সমর্থন করে।
লসলেস কম্প্রেশনের সাথে, মান পরিবর্তন না হয়। যদিও, লসই কম্প্রেশনের সাথে, ফাইলের সাইজটি আরও উল্লেখযোগ্যভাবে হ্রাস করার জন্য কম-গুরুত্ব পূর্ণ ডেটা মুছে ফেলা যেতে পারে, তার ফলে মানে নজরদার করে নেওয়া যেতে পারে।
হ্যাঁ, ডেটা অখণ্ডতার দৃষ্টিকে নিয়ে ফাইল কম্প্রেশন নিরাপদ, বিশেষ করে লসলেস কম্প্রেশনের সাথে। যাই হোক, যেমন যেকোন ফাইল, কম্প্রেস ফাইলগুলিও ম্যালওয়ার বা ভাইরাসের লক্ষ্য হতে পারে, তাই সর্বদা সুপরিচিত নিরাপত্তি সফটওয়্যার স্থাপন করা গুরুত্বপূর্ণ।
প্রায় সমস্ত ধরনের ফাইল কম্প্রেস করা যায়, যেমন টেক্সট ফাইল, চিত্র, অডিয়ো, ভিডিও, এবং সফটওয়্যার ফাইল। যাই হোক, কম্প্রেশন সাধনযোগ্য স্তর ফাইল প্রকারের মধ্যে অনেক বেশি পরিবর্তন হতে পারে।
একটি ZIP ফাইল হলো একটি ফাইল ফরম্যাট ধরন যা লসলেস কম্প্রেশন ব্যবহার করে এক বা একাধিক ফাইলের আকার হ্রাস করে। ZIP ফাইলে মাল্টিপল ফাইলগুলি মোটামুটি একটি Single ফাইলে একত্র করে, যা শেয়ার করা সহজতর করেও তোলে।
প্রযুক্তিগতভাবে, হ্যাঁ, যদিও অতিরিক্ত সাইজ হ্রাস নিম্ন বা এমনসমূহ প্রতিক্রিয়াশীল হতে পারে। ইতিমধ্যে কম্প্রেসযুক্ত ফাইলটি কম্প্রেস করা মাঝে মাঝে তার আকার বড় করে তোলে কম্প্রেশন এলগরিদম দ্বারা যুক্ত করা মেটাডেটাকে আকার বড় করতে পারে।
একটি ফাইল ডিকম্প্রেস করতে, আপনি সাধারণত একটি ডিকম্প্রেশন বা আনজিপিঙ সরঞ্জাম প্রয়োজন, যেমন WinZip বা 7-Zip. এই সরঞ্জামগুলি কম্প্রেস ফরম্যাটে থেকে মূল ফাইলগুলি বাহির করতে পারে।