আর আর্কাইভ ফরম্যাট, ইউনিক্স আর্কাইভ ফরম্যাটের সংক্ষিপ্ত রূপ, হলো একটি ফাইল ফরম্যাট যা সহজ সঞ্চয় এবং সঞ্চারণের জন্য একাধিক ফাইলকে একটি একক ফাইলে সংগ্রহ করতে ব্যবহৃত হয়। এটি মূলত ইউনিক্স সিস্টেমের জন্য তৈরি করা হয়েছিল কিন্তু এখন বিভিন্ন প্ল্যাটফর্মে ব্যাপকভাবে সমর্থিত। আর ফরম্যাটটি নতুন আর্কাইভ এবং কম্প্রেশন ফরম্যাটের তুলনায় সহজ এবং আরও সীমাবদ্ধ, তবে এটি নির্দিষ্ট অ্যাপ্লিকেশনগুলির জন্য ব্যবহার করা হচ্ছে।
একটি আর আর্কাইভ ফাইলে একটি গ্লোবাল হেডার থাকে, তারপরে একটি সিরিজ ফাইল হেডার এবং ফাইল ডেটা থাকে। গ্লোবাল হেডারটি একটি সহজ ASCII স্ট্রিং যা ফাইলটিকে একটি আর আর্কাইভ হিসাবে সনাক্ত করে। এটি "!<arch>\n" অক্ ষরগুলি নিয়ে গঠিত যেখানে "\n" একটি নিউলাইন অক্ষরকে উপস্থাপন করে। এই ম্যাজিক স্ট্রিংটি ইউটিলিটিগুলিকে আর আর্কাইভ ফাইলগুলিকে সহজেই সনাক্ত করতে দেয়।
গ্লোবাল হেডারের পরে রয়েছে পৃথক ফাইল এন্ট্রিগুলি। প্রতিটি ফাইল এন্ট্রি একটি ফাইল হেডার দিয়ে শুরু হয় যা ফাইল সম্পর্কে মেটাডেটা ধারণ করে। ফাইল হেডারটির একটি নির্দিষ্ট আকার 60 বাইট এবং এতে নিম্নলিখিত ক্ষেত্রগুলি অন্তর্ভুক্ত রয়েছে: - ফাইলের নাম (16 বাইট): ফাইলের নাম, যদি 16 অক্ষরের চেয়ে ছোট হয় তবে স্পেস দিয়ে প্যাড করা থাকে। যদি নামটি দীর্ঘ হয়, তবে এটি কেটে ফেলা হয় এবং একটি ট্রেলিং "/" অক্ষর নির্দেশ করে যে নামটি ফাইল ডেটা বিভাগে চলছে। - সংশোধন টাইমস্ট্যাম্প (12 বাইট): ফাইলের শেষ সংশোধন টাইমস্ট্যাম্প ডেসিমাল ইউনিক্স সময় ফরম্যাটে, স্পেস দিয়ে প্যাড করা। - মালিক আইডি (6 বাইট): ফাইলের মালিকের সংখ্যাসূচক ব্যবহারকারী আইডি, ডেসিমালে, স্পেস দিয়ে প্যাড করা। - গ্রুপ আইডি (6 বাইট): ফাইলের গ্রুপের সংখ্যাসূচক গ্রুপ আইডি, ডেসিমালে, স্পেস দিয়ে প্যাড করা। - ফাইল মোড (8 বাইট): ফাইলের অনুমতি এবং মোড বিট, অক্টালে, স্পেস দিয়ে প্যাড করা। - ফাইলের আকার (10 বাইট): ফাইলের ডেটার আকার বাইটে, ডেসিমালে, স্পেস দিয়ে প্যাড করা। - হেডারের শেষ (2 বাইট): অক্ষর "`\n" যা হেডারের শেষকে চিহ্নিত করে।
প্রতিটি ফাইল হেডারের পরে, ফাইলের ডেটা আর্কাইভে সংরক্ষণ করা হয়। ডেটার আকার হেডারে নির্দিষ্ট ফাইলের আকারের সাথে মিলে যায়। যদি ফাইলের আকার অদ্ভুত হয়, তবে পরবর্তী ফাইল হেডারটি একটি সম বাইট সীমানায় শুরু হয় তা নিশ্চিত করার জন্য একটি অতিরিক্ত প্যাডিং বাইট যুক্ত করা হয়। এই প্যাডিং বাইটটি হেডারের ফাইলের আকার ক্ষেত্রে গণনা করা হয় না।
প্রতীক টেবিল নামে বিশেষ ফাইল এন্ট্রিগুলিও আর আর্কাইভে অন্তর্ভুক্ত করা যেতে পারে। প্রতীক টেবিল এন্ট্রিগুলির একটি ফাইলের নাম রয়েছে যা "/" বা "\" দিয়ে শুরু হয় তারপরে একটি সংখ্যার স্ট্রিং থাকে। এই এন্ট্রিগুলিতে অবজেক্ট ফাইলগুলিকে একসাথে লিঙ্ক করার জন্য ব্যবহৃত মেটাডেটা থাকে। প্রতীক টেবিল ডেটার ফরম্যাট বিভিন্ন সিস্টেম এবং কম্পাইলারের মধ্যে পরিবর্তিত হয়।
আর আর্কাইভে কোনো বিল্ট-ইন কম্প্রেশন অন্তর্ভুক্ত নেই। ফাইলগুলি কেব ল তাদের মূল রূপে একত্রিত করা হয়। তবে, আর আর্কাইভের মধ্যে পৃথক ফাইলগুলি আর্কাইভে যুক্ত করার আগে গজিপের মতো অন্যান্য অ্যালগরিদম ব্যবহার করে কম্প্রেস করা যেতে পারে।
আর ফরম্যাটের আরও আধুনিক আর্কাইভ ফরম্যাটের তুলনায় কিছু সীমাবদ্ধতা রয়েছে: - ফাইলের নামগুলি 16 অক্ষরে সীমাবদ্ধ, যা সীমাবদ্ধ হতে পারে। - ব্যবহারকারী আইডি, গ্রুপ আইডি এবং ফাইলের আকারের মতো সংখ্যাসূচক মেটাডেটা ক্ষেত্রগুলির নির্দিষ্ট আকার রয়েছে, যা তাদের সর্বোচ্চ মানকে সীমাবদ্ধ করে। - ফরম্যাটে কোনো চেকসাম বা অখণ্ডতা যাচাই বিল্ট-ইন নেই। - কোনো কম্প্রেশন প্রদান করা হয় না, ফলে গজিপের সাথে টারের মতো ফরম্যাটের তুলনায় বড় আর্কাইভের আকার হয়।
এই সীমাবদ্ধতা সত্ত্বেও, আর ফরম্যাট কিছু নির্দিষ্ট অ্যাপ্লিকেশনের জন্য ব্যবহার করা হচ্ছে। একটি সাধারণ ব্যবহার ইউনিক্স-জাতীয় সিস্টেমে স্ট্যাটিক লাইব্রেরি ফাইলগুলির জ ন্য। ".a" এক্সটেনশন সহ এই লাইব্রেরি ফাইলগুলি আর আর্কাইভ যা কম্পাইল করা অবজেক্ট ফাইল ধারণ করে যা এক্সিকিউটেবলগুলিতে লিঙ্ক করা যেতে পারে। আর ফরম্যাটের সরলতা এবং ব্যাপক সমর্থন এটিকে এই উদ্দেশ্যে উপযুক্ত করে তোলে।
সারাংশে, আর আর্কাইভ ফরম্যাট একাধিক ফাইলকে একক ফাইলে একত্রিত করার একটি সহজ উপায়। এটি একটি গ্লোবাল হেডার নিয়ে গঠিত যার পরে একটি সিরিজ ফাইল হেডার এবং ফাইল ডেটা থাকে। যদিও এতে কম্প্রেশন এবং দীর্ঘ ফাইলের নাম সমর্থন করার মতো উন্নত বৈশিষ্ট্যের অভাব রয়েছে, তবুও এটি নির্দিষ্ট ডোমেনে ব্যবহৃ
ফাইল সংকোচন হলো কোন ডেটা ফাইলের আকার সংগ্রহ অথবা সম্প্রেষণের জন্য ক্ষুদ্র করা একটি প্রক্রিয়া। এটি বিভিন্ন এলগরিদম ব্যবহার করে ডেটা সংকোচন করে অপরিহার্যতা চিহ্নিত করে এবং অপসারণ করে যা প্রায়শই মূল তথ্যগুলি হারানো ছাড়াই ডেটার আকারকে ব্যাপ ক ভাবে কমিয়ে দেয়।
ফাইল সংকোচনের দুটি প্রধান ধরন রয়েছে: লসলেস এবং লসি। লসলেস সংকোচন মূল ডেটা কে সংকোচিত ডেটা থেকে সম্পূর্ণভাবে পুনর্নির্মাণ করার অবকাঠামো দেয়, যা প্রতিটি ডেটা গুরুত্বপূর্ণ হিসাবে গণনা করা হয়, যেমন টেক্সট অথবা ডাটাবেস ফাইল। সাধারণ উদাহরণ হলে জিপ এবং আরএআর ফাইল ফরম্যাট। অন্যদিকে, লসি সংকোচন অগুরুত্বপূর্ণ ডেটা মুছে ফেলে ফাইলের আকারকে আরও গুরুত্ব সহকারে হ্রাস করে, যা প্রায়শই অডিও, ভিডিও এবং চিত্র ফাইলে ব্যবহৃত হয়। জেপেগস এবং এমপিথ্রি এমন উদাহরণ যেখানে কিছু ডেটা হ্রাস সামগ্রীর আপাত্তিকর গুণমান ব্যাপকভাবে ক্ষয় করে না।
ফাইল সংকোচন অনেকগুলি উপায়ে সুবিধাজনক। এটি ডিভাইস এবং সার্ভারের উপর স্টোরেজ স্পেস সংরক্ষণ করে, যা খরচ হ্রাস করে এবং কার্যক্ষমতা বাড়ায়। এটি নেটওয়ার্কের মাধ্যমে ফাইল স্থানান্তর সময়কে ত্বরান্বিত করে, যা বিশেষ গুরুত্ব সহক ারে বড় ফাইলের জন্য। আরও তাই, সংকোচিত ফাইল একটি আর্কাইভ ফাইলে একত্রিত করা যেতে পারে, যা সংগঠন এবং একাধিক ফাইলের সহজ পরিবহনে সাহায্য করে।
তবে, ফাইল সংকোচনের কিছু অনুকূলতা রয়েছে। সংকোচন এবং সংকোচন মুক্তি প্রক্রিয়া গণনায়ন সম্পদ প্রয়োজন করে, যা বিশেষ করে বড় ফাইলের জন্য সিস্টেমের কার্যক্ষমতা ধীর করতে পারে। এছাড়া, লসি সংকোচনের ক্ষেত্রে, কিছু মূল ডেটা সংকোচন সময়ে হারিয়ে যায়, এবং ফলাফলের মান সমস্ত ব্যবহারের জন্য স্বীকার্য হতে পারে না, বিশেষ করে সেই পেশাদার অ্যাপ্লিকেশন যা উচ্চ মান চাই।
ফাইল সংকোচন আজকের ডিজিটাল পৃথিবীতে একটি গুরুত্বপূর্ণ সরঞ্জাম। এটি কার্যক্ষমতা বাড়ায়, স্টোরেজ স্পেস সংরক্ষণ করে এবং ডাউনলোড এবং আপলোড সময় হ্রাস করে। তবে, এর সঙ্গে সিস্টেম কার্যক্ষমতা এবং গুণগত মান হ্রাসের জোখিম বিপরীতে এটি নিজের একটি সেট নিয়ে আসে। তাই, এটি স্পেসিফিক ডেটা প্রয়োজনীয়তার জন্য সঠিক সংকোচন পদ্ধতি চয়নের ক্ষেত্রে এই ঘটনাগুলির প্রতি সচেতন হতে প্রয়োজন।
ফাইল কম্প্রেশন হলো একটি প্রক্রিয়া যা একটি বা একাধিক ফাইলের সাইজ কমানো, সাধারণত স্টোরেজ স্পেস সংরক্ষণ বা নেটওয়ার্কের মাধ্যমে সংপ্রেষণ দ্রুততর করার জন্য।
ফাইল কম্প্রেশন ডেটায় পুনরাবৃত্তিতে চিন্হিত এবং অপসারণ এর মাধ্যমে কাজ করে। এটি অ্যালগরিদম ব্যবহার করে মূল ডেটা ক্ষুদ্র স্পেস এ এনকোড করে।
ফাইল কম্প্রেশনের দুটি প্রধান নিধিবিধিই হ্লসলস এবং লসই কম্প্রেশন। লসলেস কম্প্রেশন মূল ফাইলটি সম্পূর্ণ পুনরুদ্ধার করতে সহায়তা করে, জবাবদিহিতা লসই কম্প্রেশন ডেটা মানের কিছু হ্রাসের মূল্যায় আরও বেশি সাইজের কমানো সম্ভব।
ফাইল কম্প্রেশন সরঞ্জামের একটি জনপ্রিয় উদাহরণ হলো WinZip, যা ZIP এবং RAR সহ একাধিক কম্প্রেশন ফরম্যাট সমর্থন করে।
লসলেস কম্প্রেশনের সাথে, মান পরিবর্তন না হয়। যদিও, লসই কম্প্রেশনের সাথে, ফাইলের সাইজটি আরও উল্লেখযোগ্যভাবে হ্রাস করার জন্য কম-গুরুত্বপূর্ণ ডেটা মুছে ফেলা যেতে পারে, তার ফলে মানে নজরদার করে নেওয়া যেতে পারে।
হ্যাঁ, ডেটা অখণ্ডতার দৃষ্টিকে নিয়ে ফাইল কম্প্রেশন নিরাপদ, বিশেষ করে লসলেস কম্প্রেশনের সাথে। যাই হোক, যেমন যেকোন ফা ইল, কম্প্রেস ফাইলগুলিও ম্যালওয়ার বা ভাইরাসের লক্ষ্য হতে পারে, তাই সর্বদা সুপরিচিত নিরাপত্তি সফটওয়্যার স্থাপন করা গুরুত্বপূর্ণ।
প্রায় সমস্ত ধরনের ফাইল কম্প্রেস করা যায়, যেমন টেক্সট ফাইল, চিত্র, অডিয়ো, ভিডিও, এবং সফটওয়্যার ফাইল। যাই হোক, কম্প্রেশন সাধনযোগ্য স্তর ফাইল প্রকারের মধ্যে অনেক বেশি পরিবর্তন হতে পারে।
একটি ZIP ফাইল হলো একটি ফাইল ফরম্যাট ধরন যা লসলেস কম্প্রেশন ব্যবহার করে এক বা একাধিক ফাইলের আকার হ্রাস করে। ZIP ফাইলে মাল্টিপল ফাইলগুলি মোটামুটি একটি Single ফাইলে একত্র করে, যা শেয়ার করা সহজতর করেও তোলে।
প্রযুক্তিগতভাবে, হ্যাঁ, যদিও অতিরিক্ত সাইজ হ্রাস নিম্ন বা এমনসমূহ প্রতিক্রিয়াশীল হতে পারে। ইতিমধ্যে কম্প্রেসযুক্ত ফাইলটি কম্প্রেস করা মাঝে মাঝে তার আকার বড় করে তোলে কম্প্রেশন এলগরিদম দ্বারা যুক্ত করা মেটাডেটাকে আকার বড় করতে পারে।
একটি ফাইল ডিকম্প্রেস করতে, আপনি সাধারণত একটি ডিকম্প্রেশন বা আনজিপিঙ সরঞ্জাম প্রয়োজন, যেমন WinZip বা 7-Zip. এই সরঞ্জামগুলি কম্প্রেস ফরম্যাটে থেকে মূল ফাইলগুলি বাহির করতে পারে।