বিএসডি টিএআর (টেপ আর্কাইভ) ফরম্যাট হল ফাইল এবং ডিরেক্টরির সংগ্রহকে আর্কাইভ এবং সংকুচিত করার জন্য ব্যাপকভাবে ব্যবহৃত একটি ফাইল ফরম্যাট। এটি মূলত ম্যাগনেটিক টেপের মতো সিকুয়েনশিয়াল অ্যাক্সেস ডিভাইসে ডেটা ব্যাকআপ করার জন্য তৈরি করা হয়েছিল, তবে এখন সাধারণত সফ্টওয়্যার প্যাকেজ বিতরণ এবং বিভিন্ন স্টোরেজ মিডিয়ায় ব্যাকআপ আর্কাইভ তৈরি করার জন্য ব্যবহৃত হয়। টিএআর ফরম্যাট একাধিক ফাইলকে একটি একক আর্কাইভ ফাইলে বান্ডেল করার অনুমতি দেয়, ডিরেক্টরি স্ট্রাকচার, ফাইল অ্যাট্রিবিউট এবং পারমিশন সংরক্ষণ করে।
একটি টিএআর আর্কাইভে ফাইল হেডার এবং ফাইল ডেটা ব্লকের একটি সিরিজ থাকে যা একসাথে সংযুক্ত থাকে। আর্কাইভের প্রতিটি ফাইল একটি 512-বাইট হ েডার ব্লক দ্বারা উপস্থাপিত হয় যার পরে ফাইলের ডেটা থাকে, যা 512 বাইটের গুণিতকে প্যাড করা হয়। হেডার ব্লকে ফাইল সম্পর্কে মেটাডেটা থাকে, যেমন এর নাম, আকার, মালিকানা, পারমিশন এবং সংশোধন টাইমস্ট্যাম্প।
ফাইল হেডার ব্লকের একটি নির্দিষ্ট স্ট্রাকচার থাকে যার প্রাক-নির্ধারিত আকারের ক্ষেত্র থাকে। কিছু মূল ক্ষেত্রের মধ্যে রয়েছে:
- ফাইলের নাম (100 বাইট): ফাইলের নাম, সাধারণত 255 অক্ষরে সীমাবদ্ধ, একটি নাল বাইট দ্বারা শেষ হয়।
- ফাইল মোড (8 বাইট): ফাইলের পারমিশন এবং টাইপ, একটি অক্টাল সংখ্যা হিসাবে সংরক্ষণ করা হয়।
- মালিকের ব্যবহারকারীর আইডি (8 বাইট): ফাইলের মালিকের সংখ্যাসূচক ব্যবহারকারীর আইডি।
- গ্রুপের ব্যবহারকারীর আইডি (8 বাইট): ফাইলের মালিকের সংখ্যাসূচক গ্রুপ আইডি।
- ফাইলের আকার (12 বাইট): বাইটে ফাইলের আকার, একটি অক্টাল সংখ্যা হিসাবে সংরক্ষণ করা হয়।
- সংশোধন সময় (12 বাইট): ফাইলের শেষ সংশোধ নের টাইমস্ট্যাম্প, অক্টালে 1 জানুয়ারি, 1970 থেকে সেকেন্ডের সংখ্যা হিসাবে সংরক্ষণ করা হয়।
- হেডার চেকসাম (8 বাইট): হেডার ব্লকের একটি চেকসাম, দুর্নীতি সনাক্ত করতে ব্যবহৃত হয়।
হেডার ব্লকের পরে, ফাইলের ডেটা সংলগ্ন 512-বাইট ব্লকে সংরক্ষণ করা হয়। যদি ফাইলের আকার 512 বাইটের গুণিত না হয়, তবে শেষ ব্লকটি নাল বাইট দ্বারা প্যাড করা হয়। আর্কাইভের শেষটি নাল বাইট দ্বারা পূর্ণ দুটি পরপর 512-বাইট ব্লক দ্বারা চিহ্নিত করা হয়।
মূল টিএআর ফরম্যাটের একটি সীমাবদ্ধতা হল এটি 12-বাইট ফাইলের আকারের ক্ষেত্রের কারণে 8 জিবির চেয়ে বড় ফাইলের আকারকে সমর্থন করে না। এই সীমাবদ্ধতা কাটিয়ে উঠতে, পিওএসআইএক্স.1-2001 (প্যাক্স) ফরম্যাটের মতো পরবর্তী এক্সটেনশনগুলি বড় ফাইলের আকারকে সমর্থন করার জন্য অতিরিক্ত হেডার ক্ষেত্র চালু করেছে।
টিএআর ফরম্যাট নিজেই ডেটা সংকোচন প্রদান করে না। তবে, গজিপ, বিজিপ2 বা এক্সজেডের মতো সংকোচন অ্যালগরিদম ব্যবহার করে টিএআর আর্কাইভগুলিকে সংকুচিত করা সাধারণ অনুশীলন। ফলস্বরূপ ফাইলগুলিকে প্রায়শই ব্যবহৃত সংকোচন পদ্ধতি নির্দেশ করার জন্য .tar.gz, .tgz, .tar.bz2, .tbz2, .tar.xz, বা .txz এর মতো এক্সটেনশন দেওয়া হয়।
টিএআর আর্কাইভ তৈরি করা এবং বের করা বেশিরভাগ অপারেটিং সিস্টেম দ্বারা সমর্থিত এবং কমান্ড-লাইন টুল বা গ্রাফিক্যাল ইউজার ইন্টারফেস ব্যবহার করে করা যেতে পারে। ইউনিক্স-জাতীয় সিস্টেমে, tar কমান্ডটি সাধারণত ব্যবহৃত হয়। উদাহরণস্বরূপ:
- একটি টিএআর আর্কাইভ তৈরি করতে: `tar -cf archive.tar file1 file2 directory/`
- একটি টিএআর আর্কাইভ বের করতে: `tar -xf archive.tar`
- একটি সংকুচিত টিএআর আর্কাইভ তৈরি করতে: `tar -czf archive.tar.gz file1 file2 directory/`
মূল টিএআর ফরম্যাট ছাড়াও, বিভিন্ন রকমফের এবং এক্সটেনশন রয়েছে, যেমন জিএনইউ টিএআর ফরম্যাট, যা স্পার্স ফাইল, লম্বা ফাইলের নাম এবং এক্সটেন্ডেড অ্যাট্রিবিউটের জন্য সমর্থন যুক্ত করে। এই এক্সটেনশনগুলি মূল টিএআর ফরম্যাটের সাথে সামঞ্জস্য বজায় রেখে অতিরিক্ত কার্যকারিতা প্রদান করে।
টিএআর ফরম্যাটের সরলতা এবং পোর্টেবিলিটি বিভিন্ন প্ল্যাটফর্ম এবং ব্যবহারের ক্ষেত্রে এর ব্যাপক গ্রহণযোগ্যতায় অবদান রেখেছে। এটি আর্কাইভিং, ব্যাকআপ এবং সফ্টওয়্যার বিতরণের জন্য একটি জনপ্রিয় পছন্দ হিসাবে রয়ে গেছে, প্রায়শই স্টোরেজ প্রয়োজনীয়তা এবং ট্রান্সমিশন সময় কমাতে সংকোচন পদ্ধতির সাথে সংমিশ্রণে।
ফাইল সংকোচন হলো কোন ডেটা ফাইলের আকার সংগ্রহ অথবা সম্প্রেষণের জন্য ক্ষুদ্র করা একটি প্রক্রিয়া। এটি বিভিন্ন এলগরিদম ব্যবহার করে ডেটা সংকোচন করে অপরিহার্যতা চিহ্নিত করে এবং অপসারণ করে যা প্রায়শই মূল তথ্যগুলি হারানো ছাড়াই ডেটার আকারকে ব্যাপক ভাবে কমিয়ে দেয়।
ফাইল সংকোচনের দুটি প্রধান ধরন রয়েছে: লসলেস এবং লসি। লসলেস সংকোচন মূল ডেটা কে সংকোচিত ডেটা থেকে সম্পূর্ণভাবে পুনর্নির্মাণ করার অবকাঠামো দেয়, যা প্রতিটি ডেটা গুরুত্বপূর্ণ হিসাবে গণনা করা হয়, যেমন টেক্সট অথবা ডাটাবেস ফাইল। সাধারণ উদাহরণ হলে জিপ এবং আরএআর ফাইল ফরম্যাট। অন্যদিকে, লসি সংকোচন অগুরুত্বপূর্ণ ডেটা মুছে ফেলে ফাইলের আকারকে আরও গুরুত্ব সহকারে হ্রাস করে, যা প্রায়শই অডিও, ভিডিও এবং চিত্র ফাইলে ব্যবহৃত হয়। জেপেগস এবং এমপিথ্রি এমন উদাহরণ যেখানে কিছু ডেটা হ্রাস সামগ্রীর আপাত্তিকর গুণমান ব্যাপকভাবে ক্ষয় করে না।
ফাইল সংকোচন অনেকগুলি উপায়ে সুবিধাজনক। এটি ডিভাইস এবং সার্ভারের উপর স্টোরেজ স্পেস সংরক্ষণ করে, যা খরচ হ্রাস করে এবং কার্যক্ষমতা বাড়ায়। এটি নেটওয়ার্কের মাধ্যমে ফাইল স্থানান্তর সময়কে ত্বরান্বিত করে, যা বিশেষ গুরুত্ব সহকারে বড় ফাইলের জন্য। আরও তাই, সংকোচিত ফাইল একটি আর্কাইভ ফাইলে একত্রিত করা যেতে পারে, যা সংগঠন এবং একাধিক ফাইলের সহজ পরিবহনে সাহায্য করে।
তবে, ফাইল সংকোচনের কিছু অনুকূলতা রয়েছে। সংকোচন এবং সংকোচন মুক্তি প্রক্রিয়া গণনায়ন সম্পদ প্রয়োজন করে, যা বিশেষ করে বড় ফাইলের জন্য সিস্টেমের কার্যক্ষমতা ধীর করতে পারে। এছাড়া, লসি সংকোচনের ক্ষেত্রে, কিছু মূল ডেটা সংকোচন সময়ে হারিয়ে যায়, এবং ফলাফলের মান সমস্ত ব্যবহারের জন্য স্বীকার্য হতে পারে না, বিশেষ করে সেই পেশাদার অ্যাপ্লিকেশন যা উচ্চ মান চাই।
ফাইল সংকোচন আজকের ডিজিটাল পৃথিবীতে একটি গুরুত্বপূর্ণ সরঞ্জাম। এটি কার্যক্ষমতা বাড়ায়, স্টোরেজ স্পেস সংরক্ষণ করে এবং ডাউনলোড এবং আপলোড সময় হ্রাস করে। তবে, এর সঙ্গে সিস্টেম কার্যক্ষমতা এবং গুণগত মান হ্রাসের জোখিম বিপরীতে এটি নিজের একটি সেট নিয়ে আসে। তাই, এটি স্পেসিফিক ডেটা প্রয়োজনীয়তার জন্য সঠিক সংকোচন পদ্ধতি চয়নের ক্ষেত্রে এই ঘটনাগুলির প্রতি সচেতন হতে প্রয়োজন।
ফাইল কম্প্রেশন হলো একটি প্রক্রিয়া যা একটি বা একাধিক ফাইলের সাইজ কমানো, সাধারণত স্টোরেজ স্পেস সংরক্ষণ বা নেটওয়ার্কের মাধ্যমে সংপ্রেষণ দ্রুততর করার জন্য।
ফাইল কম্প্রেশন ডেটায় পুনরাবৃত্তিতে চিন্হিত এবং অপসারণ এর মাধ্যমে কাজ করে। এটি অ্যালগরিদম ব্যবহার করে মূল ডেটা ক্ষুদ্র স্পেস এ এনকোড করে।
ফাইল কম্প্রেশনের দুটি প্রধান নিধিবিধিই হ্লসলস এবং লসই কম্প্রেশন। লসলেস কম্প্রেশন মূল ফাইলটি সম্পূর্ণ পুনরুদ্ধার করতে সহায়তা করে, জবাবদিহিতা লসই কম্প্রেশন ডেটা মানের কিছু হ্রাসের মূল্যায় আরও বেশি সাইজের কমানো সম্ভব।
ফাইল কম্প্রেশন সরঞ্জামের একটি জনপ্রিয় উদাহরণ হলো WinZip, যা ZIP এবং RAR সহ একাধিক কম্প্রেশন ফরম্যাট সমর্থন করে।
লসলেস কম্প্রেশনের সাথে, মান পরিবর্তন না হয়। যদিও, লসই কম্প্রেশনের সাথে, ফাইলের সাইজটি আরও উল্লেখযোগ্যভাবে হ্রাস করার জন্য কম-গুরুত্বপূর্ণ ডেটা মুছে ফেলা যেতে পারে, তার ফলে মানে নজরদার করে নেওয়া যেতে পারে।
হ্যাঁ, ডেটা অখণ্ডতার দৃষ্টিকে নিয়ে ফাইল কম্প্রেশন নিরাপদ, বিশেষ করে লসলেস কম্প্রেশনের সাথে। যাই হোক, যেমন যেকোন ফাইল, কম্প্রেস ফাইলগুলিও ম্যালওয়ার বা ভাইরাসের লক্ষ্য হতে পারে, তাই সর্বদা সুপরিচিত নিরাপত্তি সফটওয়্যার স্থাপন করা গুরুত্বপূর্ণ।
প্রায় সমস্ত ধরনের ফাইল কম্প্রেস করা যায়, যেমন টেক্সট ফাইল, চিত্র, অডিয়ো, ভিডিও, এবং সফটওয়্যার ফাইল। যাই হোক, কম্প্রেশন সাধনযোগ্য স্তর ফাইল প্রকারের মধ্যে অনেক বেশি পরিবর্তন হতে পারে।
একটি ZIP ফাইল হলো একটি ফাইল ফরম্যাট ধরন যা লসলেস কম্প্রেশন ব্যবহার করে এক বা একাধিক ফাইলের আকার হ্রাস করে। ZIP ফাইলে মাল্টিপল ফাইলগুলি মোটামুটি একটি Single ফাইলে একত্র করে, যা শেয়ার করা সহজতর করেও তোলে।
প্রযুক্তিগতভাবে, হ্যাঁ, যদিও অতিরিক্ত সাইজ হ্রাস নিম্ন বা এমনসমূহ প্রতিক্রিয়াশীল হতে পারে। ইতিমধ্যে কম্প্রেসযুক্ত ফাইলটি কম্প্রেস করা মাঝে মাঝে তার আকার বড় করে তোলে কম্প্রেশন এলগরিদম দ্বারা যুক্ত করা মেটাডেটাকে আকার বড় করতে পারে।
একটি ফাইল ডিকম্প্রেস করতে, আপনি সাধারণত একটি ডিকম্প্রেশন বা আনজিপিঙ সরঞ্জাম প্রয়োজন, যেমন WinZip বা 7-Zip. এই সরঞ্জামগুলি কম্প্রেস ফরম্যাটে থেকে মূল ফাইলগুলি বাহির করতে পারে।