এলএইচএ আর্কাইভ ফরম্যাট, যা এলজেডএইচ নামেও পরিচিত, একটি সংকুচিত আর্কাইভ ফাইল ফরম্যাট যা প্রাথমিকভাবে এমএস-ডস এবং মাইক্রোসফট উইন্ডোজ সিস্টেমে ব্যবহৃত হয়। এটি হারুয়াসু ইয়োশিজাকি দ্বারা ১৯৮০ এর দশকের শেষের দিকে বিদ্যমান এআরসি এবং জিপ সংকোচন ফরম্যাটের উন্নতি হিসাবে তৈরি করা হয়েছিল। এলএইচএ আর্কাইভগুলি দক্ষ সংকোচন অনুপাত এবং দ্রুত ডিকম্প্রেশন গতি সরবরাহ করে, যা এগুলিকে সফ্টওয়্যার, ডকুমেন্ট এবং অন্যান্য ধরনের ফাইল সঞ্চয় এবং বিতরণের জন্য উপযুক্ত করে তোলে।
এলএইচএ ফরম্যাট উচ্চ সংকোচন অনুপাত অর্জনের জন্য লেম্পেল-জিভ-ওয়েলচ (এলজেডডাব্লিউ) এবং হাফম্যান কোডিং অ্যালগরিদমের সমন্বয় ব্যবহার করে। এলজেডডাব্লিউ একটি অভিধান-ভিত্ তিক সংকোচন অ্যালগরিদম যা ডেটা সংকুচিত হওয়ার সাথে সাথে তৈরি করা একটি অভিধানের রেফারেন্সের সাথে ডেটার পুনরাবৃত্তিমূলক ঘটনাগুলি প্রতিস্থাপন করে। অন্যদিকে, হাফম্যান কোডিং একটি পরিবর্তনশীল-দৈর্ঘ্যের কোডিং স্কিম যা আরও ঘন ঘন প্রতীকগুলিতে ছোট বিট সিকোয়েন্স বরাদ্দ করে, যার ফলে সংকুচিত ডেটার সামগ্রিক আকার হ্রাস পায়।
একটি এলএইচএ আর্কাইভে হেডার এবং সংকুচিত ডেটা ব্লকের একটি সিরিজ থাকে। আর্কাইভটি একটি প্রধান হেডার দিয়ে শুরু হয় যাতে আর্কাইভ সম্পর্কে তথ্য থাকে, যেমন আর্কাইভ ফরম্যাট সংস্করণ, ব্যবহৃত সংকোচন পদ্ধতি এবং আর্কাইভে সংরক্ষিত ফাইলের মোট সংখ্যা। প্রধান হেডারের পরে আর্কাইভে থাকা প্রতিটি ফাইলের জন্য পৃথক ফাইল হেডার থাকে। এই ফাইল হেডারগুলি মেটাডেটা সঞ্চয় করে যেমন মূল ফাইলের নাম, ফাইলের আকার, সংশোধন তারিখ এবং সিআরসি-১৬ চেকসাম।
প্রতিটি ফাইল হেডারের পরে, সেই ফাইলের সংকুচিত ডেটা একটি বা একাধিক ডেটা ব্লকে সংরক্ষণ করা হয়। প্রতিটি ডেটা ব্লকের আকার সংকোচন পদ্ধতি এবং আর্কাইভ তৈরির সময় ব্যবহৃত সেটিংস দ্বারা নির্ধারিত হয়। এলএইচএ বেশ কয়েকটি সংকোচন পদ্ধতি সমর্থন করে, যার মধ্যে রয়েছে -lh0- (কোন সংকোচন নেই), -lh1- (আরএলই এনকোডিং), -lh4- (এলজেডডাব্লিউ সংকোচন), -lh5- (এলজেডডাব্লিউ+হাফম্যান কোডিং) এবং -lh7- (এলজেডএসএস সংকোচন)। সংকোচন পদ্ধতির পছন্দ আর্কাইভের সংকোচন অনুপাত এবং ডিকম্প্রেশন গতি উভয়কেই প্রভাবিত করে।
এলএইচএ ফরম্যাটের একটি উল্লেখযোগ্য বৈশিষ্ট্য হল সলিড আর্কাইভের জন্য এর সমর্থন। একটি সলিড আর্কাইভে, একাধিক ফাইলের সংকুচিত ডেটা একত্রে সংযুক্ত করা হয়, যা সংকোচন অ্যালগরিদমকে ফাইল সীমানার জুড়ে অতিরিক্ততার সুযোগ নিতে দেয়। এটি অ-সলিড আর্কাইভের তুলনায় উল্লেখযোগ্যভাবে উচ্চ সংকোচন অনুপাতের দিকে পরিচালিত করতে পারে, যেখানে প্রতিটি ফাইল স্বাধীনভাবে সংকুচ িত করা হয়। তবে, সলিড আর্কাইভের একটি একক ফাইল বের করার জন্য পুরো আর্কাইভটি ডিকম্প্রেস করার প্রয়োজন হয়, যা বড় আর্কাইভের জন্য সময়সাপেক্ষ হতে পারে।
একটি এলএইচএ আর্কাইভ তৈরি করতে, এলএইচএ বা এলহার্কের মতো একটি সংকোচন ইউটিলিটি ব্যবহার করা হয়। এই ইউটিলিটিগুলি একটি বা একাধিক ইনপুট ফাইল নেয় এবং এগুলিকে .lha বা .lzh এক্সটেনশন সহ একটি একক এলএইচএ আর্কাইভ ফাইলে সংকুচিত করে। সংকোচন প্রক্রিয়ায় ইনপুট ডেটা বিশ্লেষণ করা, পুনরাবৃত্তিমূলক প্যাটার্নের একটি অভিধান তৈরি করা এবং সংকুচিত আউটপুটে সেই প্যাটার্নগুলিকে ছোট রেফারেন্স দিয়ে প্রতিস্থাপন করা জড়িত। সংকুচিত ডেটাটি তারপর ব্লকে বিভক্ত করা হয় এবং প্রয়োজনীয় হেডার এবং মেটাডেটার সাথে আর্কাইভ ফাইলে লেখা হয়।
একটি এলএইচএ আর্কাইভ থেকে ফাইল বের করায় পছন্দসই ফাইল(গুলি) সনাক্ত করতে আর্কাইভ হেডারগুলি পড়া এবং তারপর সংশ্লিষ্ট ডেটা ব্লকগুলি ডিক ম্প্রেস করা জড়িত। ডিকম্প্রেশন প্রক্রিয়া সংকোচন অ্যালগরিদমকে বিপরীত করে, অভিধান রেফারেন্স এবং এনকোড করা প্রতীকগুলি থেকে মূল ডেটা পুনর্নির্মাণ করে। বেশিরভাগ এলএইচএ সংকোচন ইউটিলিটি বিভিন্ন নিষ্কাশন বিকল্প সমর্থন করে, যেমন নির্দিষ্ট ফাইল নিষ্কাশন করা, বিদ্যমান ফাইলগুলি ওভাররাইট করা বা মূল ডিরেক্টরি স্ট্রাকচার সংরক্ষণ করা।
এলএইচএ ফরম্যাটের একটি সুবিধা হল বিস্তৃত অপারেটিং সিস্টেম এবং প্ল্যাটফর্মের সাথে এর সামঞ্জস্যতা। এমএস-ডস এবং মাইক্রোসফট উইন্ডোজ ছাড়াও, উপযুক্ত সফ্টওয়্যার টুল ব্যবহার করে ইউনিক্স-জাতীয় সিস্টেম, ম্যাকওএস এবং অন্যান্য প্ল্যাটফর্মে এলএইচএ আর্কাইভ তৈরি এবং বের করা যায়। এই ক্রস-প্ল্যাটফ
ফাইল সংকোচন হলো কোন ডেটা ফাইলের আকার সংগ্রহ অথবা সম্প্রেষণের জন্য ক্ষুদ্র করা একটি প্রক্রিয়া। এটি বিভিন্ন এলগরিদম ব্যবহার করে ডেটা সংকোচন করে অপরিহার্যতা চিহ্নিত করে এবং অপসারণ করে যা প্রায়শই মূল তথ্যগুলি হারানো ছাড়াই ডেটার আকারকে ব্যাপক ভাবে কমিয়ে দেয়।
ফাইল সংকোচনের দুটি প্রধান ধরন রয়েছে: লসলেস এবং লসি। লসলেস সংকোচন মূল ডেটা কে সংকোচিত ডেটা থেকে সম্পূর্ণভাবে পুনর্নির্মাণ করার অবকাঠামো দেয়, যা প্রতিটি ডেটা গুরুত্বপূর্ণ হিসাবে গণনা করা হয়, যেমন টেক্সট অথবা ডাটাবেস ফাইল। সাধারণ উদাহরণ হলে জিপ এবং আরএআর ফাইল ফরম্যাট। অন্যদিকে, লসি সংকোচন অগুরুত্বপূর্ণ ডেটা মুছে ফেলে ফাইলের আকারকে আরও গুরুত্ব সহকারে হ্রাস করে, যা প্রায়শই অডিও, ভিডিও এবং চিত্র ফাইলে ব্যবহৃত হয়। জেপেগস এবং এমপিথ্রি এমন উদাহরণ যেখানে কিছু ডেটা হ্রাস সামগ্রীর আপাত্তিকর গুণমান ব্যাপকভাবে ক্ষয় করে না।
ফাইল সংকোচন অনেকগুলি উপায়ে সুবিধাজনক। এটি ডিভাইস এবং সার্ভারের উপর স্টোরেজ স্পেস সংরক্ষণ করে, যা খরচ হ্রাস করে এবং কার্যক্ষমতা বাড়ায়। এটি নেটওয়ার্কের মাধ্যমে ফাইল স্থানান্তর সময়কে ত্বরান্বিত করে, যা বিশেষ গুরুত্ব সহকারে বড় ফাইলের জন্য। আরও তাই, সংকোচিত ফাইল একটি আর্কাইভ ফাইলে একত্রিত করা যেতে পারে, যা সংগঠন এবং একাধিক ফাইলের সহজ পরিবহনে সাহায্য করে।
তবে, ফাইল সংকোচনের কিছু অনুকূলতা রয়েছে। সংকোচন এবং সংকোচন মুক্তি প্রক্রিয়া গণনায়ন সম্পদ প্রয়োজন করে, যা বিশেষ করে বড় ফাইলের জন্য সিস্টেমের কার্যক্ষমতা ধীর করতে পারে। এছাড়া, লসি সংকোচনের ক্ষেত্রে, কিছু মূল ডেটা সংকোচন সময়ে হারিয়ে যায়, এবং ফলাফলের মান সমস্ত ব্যবহারের জন্য স্বীকার্য হতে পারে না, বিশেষ করে সেই পেশাদার অ্যাপ্লিকেশন যা উচ্চ মান চাই।
ফাইল সংকোচন আজকের ডিজিটাল পৃথিবীতে একটি গুরুত্বপূর্ণ সরঞ্জাম। এটি কার্যক্ষমতা বাড়ায়, স্টোরেজ স্পেস সংরক্ষণ করে এবং ডাউনলোড এবং আপলোড সময় হ্রাস করে। তবে, এর সঙ্ গে সিস্টেম কার্যক্ষমতা এবং গুণগত মান হ্রাসের জোখিম বিপরীতে এটি নিজের একটি সেট নিয়ে আসে। তাই, এটি স্পেসিফিক ডেটা প্রয়োজনীয়তার জন্য সঠিক সংকোচন পদ্ধতি চয়নের ক্ষেত্রে এই ঘটনাগুলির প্রতি সচেতন হতে প্রয়োজন।
ফাইল কম্প্রেশন হলো একটি প্রক্রিয়া যা একটি বা একাধিক ফাইলের সাইজ কমানো, সাধারণত স্টোরেজ স্পেস সংরক্ষণ বা নেটওয়ার্কের মাধ্যমে সংপ্রেষণ দ্রুততর করার জন্য।
ফাইল কম্প্রেশন ডেটায় পুনরাবৃত্তিতে চিন্হিত এবং অপসারণ এর মাধ্যমে কাজ করে। এটি অ্যালগরিদম ব্যবহার করে মূল ডেটা ক্ষুদ্র স্পেস এ এনকোড করে।
ফাইল কম্প্রেশনের দুটি প্রধান নিধিবিধিই হ্লসলস এবং লসই কম্প্রেশন। লসলেস কম্প্রেশন মূল ফাইলটি সম্পূর্ণ পুনরুদ্ধার করতে সহায়তা করে, জবাবদিহিতা লসই কম্প্রেশন ডেটা মানের কিছু হ্রাসের মূল্যায় আরও বেশি সাইজের কমানো সম্ভব।
ফাইল কম্প্রেশন সরঞ্জামের একটি জনপ্রিয় উদাহরণ হলো WinZip, যা ZIP এবং RAR সহ একাধিক কম্প্রেশন ফরম্যাট সমর্থন করে।
লসলেস কম্প্রেশনের সাথে, মান পরিবর্তন না হয়। যদিও, লসই কম্প্রেশনের সাথে, ফাইলের সাইজটি আরও উল্লেখযোগ্যভাবে হ্রাস করার জন্য কম-গুরুত্বপূর্ণ ডেটা মুছে ফেলা যেতে পারে, তার ফলে মানে নজরদার করে নেওয়া যেতে পারে।
হ ্যাঁ, ডেটা অখণ্ডতার দৃষ্টিকে নিয়ে ফাইল কম্প্রেশন নিরাপদ, বিশেষ করে লসলেস কম্প্রেশনের সাথে। যাই হোক, যেমন যেকোন ফাইল, কম্প্রেস ফাইলগুলিও ম্যালওয়ার বা ভাইরাসের লক্ষ্য হতে পারে, তাই সর্বদা সুপরিচিত নিরাপত্তি সফটওয়্যার স্থাপন করা গুরুত্বপূর্ণ।
প্রায় সমস্ত ধরনের ফাইল কম্প্রেস করা যায়, যেমন টেক্সট ফাইল, চিত্র, অডিয়ো, ভিডিও, এবং সফটওয়্যার ফাইল। যাই হোক, কম্প্রেশন সাধনযোগ্য স্তর ফাইল প্রকারের মধ্যে অনেক বেশি পরিবর্তন হতে পারে।
একটি ZIP ফাইল হলো একটি ফাইল ফরম্যাট ধরন যা লসলেস কম্প্রেশন ব্যবহার করে এক বা একাধিক ফাইলের আকার হ্রাস করে। ZIP ফাইলে মাল্টিপল ফাইলগুলি মোটামুটি একটি Single ফাইলে একত্র করে, যা শেয়ার করা সহজতর করেও তোলে।
প্রযুক্তিগতভাবে, হ্যাঁ, যদিও অতিরিক্ত সাইজ হ্রাস নিম্ন বা এমনসমূহ প্রতিক্রিয়াশীল হতে পারে। ইতিমধ্যে কম্প্রেসযুক্ত ফাইলটি কম্প্রেস করা মাঝে মাঝে তার আকার বড় করে তোলে কম্প্রেশন এলগরিদম দ্বারা যুক্ত করা মেটাডেটাকে আকার বড় করতে পারে।
একটি ফাইল ডিকম্প্রেস করতে, আপনি সাধারণত একটি ডিকম্প্রেশন বা আনজিপিঙ সরঞ্জাম প্রয়োজন, যেমন WinZip বা 7-Zip. এই সরঞ্জামগুলি কম্প্রেস ফরম্যাটে থেকে মূল ফাইলগুলি বাহির করতে পারে।