PAX dosyasını çıkarın

Sınırsız işlem. Dosya boyutu 2.5GB'a kadar. Hepsi ücretsiz, ve sürekli.

Özel ve güvenli

Her şey tarayıcınızda gerçekleşir. Dosyalarınız sunucularımıza asla dokunmaz.

Çok hızlı

Yükleme yok, bekleme yok. Bir dosyayı bıraktığınız anda dönüştürün.

Gerçekten ücretsiz

Hesap gerekmez. Gizli maliyet yok. Dosya boyutu hilesi yok.

PAX formatı nedir?

Taşınabilir Arşiv Değişimi

LHA arşiv formatı, LZH olarak da bilinir, öncelikle MS-DOS ve Microsoft Windows sistemlerinde kullanılan sıkıştırılmış bir arşiv dosyası formatıdır. 1980'lerin sonlarında Haruyasu Yoshizaki tarafından mevcut ARC ve ZIP sıkıştırma formatlarına göre bir geliştirme olarak geliştirilmiştir. LHA arşivleri, yazılım, belge ve diğer dosya türlerini depolamak ve dağıtmak için uygun olan verimli sıkıştırma oranları ve hızlı açma hızları sağlar.

LHA formatı, yüksek sıkıştırma oranları elde etmek için Lempel-Ziv-Welch (LZW) ve Huffman kodlama algoritmalarının bir kombinasyonunu kullanır. LZW, verilerin sıkıştırıldığı sırada oluşturulan bir sözlüğe referanslarla verilerin tekrarlanan oluşumlarını değiştiren sözlük tabanlı bir sıkıştırma algoritmasıdır. Öte yandan Huffman kodlaması, daha sık sembollere daha kısa bit dizileri atayan ve böylece sıkıştırılmış verilerin genel boyutunu azaltan değişken uzunlukta bir kodlama şemasıdır.

Bir LHA arşivi, bir dizi başlık ve sıkıştırılmış veri bloklarından oluşur. Arşiv, arşivin kendisi hakkında bilgi içeren bir ana başlıkla başlar, örneğin arşiv formatı sürümü, kullanılan sıkıştırma yöntemi ve arşivde depolanan toplam dosya sayısı. Ana başlığın ardından, arşivde bulunan her dosya için ayrı dosya başlıkları gelir. Bu dosya başlıkları, orijinal dosya adı, dosya boyutu, değişiklik tarihi ve CRC-16 kontrol toplamı gibi meta verileri depolar.

Her dosya başlığından sonra, o dosyanın sıkıştırılmış verileri bir veya daha fazla veri bloğunda depolanır. Her veri bloğunun boyutu, arşivin oluşturulması sırasında kullanılan sıkıştırma yöntemi ve ayarlarla belirlenir. LHA, -lh0- (sıkıştırma yok), -lh1- (RLE kodlaması), -lh4- (LZW sıkıştırması), -lh5- (LZW+Huffman kodlaması) ve -lh7- (LZSS sıkıştırması) dahil olmak üzere çeşitli sıkıştırma yöntemlerini destekler. Sıkıştırma yönteminin seçimi, hem arşivin sıkıştırma oranını hem de açma hızını etkiler.

LHA formatının dikkat çekici özelliklerinden biri, sağlam arşivlere verdiği destektir. Sağlam bir arşivde, birden fazla dosyanın sıkıştırılmış verileri bir araya getirilerek sıkıştırma algoritmasının dosya sınırları boyunca yedeklilikten yararlanmasına olanak tanınır. Bu, her dosyanın bağımsız olarak sıkıştırıldığı sağlam olmayan arşivlere kıyasla önemli ölçüde daha yüksek sıkıştırma oranlarıyla sonuçlanabilir. Ancak sağlam arşivlerin, büyük arşivler için zaman alıcı olabilen tek bir dosyayı çıkarmak için tüm arşivin açılmasını gerektirmesi gibi bir dezavantajı da vardır.

Bir LHA arşivi oluşturmak için LHA veya LHarc gibi bir sıkıştırma yardımcı programı kullanılır. Bu yardımcı programlar bir veya daha fazla girdi dosyası alır ve bunları .lha veya .lzh uzantılı tek bir LHA arşiv dosyasına sıkıştırır. Sıkıştırma işlemi, girdi verilerini analiz etmeyi, tekrarlanan kalıpların bir sözlüğünü oluşturmayı ve bu kalıpları sıkıştırılmış çıktıdaki daha kısa referanslarla değiştirmeyi içerir. Sıkıştırılmış veriler daha sonra bloklara bölünür ve gerekli başlıklar ve meta verilerle birlikte arşiv dosyasına yazılır.

Bir LHA arşivinden dosya çıkarmak, istenen dosyayı veya dosyaları bulmak için arşiv başlıklarını okumayı ve ardından ilgili veri bloklarının sıkıştırmasını açmayı içerir. Sıkıştırma açma işlemi, sıkıştırma algoritmasını tersine çevirerek orijinal verileri sözlük referanslarından ve kodlanmış sembollerden yeniden oluşturur. Çoğu LHA sıkıştırma yardımcı programı, belirli dosyaları çıkarma, mevcut dosyaların üzerine yazma veya orijinal dizin yapısını koruma gibi çeşitli çıkarma seçeneklerini destekler.

LHA formatının bir avantajı, çok çeşitli işletim sistemleri ve platformlarla uyumluluğudur. MS-DOS ve Microsoft Windows'a ek olarak, LHA arşivleri uygun yazılım araçları kullanılarak Unix benzeri sistemler, macOS ve diğer platformlarda oluşturulabilir ve çıkarılabilir. Bu platformlar arası uyumluluk, LHA'yı yazılım ve verileri farklı ortamlarda dağıtmak için uygun bir seçim haline getirir.

Bununla birlikte, LHA formatının daha modern sıkıştırma formatlarına kıyasla bazı sınırlamaları da vardır. Bir sorun, yerleşik şifreleme desteğinin olmamasıdır, yani LHA arşivleri hassas veriler için herhangi bir güvenlik sağlamaz. Bir diğer sınırlama ise, 32 bit dosya ofsetlerinin kullanılması nedeniyle formatın desteklediği maksimum dosya boyutunun genellikle yaklaşık 2 GB olmasıdır. Ek olarak, LHA formatı büyük ölçüde ZIP ve RAR gibi daha iyi sıkıştırma oranları, daha iyi performans ve ek özellikler sunan daha yeni formatlarla yer değiştirmiştir.

Bu sınırlamalara rağmen, LHA formatı günümüzde hala kullanılmaktadır, özellikle eski yazılımları ve verileri arşivlemek ve dağıtmak için. Birçok klasik MS-DOS oyunu, uygulaması ve belge arşivi hala LHA formatında dağıtılmaktadır ve modern sistemlerde LHA arşivleriyle çalışmak için çok sayıda araç ve yardımcı program mevcuttur. Bazı popüler LHA sıkıştırma yardımcı programları arasında LHA, LHarc ve UNLHA bulunurken, 7-Zip ve WinRAR gibi birçok modern dosya arşivleyici de LHA arşivleri oluşturmayı ve çıkarmayı destekler.

Performans açısından LHA formatı, sıkıştırma oranı ve açma hızı arasında iyi bir denge sunar. Kesin performans özellikleri, kullanılan belirli sıkıştırma yöntemine ve ayarlara ve girdi verilerinin doğasına bağlıdır. Genel olarak, -lh5- yöntemi (LZW+Huffman kodlaması) ile oluşturulan LHA arşivleri, sıkıştırma oranı ve açma hızı arasında iyi bir denge sağlar, -lh7- yöntemi (LZSS sıkıştırması) ise biraz daha düşük sıkıştırma oranları pahasına daha hızlı açma sunar.

LHA arşivleriyle çalışırken, kullanılan yazılım araçlarının arşiv formatının belirli sürümü ve özellikleriyle uyumlu olduğundan emin olmak önemlidir. Eski LHA sıkıştırma yardımcı programları, daha yeni sıkıştırma yöntemlerini veya arşiv özelliklerini desteklemeyebilirken, modern araçlar eski arşivleri orijinal yazılımdan farklı şekilde işleyebilir. Ayrıca, sıkıştırılmış verilerin depolama veya aktarım sırasında bozulmadığından emin olmak için CRC-16 kontrol toplamları veya diğer doğrulama yöntemlerini kullanarak LHA arşivlerinin bütünlüğünü doğrulamanız önerilir.

Sonuç olarak, LHA arşiv formatı, MS-DOS ve Microsoft Windows sistemlerinde dosyaları depolamak ve dağıtmak için verimli sıkıştırma ve hızlı açma sağlayan eski bir sıkıştırma formatıdır. ZIP ve RAR gibi daha yeni formatlar tarafından büyük ölçüde yer değiştirmiş olsa da, LHA eski yazılımları ve verileri arşivlemek ve dağıtmak için hala geçerliliğini korumaktadır. Platformlar arası uyumluluğu ve iyi performans özellikleri, onu belirli senaryolarda kullanışlı bir araç haline getirir ve modern sistemlerde LHA arşivleriyle çalışmak için hala birçok yazılım yardımcı programı ve araç mevcuttur. LHA formatının yapısını ve özelliklerini anlamak, eski verilerle veya yazılım arşivleriyle çalışan herkes için değerlidir.

Dosya sıkıştırma, aynı bilgiyi daha az bit ile temsil etmek için fazlalıkları azaltır. Ne kadar küçülebileceğinizi belirleyen üst sınır bilgi teorisidir: kayıpsız sıkıştırmada limit kaynağın entropisidir (bkz. Shannon'ın kaynak kodlama teoremi source coding theorem ve 1948 tarihli “A Mathematical Theory of Communication”). Kayıplı sıkıştırmada bit hızı ile kalite arasındaki dengeyi rate–distortion teorisiaçıklar.

İki temel: modelleme ve kodlama

Çoğu sıkıştırıcı iki aşamalıdır. Önce bir model verideki yapıyı tahmin eder veya ortaya çıkarır. Ardından bir coder bu tahminleri neredeyse optimal bit kalıplarına çevirir. Klasik aile Lempel–Ziv'dir LZ77 (1977) ve LZ78 (1978) tekrarlanan alt dizileri bulup ham bayt yerine referans yazar. Kodlama tarafında Huffman kodlama (bkz.1952 makalesi) olasılığı yüksek sembollere daha kısa kodlar verir. Aritmetik kodlama ve range coding entropi sınırına daha da yaklaşır; modern Asymmetric Numeral Systems (ANS) ise tablo tabanlı uygulamalarla benzer oranlar elde eder.

Yaygın formatlar gerçekte ne yapar?

DEFLATE (gzip, zlib, ZIP) LZ77 ile Huffman'ı birleştirir. Spesifikasyonlar açık: DEFLATE RFC 1951, zlib sarmalayıcısı RFC 1950ve gzip formatı RFC 1952. Gzip akış için tasarlandı ve rastgele erişim vaat etmez. PNG, tek sıkıştırma yöntemi olarak DEFLATE'i (32 KiB pencere) standartlaştırır; bkz.“Compression method 0…” ve W3C/ISO PNG 2nd Edition.

Zstandard (zstd): yüksek oranlar ve çok hızlı açma için tasarlanan yeni nesil genel kompresör. Format RFC 8878 (ayrıca HTML yansısı) ve referans dokümanı GitHub'daaçıklanmıştır. Gzip gibi temel çerçeve rastgele erişim hedeflemez. Zstd'nin süper gücü sözlüklerdir: korpusunuzdan küçük örnekler birçok küçük/benzer dosyayı ciddi biçimde küçültür (bkz.python-zstandard sözlük dokümanları ve Nigel Tao örneği). Uygulamalar “unstructured” ve “structured” sözlükleri destekler (tartışma).

Brotli: web içeriği (örn. WOFF2 fontlar, HTTP) için optimize edildi. Statik sözlük ile DEFLATE benzeri LZ+entropi çekirdeğini birleştirir. Spesifikasyon RFC 7932, ayrıca WBITS [10, 24] (1 KiB−16 B ile 16 MiB−16 B) aralığında 2WBITS−16 kayar pencere ve rastgele erişim sağlamadığınıbelirtir. Brotli çoğu web metninde gzip'i geçer ve hızlı çözülür.

ZIP konteyneri: ZIP, farklı sıkıştırma yöntemleri (deflate, store, zstd vb.) taşıyabilen bir arşivdir. De facto standart PKWARE APPNOTE'tur (bkz.APPNOTE portalı, barındırılan kopyave LC özetleri ZIP File Format (PKWARE) / ZIP 6.3.3).

Hız vs oran: formatların konumu

LZ4 mütevazı oranlarla ham hız hedefler. Proje sayfasına (“extremely fast compression”) ve frame formatınabakın. RAM hızına yakın dekompresyon gerektiren bellek içi cache'ler, telemetri veya sıcak yollar için ideal.

XZ / LZMA yüksek yoğunluk (yüksek oran) için daha yavaş sıkıştırmayı göze alır. XZ bir konteynerdir; asıl işi genelde LZMA/LZMA2 (LZ77 benzeri modelleme + range coding) yapar. .xz formatı, LZMA spesifikasyonu (Pavlov)ve Linux kernel notları XZ Embeddedile XZ genelde gzip'ten daha iyi sıkıştırır ve modern yüksek oranlı codec'lerle rekabet eder, fakat kodlama süresi uzundur.

bzip2, Burrows–Wheeler dönüşümünü (BWT), move-to-front'u, RLE'yi ve Huffman'ı kullanır. Genellikle gzip'ten küçük ama daha yavaştır; resmi kılavuza ve man sayfasınabakın.

Pencereler, bloklar ve rastgele erişim

“Pencere boyutu” önemlidir. DEFLATE referansları yalnızca 32 KiB geriye bakabilir (RFC 1951) ve PNG'nin 32 KiB sınırı burada belirtilir. Brotli yaklaşık 1 KiB ile 16 MiB arası pencereleri destekler (RFC 7932). Zstd pencereyi ve arama derinliğini seviyeler ile ayarlar (RFC 8878). gzip/zstd/brotli'nin temel akışları ardışık çözümeye göre tasarlanır; formatların kendileri rastgele erişim garantilemez, ancak konteynerler (tar indeksleri, parça bazlı çerçeveler, format spesifik indeksler) ekleyebilir.

Kayıpsız vs kayıplı

Yukarıdaki formatlar kayıpsızdır: aynı baytları geri alırsınız. Medya codec'leri genellikle kayıplıdır: daha düşük bit hızları için algılanmayan detayları atarlar. Görsellerde klasik JPEG (DCT, kantizasyon, entropi kodlama) ITU-T T.81 / ISO/IEC 10918-1içinde standarttır. Seste MP3 (MPEG-1 Layer III) ve AAC (MPEG-2/4) algısal modeller ve MDCT dönüşümleri kullanır (bkz.ISO/IEC 11172-3, ISO/IEC 13818-7ve MDCT özeti burada). Kayıplı ve kayıpsız yöntemler birlikte kullanılabilir (ör. UI için PNG; web codec'leri görsel/video/ses için).

Pratik ipuçları

  • İşe uygun seçin. Web metni ve fontları brotli. Genel dosyalar ve yedekler zstd (hızlı açma ve oran/zaman takası). Süper hızlı hatlar ve telemetri lz4. Kodlama süresinin sorun olmadığı uzun vadeli arşivlerde maksimum yoğunluk xz/LZMA.
  • Küçük dosyalar? zstd ile sözlük eğitip dağıtın (dokümanlar) / (örnek). Onlarca küçük ve benzer nesneyi ciddi biçimde küçültebilirler.
  • Birlikte çalışabilirlik. Birden fazla dosya değiştirirken konteyner (ZIP, tar) + sıkıştırıcı tercih edin. ZIP APPNOTE yöntem kimliklerini ve özellikleri tanımlar; bkz.PKWARE APPNOTE ve LC özetleri burada.
  • Verinizde ölçün. Oranlar ve hızlar korpusa göre değişir. Birçok repo benchmark yayınlar (örn. LZ4 README'si Silesia korpusundan bahseder burada), ama mutlaka yerelde doğrulayın.

Başlıca referanslar (derin okumalar)

Teori Shannon 1948 · Rate–distortion · Kodlama Huffman 1952 · Aritmetik kodlama · Range coding · ANS. Formatlar DEFLATE · zlib · gzip · Zstandard · Brotli · LZ4 frame · XZ format. BWT zinciri Burrows–Wheeler (1994) · bzip2 kılavuzu. Medya JPEG T.81 · MP3 ISO/IEC 11172-3 · AAC ISO/IEC 13818-7 · MDCT.

Özetle: verilerinize ve kısıtlarınıza uyan bir sıkıştırıcı seçin, gerçek girdiler üzerinde ölçün ve sözlükler ile akıllı çerçevelemenin kazançlarını unutmayın. Doğru eşleşme ile daha küçük dosyalar, daha hızlı transferler ve daha çevik uygulamalar elde eder, doğruluk veya taşınabilirlikten ödün vermezsiniz.

Sıkça Sorulan Sorular

Dosya sıkıştırması nedir?

Dosya sıkıştırması, dosyanın boyutunu azaltma işlemidir, genellikle depolama alanını tasarruf etmek veya bir ağ üzerindeki iletimi hızlandırmak için kullanılır.

Dosya sıkıştırması nasıl çalışır?

Dosya sıkıştırması, verilerdeki gereksiz bilgileri belirleyip çıkararak çalışır. İlk verileri daha küçük bir alanda kodlamak için algoritmalar kullanır.

Dosya sıkıştırmasının farklı türleri nelerdir?

Dosya sıkıştırmanın iki ana türü lossless (kayıpsız) ve lossy (kayıplı) sıkıştırmadır. Kayıpsız sıkıştırma, orijinal dosyanın mükemmel bir şekilde geri yüklenmesini sağlarken, kayıplı sıkıştırma, veri kalitesindeki bazı kayıpların maliyetine daha büyük ölçüde boyut küçültmeyi sağlar.

Bir dosya sıkıştırma aracı örneği nedir?

Popüler bir dosya sıkıştırma aracı örneği, ZIP ve RAR dahil olmak üzere birden fazla sıkıştırma formatını destekleyen WinZip'tir.

Dosya sıkıştırması dosyaların kalitesini etkiler mi?

Kayıpsız sıkıştırma ile kalite değişmez. Ancak, kayıplı sıkıştırmada, dosya boyutunu daha da küçültmek için az önemli veriler çıkarıldığından kalitede belirgin bir azalma olabilir.

Dosya sıkıştırması güvenli mi?

Evet, veri bütünlüğü açısından dosya sıkıştırması güvenlidir, özellikle kayıpsız sıkıştırmayla. Ancak, başka herhangi bir dosyada olduğu gibi, sıkıştırılmış dosyalar da zararlı yazılım veya virüsler tarafından hedef alınabilir, bu yüzden her zaman güvenilir bir güvenlik yazılımı bulundurmak önemlidir.

Hangi tür dosyalar sıkıştırılabilir?

Neredeyse tüm dosya türleri sıkıştırılabilir, bu türler arasında metin dosyaları, resimler, ses, video ve yazılım dosyaları bulunur. Ancak, elde edilebilecek sıkıştırma seviyesi, dosya türlerine göre önemli ölçüde değişebilir.

ZIP dosyası ne anlama geliyor?

ZIP dosyası, bir veya daha fazla dosyanın boyutunu azaltmak için kayıpsız sıkıştırmayı kullanan bir dosya formatı türüdür. ZIP dosyasındaki birden fazla dosya, tek bir dosyada etkili bir şekilde bir araya getirilir, bu da paylaşmayı kolaylaştırır.

Zaten sıkıştırılmış bir dosyayı sıkıştırabilir miyim?

Teknik olarak, evet, ancak ek boyut azaltma minimum veya hatta zararlı olabilir. Zaten sıkıştırılmış bir dosyayı sıkıştırmak, bazen sıkıştırma algoritması tarafından eklenen metadatanın neden olduğu boyut artışına neden olabilir.

Bir dosyayı nasıl açabilirim?

Bir dosyayı açmak için genellikle bir açma veya açma aracına ihtiyacınız vardır, örneğin WinZip veya 7-Zip. Bu araçlar, sıkıştırılmış formatından orijinal dosyaları çıkarabilir.