Extrair arquivos LZH

Trabalhos ilimitados. Tamanhos de arquivo de até 2,5 GB. Grátis, para sempre.

Privado e seguro

Tudo acontece no seu navegador. Seus arquivos nunca tocam nossos servidores.

Incrivelmente rápido

Sem upload, sem espera. Converta no momento em que você solta um arquivo.

Realmente grátis

Nenhuma conta necessária. Sem custos ocultos. Sem truques de tamanho de arquivo.

O que é o formato LZH?

Arquivo LZH

O formato de arquivo ISO, também conhecido como ISO 9660, é um padrão de sistema de arquivos publicado pela Organização Internacional para Padronização (ISO) em 1988. Ele foi projetado como um sistema de arquivos multiplataforma para mídia de disco óptico, como CD-ROMs. O objetivo era fornecer um método unificado para diferentes sistemas operacionais lerem dados de discos ópticos, garantindo interoperabilidade e compatibilidade.

O ISO 9660 define uma estrutura hierárquica de sistema de arquivos, semelhante aos sistemas de arquivos usados pela maioria dos sistemas operacionais. Ele organiza dados em diretórios e arquivos, com cada diretório podendo conter subdiretórios e arquivos. O padrão especifica o formato dos descritores de volume e diretório, bem como a tabela de caminho, que é usada para acesso rápido aos diretórios.

Um dos principais recursos do formato ISO 9660 é sua simplicidade e compatibilidade. O padrão impõe restrições a nomes de arquivos, estruturas de diretório e metadados para garantir que os discos possam ser lidos por uma ampla gama de sistemas. Os nomes de arquivos são limitados a 8 caracteres, seguidos por uma extensão de 3 caracteres (formato 8.3) e podem conter apenas letras maiúsculas, dígitos e sublinhados. Os nomes de diretório são igualmente restritos, com uma profundidade máxima de 8 níveis.

Para acomodar nomes de arquivos mais longos e metadados adicionais, o padrão ISO 9660 foi estendido por meio de várias especificações. Uma dessas extensões é o Joliet, introduzido pela Microsoft em 1995. O Joliet permite nomes de arquivos mais longos (até 64 caracteres Unicode) e suporta diferenciação de maiúsculas e minúsculas. Ele consegue isso incluindo um conjunto adicional de registros de diretório usando a codificação UCS-2, que é lida por sistemas que suportam a extensão Joliet.

Outra extensão notável do ISO 9660 é o Rock Ridge, que foi desenvolvido para sistemas UNIX. O Rock Ridge adiciona semântica de sistema de arquivos POSIX, como permissões de arquivo, propriedade e links simbólicos, ao formato ISO 9660. Esta extensão permite a preservação de atributos de arquivo específicos do UNIX ao criar imagens ISO a partir de sistemas de arquivos UNIX.

O formato ISO 9660 divide o disco em blocos lógicos, cada um normalmente com 2.048 bytes de tamanho. Os primeiros 16 blocos são reservados para uso do sistema e contêm os Descritores de Volume, que fornecem informações sobre a estrutura e o conteúdo do disco. O Descritor de Volume Primário é obrigatório e inclui detalhes como o identificador de volume do disco, o tamanho dos blocos lógicos e o registro do diretório raiz.

Após os Descritores de Volume, a Tabela de Caminho é armazenada no disco. A Tabela de Caminho contém informações sobre a localização de cada diretório no disco, permitindo a rápida travessia da hierarquia de diretórios. Ela consiste em uma Tabela de Caminho L (Little-Endian) e uma Tabela de Caminho M (Big-Endian) para suportar diferentes ordenações de bytes usadas por vários sistemas.

Diretórios e arquivos são armazenados nos blocos subsequentes do disco. Cada diretório é representado por um Registro de Diretório, que contém informações como o nome do diretório, seu diretório pai e a localização de seus arquivos e subdiretórios associados. Os arquivos são armazenados como sequências contíguas de blocos lógicos, com sua localização e tamanho especificados no registro de Identificador de Arquivo correspondente dentro do diretório.

Ao criar uma imagem ISO, o sistema de arquivos é primeiro organizado de acordo com os requisitos do padrão ISO 9660. Isso inclui garantir que os nomes de arquivos e diretórios estejam em conformidade com o formato 8.3, limitando a profundidade do diretório e convertendo os nomes de arquivos para maiúsculas. Depois que o sistema de arquivos é preparado, ele é gravado em um arquivo de imagem com a extensão ".iso", que pode então ser gravado em um disco óptico ou usado como uma imagem de disco virtual.

Para ler um disco formatado em ISO 9660, o sistema operacional ou um aplicativo de software dedicado começa examinando os Descritores de Volume para determinar a estrutura e as características do disco. Em seguida, ele usa a Tabela de Caminho e os Registros de Diretório para navegar na hierarquia do sistema de arquivos e localizar arquivos ou diretórios específicos. Quando um arquivo é acessado, o sistema lê os blocos lógicos apropriados do disco com base nas informações fornecidas no registro do Identificador de Arquivo.

O formato ISO 9660 foi amplamente adotado e ainda é comumente usado para distribuir software, conteúdo multimídia e dados de arquivo em discos ópticos. Sua simplicidade, compatibilidade e robustez contribuíram para sua longevidade, mesmo com o surgimento de novos formatos de disco óptico e sistemas de arquivos.

Apesar de sua idade, o padrão ISO 9660 permanece relevante na computação moderna. Muitos aplicativos de software e sistemas operacionais, incluindo Windows, macOS e Linux, continuam a suportar o formato nativamente. Além disso, as imagens ISO são frequentemente usadas para distribuir arquivos de instalação do sistema operacional, pacotes de software e imagens de disco de máquina virtual, pois fornecem um método conveniente e independente de plataforma para armazenar e transferir dados.

Concluindo, o formato ISO 9660 desempenhou um papel crucial na padronização da estrutura do sistema de arquivos para discos ópticos, permitindo compatibilidade entre plataformas e facilitando a distribuição de conteúdo digital. Suas extensões, como Joliet e Rock Ridge, adicionaram suporte para nomes de arquivos mais longos, metadados adicionais e atributos específicos do UNIX. Embora os discos ópticos tenham sido amplamente substituídos por outras mídias de armazenamento e métodos de distribuição baseados em rede, o formato ISO 9660 continua sendo um padrão confiável e amplamente suportado para arquivamento e troca de dados.

À medida que a tecnologia continua a evoluir, o formato ISO 9660 pode eventualmente ser substituído por sistemas de arquivos mais novos e avançados projetados para discos ópticos de alta capacidade ou outras mídias de armazenamento. No entanto, seu impacto na história da computação e seu papel no estabelecimento de uma abordagem padronizada para troca de dados entre plataformas não serão esquecidos. O formato ISO 9660 serve como um testemunho da importância da interoperabilidade e dos benefícios da colaboração em toda a indústria no desenvolvimento e adoção de padrões.

A compactação de arquivos reduz redundâncias para que as mesmas informações ocupem menos bits. O limite superior é definido pela teoria da informação: em compactação sem perdas, a fronteira é a entropia da fonte (veja o teorema de codificação de fonte de Shannon teorema de codificação de fonte e seu artigo original de 1948 “A Mathematical Theory of Communication”). Para compactação com perdas, o trade-off entre taxa e qualidade é capturado pela teoria taxa-distorção.

Dois pilares: modelagem e codificação

A maioria dos compressores tem duas etapas. Primeiro, um modelo prevê ou expõe estrutura nos dados. Depois, um codificador transforma essas previsões em padrões de bits quase ótimos. Uma família clássica é Lempel–Ziv LZ77 (1977) e LZ78 (1978) detectam substrings repetidas e emitem referências em vez de bytes brutos. Do lado da codificação Huffman (veja o artigo de 1952) dá códigos menores a símbolos mais prováveis. Codificação aritmética e codificação por intervalos chegam ainda mais perto do limite de entropia, enquanto Asymmetric Numeral Systems (ANS) modernos atingem taxas similares com implementações rápidas baseadas em tabelas.

O que os formatos comuns fazem

DEFLATE (usado por gzip, zlib e ZIP) combina LZ77 com Huffman. As especificações são públicas: DEFLATE RFC 1951, wrapper zlib RFC 1950e formato gzip RFC 1952. O gzip é moldado para streaming e não tenta fornecer acesso aleatório. PNG padroniza DEFLATE como único método de compressão (janela máxima de 32 KiB) segundo “Compression method 0… deflate/inflate… at most 32768 bytes” e o W3C/ISO PNG 2nd Edition.

Zstandard (zstd): um compressor moderno de uso geral pensado para altas taxas e decompactação muito rápida. O formato está em RFC 8878 (e no espelho HTML) além da especificação de referência no GitHub. Assim como gzip, o frame básico não mira acesso aleatório. Um superpoder do zstd são dicionários: pequenas amostras do seu corpus que reduzem drasticamente muitos arquivos pequenos ou parecidos (consulte a documentação de dicionários do python-zstandard e o exemplo de Nigel Tao). Implementações aceitam dicionários “unstructured” e “structured” (discussão).

Brotli: otimizado para conteúdo web (ex.: fontes WOFF2, HTTP). Mistura um dicionário estático com um núcleo LZ+entropia parecido com DEFLATE. Sua especificação é RFC 7932, que também descreve uma janela 2WBITS−16 com WBITS em [10, 24] (1 KiB−16 B até 16 MiB−16 B) e diz que não fornece acesso aleatório. Brotli costuma superar gzip em texto web e ainda decodifica rápido.

Contêiner ZIP: ZIP é um arquivo que pode armazenar entradas com diversos métodos (deflate, store, zstd etc.). O padrão de fato é o APPNOTE da PKWARE (veja o portal APPNOTE, uma cópia hospedadae os resumos da LC ZIP File Format (PKWARE) / ZIP 6.3.3).

Velocidade vs taxa: onde cada formato fica

LZ4 mira velocidade bruta com razões modestas. Consulte a página do projeto (“extremely fast compression”) e o formato de frame. Ideal para caches em memória, telemetria ou pipelines quentes que exigem decompactação quase na velocidade da RAM.

XZ / LZMA busca densidade (ótimas taxas) com compressão relativamente lenta. XZ é um contêiner; quem faz o serviço pesado é normalmente LZMA/LZMA2 (modelagem tipo LZ77 + range coding). Veja o formato .xz, a especificação LZMA (Pavlov)e notas do kernel Linux sobre XZ Embedded. XZ costuma comprimir melhor que gzip e rivaliza com codecs modernos de alta taxa, porém com tempos de codificação mais longos.

bzip2 usa Transformada de Burrows–Wheeler (BWT), move-to-front, RLE e Huffman. Geralmente gera arquivos menores que gzip, porém mais devagar; veja o manual oficial e as páginas man (Linux).

Janelas, blocos e acesso aleatório

O “tamanho da janela” importa. Referências DEFLATE olham no máximo 32 KiB para trás (RFC 1951) e o limite de 32 KiB do PNG documentado aqui. Brotli cobre janelas de ~1 KiB a 16 MiB (RFC 7932). Zstd ajusta janela e profundidade de busca pelos níveis (RFC 8878). Streams básicos de gzip/zstd/brotli foram feitos para decodificação sequencial; os formatos não prometem acesso aleatório, embora contêineres (tar com índice, framing em blocos ou índices específicos) possam adicioná-lo.

Sem perdas vs. com perdas

Os formatos acima são sem perdas: recuperam exatamente os mesmos bytes. Codecs de mídia costumam ser com perdas: descartam detalhes imperceptíveis para atingir taxas mais baixas. Em imagens, o JPEG clássico (DCT, quantização, codificação entropia) é padronizado em ITU-T T.81 / ISO/IEC 10918-1. Em áudio, MP3 (MPEG-1 Layer III) e AAC (MPEG-2/4) usam modelos perceptuais e transformadas MDCT (veja ISO/IEC 11172-3, ISO/IEC 13818-7e a visão geral de MDCT aqui). As abordagens com e sem perdas podem coexistir (ex.: PNG para ativos de UI; codecs web para imagem/vídeo/áudio).

Dicas práticas

  • Escolha para o trabalho. Texto e fontes web brotli. Arquivos gerais e backups zstd (decompactação rápida e níveis para trocar tempo por taxa). Pipelines ultrarrápidos e telemetria lz4. Máxima densidade para arquivos de longo prazo quando o tempo de codificação é aceitável xz/LZMA.
  • Arquivos pequenos? Treine e distribua dicionários com zstd (docs) / (exemplo). Eles reduzem drasticamente dezenas de objetos diminutos e semelhantes.
  • Interoperabilidade. Ao trocar vários arquivos, prefira um contêiner (ZIP, tar) mais um compressor. O APPNOTE do ZIP define IDs e recursos; veja PKWARE APPNOTE e os resumos da LC aqui.
  • Meça nos seus dados. Taxas e velocidades variam por corpus. Muitos repositórios publicam benchmarks (por exemplo, o README do LZ4 cita o corpus Silesia aqui), mas sempre valide localmente.

Referências principais (mergulhos profundos)

Teoria Shannon 1948 · Rate–distortion · Codificação Huffman 1952 · Codificação aritmética · Range coding · ANS. Formatos DEFLATE · zlib · gzip · Zstandard · Brotli · LZ4 frame · Formato XZ. Pilha BWT Burrows–Wheeler (1994) · manual do bzip2. Mídia JPEG T.81 · MP3 ISO/IEC 11172-3 · AAC ISO/IEC 13818-7 · MDCT.

Em resumo: escolha um compressor que combine com seus dados e restrições, meça em entradas reais e não esqueça os ganhos de dicionários e framing inteligente. Com o par certo você obtém arquivos menores, transferências mais rápidas e apps mais responsivos sem sacrificar correção ou portabilidade.

Perguntas Frequentes

O que é compressão de arquivo?

A compressão de arquivos é um processo que reduz o tamanho de um arquivo ou arquivos, normalmente para economizar espaço de armazenamento ou acelerar a transmissão em uma rede.

Como funciona a compressão de arquivos?

A compressão de arquivos funciona identificando e removendo redundâncias nos dados. Ela usa algoritmos para codificar os dados originais em um espaço menor.

Quais são os diferentes tipos de compressão de arquivos?

Os dois principais tipos de compressão de arquivos são a compressão sem perdas e a compressão com perdas. A compressão sem perdas permite que o arquivo original seja perfeitamente restaurado, enquanto a compressão com perdas permite uma redução de tamanho mais significativa com alguma perda de qualidade dos dados.

Qual é um exemplo de uma ferramenta de compressão de arquivos?

Um exemplo popular de uma ferramenta de compressão de arquivos é o WinZip, que suporta vários formatos de compressão, incluindo ZIP e RAR.

A compressão de arquivos afeta a qualidade dos arquivos?

Com compressão sem perdas, a qualidade permanece inalterada. No entanto, com compressão com perdas, pode haver uma diminuição perceptível na qualidade, pois elimina dados menos importantes para reduzir significativamente o tamanho do arquivo.

A compressão de arquivos é segura?

Sim, a compressão de arquivos é segura em termos de integridade dos dados, especialmente com compressão sem perdas. No entanto, como qualquer arquivo, os arquivos comprimidos podem ser alvo de malware ou vírus, por isso, é sempre importante ter um software de segurança de boa reputação.

Que tipos de arquivos podem ser comprimidos?

Quase todos os tipos de arquivos podem ser comprimidos, incluindo arquivos de texto, imagens, áudio, vídeo e arquivos de software. No entanto, o nível de compressão alcançável pode variar significativamente entre os tipos de arquivo.

O que é um arquivo ZIP?

Um arquivo ZIP é um tipo de formato de arquivo que usa compressão sem perdas para reduzir o tamanho de um ou mais arquivos. Vários arquivos em um arquivo ZIP são efetivamente agrupados em um único arquivo, o que também facilita o compartilhamento.

Posso comprimir um arquivo já comprimido?

Tecnicamente, sim, embora a redução de tamanho adicional possa ser mínima ou até contraproducente. Comprimir um arquivo já comprimido pode às vezes aumentar seu tamanho devido aos metadados adicionados pelo algoritmo de compressão.

Como posso descomprimir um arquivo?

Para descomprimir um arquivo, geralmente você precisa de uma ferramenta de descompressão ou descompactação, como WinZip ou 7-Zip. Essas ferramentas podem extrair os arquivos originais do formato comprimido.