Extraer archivos BSD TAR

Trabajos ilimitados. Tamaños de archivo de hasta 2,5 GB. Gratis, para siempre.

Arrastra y suelta o haz clic para seleccionar

Privado y seguro

Todo sucede en tu navegador. Tus archivos nunca tocan nuestros servidores.

Ultrarrápido

Sin subidas, sin esperas. Convierte en el momento en que sueltas un archivo.

Realmente gratis

No se requiere cuenta. Sin costos ocultos. Sin trucos de tamaño de archivo.

¿Qué es el formato BSD TAR?

BSD tar

El formato de archivo ar SVR4 es un formato de archivo utilizado para almacenar colecciones de archivos en un único archivo de almacenamiento. Se introdujo como parte del sistema operativo UNIX System V Release 4 (SVR4) a finales de la década de 1980. El formato ar todavía se utiliza ampliamente en la actualidad en muchos sistemas UNIX y Linux para empaquetar bibliotecas de software, archivos de objetos y otras colecciones de archivos relacionados.

Un archivo ar consta de un encabezado global seguido de una serie de miembros de archivo. Cada miembro de archivo representa un archivo almacenado en el archivo. El encabezado global es una estructura simple de 8 bytes que identifica el archivo como un archivo ar y especifica el desplazamiento al primer miembro del archivo.

El encabezado global tiene el siguiente formato: - Bytes 0-1: La cadena mágica "!<arch>\n" que identifica el archivo como un archivo ar - Bytes 2-3: Los cuatro caracteres ASCII "`\ " seguidos de dos bytes de relleno dependientes de la plataforma, lo que hace que el encabezado tenga exactamente 8 bytes de longitud

Después del encabezado global están los miembros de archivo individuales. Cada miembro de archivo consta de un encabezado seguido inmediatamente por el contenido del miembro. El encabezado de cada miembro tiene el siguiente formato: - Bytes 0-15: Nombre de archivo, justificado a la izquierda y rellenado con ceros - Bytes 16-27: Marca de tiempo de modificación del archivo en decimal - Bytes 28-33: ID de propietario en decimal - Bytes 34-39: ID de grupo en decimal - Bytes 40-47: Modo de archivo en octal - Bytes 48-57: Tamaño del archivo en bytes en decimal - Bytes 58-59: La cadena "`\ "

Algunas cosas importantes a tener en cuenta sobre los encabezados de los miembros: - El nombre del archivo está limitado a 16 caracteres. Para nombres más largos, se puede utilizar un miembro de nombre extendido especial de System V. - La marca de tiempo, los ID de propietario/grupo y el modo de archivo están en decimal o octal ASCII. Deben terminar en nulo si son más cortos que el ancho de su campo. - El tamaño del archivo no incluye el tamaño del encabezado en sí. - Cada campo de encabezado termina con un espacio o un byte nulo si es más corto que su ancho fijo. No hay relleno de alineación entre campos.

El contenido de cada miembro de archivo sigue inmediatamente a su encabezado de 60 bytes sin relleno adicional. Los datos del archivo se almacenan exactamente como aparecían en el archivo original, sin codificación ni compresión.

Pueden aparecer miembros de archivo especiales en archivos ar para proporcionar metadatos adicionales: - "// ": El miembro de la tabla de símbolos contiene una tabla de búsqueda de nombres de símbolos utilizados para vincular archivos de objetos. Tiene el nombre especial "// " (barra diagonal barra diagonal espacio). - "/ ": La tabla de nombres extendidos se utiliza para nombres de archivos de más de 16 bytes. Se nombra con una barra diagonal seguida de suficientes espacios para rellenar hasta 16 bytes. Los nombres extendidos se almacenan como una lista de cadenas terminadas en nulo en este miembro.

Para analizar un archivo ar, un programa primero leería el encabezado global de 8 bytes y verificaría la cadena mágica del archivo. Luego escanearía los datos del archivo, leyendo el encabezado de 60 bytes para cada miembro. El campo de tamaño de archivo le dice al programa cuántos bytes leer para el contenido de ese miembro antes de avanzar al siguiente encabezado.

Al crear un archivo ar, un programa escribe el encabezado global, luego el encabezado y el contenido de cada miembro del archivo que se incluirá. Si se utilizan nombres extendidos, se debe agregar el miembro de la tabla de nombres extendidos. La tabla de símbolos, si se incluye, generalmente se agrega como el primer miembro después del encabezado global.

El formato ar es bastante simple, pero tiene algunas limitaciones. No admite compresión, cifrado u otras funciones avanzadas que se encuentran en formatos más modernos como tar o ZIP. El límite de nombre de 16 caracteres es restrictivo y el esquema de nombre extendido es algo incómodo. No obstante, ar sigue siendo ampliamente utilizado por su simplicidad, compatibilidad e idoneidad para empaquetar archivos relacionados como módulos de código objeto en archivos de biblioteca.

A pesar de su antigüedad, el formato ar ha seguido utilizándose y ha experimentado algunas mejoras a lo largo de los años: - Las variantes de BSD han extendido ar con soporte para nombres más largos sin la tabla de nombres extendidos y tamaños de archivo más grandes. - El programa GNU ar se ha convertido en la implementación estándar de facto y admite varias extensiones al tiempo que mantiene la compatibilidad. - El formato ar es un formato de salida requerido para archivos de objetos utilizados por muchos compiladores y enlazadores.

En resumen, el formato de archivo ar SVR4 es una especificación venerable pero aún ampliamente utilizada para agrupar colecciones de archivos en un único archivo más grande. Su simplicidad y compatibilidad han contribuido a su longevidad. Si bien a menudo se prefieren formatos más avanzados para el archivo y la compresión generales, ar sigue siendo una parte importante de la caja de herramientas en sistemas similares a Unix, especialmente para el desarrollo de software.

La compresión de archivos reduce la redundancia para que la misma información ocupe menos bits. El límite superior de hasta dónde se puede llegar está gobernado por la teoría de la información: para la compresión sin pérdidas, el límite es la entropía de la fuente (véase el teorema de codificación de fuente y su artículo original de 1948 “Una teoría matemática de la comunicación”). Para la compresión con pérdidas, el equilibrio entre la tasa y la calidad se captura mediante la teoría de la tasa-distorsión.

Dos pilares: modelado y codificación

La mayoría de los compresores tienen dos etapas. Primero, un modelo predice o expone la estructura de los datos. Segundo, un codificador convierte esas predicciones en patrones de bits casi óptimos. Una familia clásica de modelado es Lempel-Ziv: LZ77 (1977) y LZ78 (1978) detectan subcadenas repetidas y emiten referencias en lugar de bytes sin procesar. En el lado de la codificación, la codificación de Huffman (véase el artículo original de 1952) asigna códigos más cortos a los símbolos más probables. La codificación aritmética y la codificación por rangos son alternativas más detalladas que se acercan más al límite de la entropía, mientras que los modernos Sistemas Numéricos Asimétricos (ANS) logran una compresión similar con implementaciones rápidas basadas en tablas.

Qué hacen realmente los formatos comunes

DEFLATE (utilizado por gzip, zlib y ZIP) combina LZ77 con la codificación de Huffman. Sus especificaciones son públicas: DEFLATE RFC 1951, envoltura zlib RFC 1950, y formato de archivo gzip RFC 1952. Gzip está diseñado para la transmisión y explícitamente no intenta proporcionar acceso aleatorio. Las imágenes PNG estandarizan DEFLATE como su único método de compresión (con una ventana máxima de 32 KiB), según la especificación de PNG “Método de compresión 0… deflate/inflate… como máximo 32768 bytes” y W3C/ISO PNG 2ª Edición.

Zstandard (zstd): un compresor de propósito general más nuevo diseñado para altas relaciones de compresión con una descompresión muy rápida. El formato está documentado en RFC 8878 (también espejo HTML) y la especificación de referencia en GitHub. Al igual que gzip, el marco básico no tiene como objetivo el acceso aleatorio. Uno de los superpoderes de zstd son los diccionarios: pequeñas muestras de su corpus que mejoran drásticamente la compresión en muchos archivos pequeños o similares (véase documentación del diccionario python-zstandard y el ejemplo práctico de Nigel Tao). Las implementaciones aceptan diccionarios tanto “no estructurados” como “estructurados” (discusión).

Brotli: optimizado para contenido web (por ejemplo, fuentes WOFF2, HTTP). Mezcla un diccionario estático con un núcleo de entropía+LZ similar a DEFLATE. La especificación es RFC 7932, que también señala una ventana deslizante de 2^WBITS−16 con WBITS en [10, 24] (1 KiB−16 B hasta 16 MiB−16 B) y que no intenta el acceso aleatorio. Brotli a menudo supera a gzip en texto web mientras se decodifica rápidamente.

Contenedor ZIP: ZIP es un archivo de ficheros que puede almacenar entradas con varios métodos de compresión (deflate, store, zstd, etc.). El estándar de facto es la APPNOTE de PKWARE (véase APPNOTE portal, una copia alojada, y resúmenes de LC Formato de archivo ZIP (PKWARE) / ZIP 6.3.3).

Velocidad vs. relación: dónde se sitúan los formatos

LZ4 se centra en la velocidad bruta con relaciones modestas. Véase su página del proyecto („compresión extremadamente rápida“) y formato de trama. Es ideal para cachés en memoria, telemetría o rutas calientes donde la descompresión debe ser cercana a la velocidad de la RAM.

XZ / LZMA buscan la densidad (grandes relaciones) con una compresión relativamente lenta. XZ es un contenedor; el trabajo pesado lo realiza normalmente LZMA/LZMA2 (modelado tipo LZ77 + codificación por rangos). Véase formato de archivo .xz, la especificación de LZMA (Pavlov), y las notas del kernel de Linux sobre XZ Embedded. XZ suele comprimir más que gzip y a menudo compite con los códecs modernos de alta relación, pero con tiempos de codificación más lentos.

bzip2 aplica la Transformada de Burrows-Wheeler (BWT), move-to-front, RLE y codificación de Huffman. Suele ser más pequeño que gzip pero más lento; véase el manual oficial y las páginas del manual (Linux).

Ventanas, bloques y acceso aleatorio

El „tamaño de la ventana“ importa. Las referencias de DEFLATE solo pueden mirar hacia atrás 32 KiB (RFC 1951 y el límite de 32 KiB de PNG señalado aquí). La ventana de Brotli varía de aproximadamente 1 KiB a 16 MiB (RFC 7932). Zstd ajusta la ventana y la profundidad de búsqueda por nivel (RFC 8878). Los flujos básicos de gzip/zstd/brotli están diseñados para la decodificación secuencial; los formatos base no prometen acceso aleatorio, aunque los contenedores (por ejemplo, índices tar, tramas fragmentadas o índices específicos del formato) pueden superponerlo.

Sin pérdidas vs. con pérdidas

Los formatos anteriores son sin pérdidas: se pueden reconstruir los bytes exactos. Los códecs de medios suelen ser con pérdidas: descartan detalles imperceptibles para alcanzar tasas de bits más bajas. En imágenes, el JPEG clásico (DCT, cuantificación, codificación de entropía) está estandarizado en ITU-T T.81 / ISO/IEC 10918-1. En audio, MP3 (MPEG-1 Layer III) y AAC (MPEG-2/4) se basan en modelos perceptuales y transformadas MDCT (véase ISO/IEC 11172-3, ISO/IEC 13818-7, y un resumen de MDCT aquí). Con y sin pérdidas pueden coexistir (por ejemplo, PNG para activos de interfaz de usuario; códecs web para imágenes/vídeo/audio).

Consejos prácticos

Elija para el trabajo. Texto web y fuentes: brotli. Archivos generales y copias de seguridad: zstd (gran velocidad de descompresión y niveles para intercambiar tiempo por relación). Tuberías y telemetría ultrarrápidas: lz4. Máxima densidad para archivos a largo plazo donde el tiempo de codificación está bien: xz/LZMA.
¿Archivos pequeños? Entrene y envíe diccionarios con zstd (documentación) / (ejemplo). Pueden reducir drásticamente docenas de objetos pequeños y similares.
Interoperabilidad. Al intercambiar varios archivos, prefiera un contenedor (ZIP, tar) más un compresor. La APPNOTE de ZIP define los ID de método y las características; véase PKWARE APPNOTE y resúmenes de LC aquí.
Mida con sus datos. Las relaciones y las velocidades varían según el corpus. Muchos repositorios publican puntos de referencia (por ejemplo, el README de LZ4 cita el corpus de Silesia aquí), pero siempre valide localmente.

Referencias clave (inmersiones profundas)

Teoría: Shannon 1948 · Tasa-distorsión · Codificación: Huffman 1952 · Codificación aritmética · Codificación por rangos · ANS. Formatos: DEFLATE · zlib · gzip · Zstandard · Brotli · Trama LZ4 · Formato XZ. Pila BWT: Burrows–Wheeler (1994) · manual de bzip2. Medios: JPEG T.81 · MP3 ISO/IEC 11172-3 · AAC ISO/IEC 13818-7 · MDCT.

En resumen: elija un compresor que se ajuste a sus datos y restricciones, mida con entradas reales y no olvide las ganancias de los diccionarios y el entramado inteligente. Con la combinación adecuada, puede obtener archivos más pequeños, transferencias más rápidas y aplicaciones más ágiles, sin sacrificar la corrección o la portabilidad.

Preguntas Frecuentes

¿Qué es la compresión de archivos?

La compresión de archivos es un proceso que reduce el tamaño de un archivo o archivos, típicamente para ahorrar espacio de almacenamiento o acelerar la transmisión a través de una red.

¿Cómo funciona la compresión de archivos?

La compresión de archivos funciona identificando y eliminando la redundancia en los datos. Utiliza algoritmos para codificar los datos originales en un espacio menor.

¿Cuáles son los diferentes tipos de compresión de archivos?

Los dos tipos principales de compresión de archivos son la compresión sin pérdida y la compresión con pérdida. La compresión sin pérdida permite restaurar perfectamente el archivo original, mientras que la compresión con pérdida permite una reducción de tamaño más significativa a costa de alguna pérdida en la calidad de los datos.

¿Cuál es un ejemplo de una herramienta de compresión de archivos?

Un ejemplo popular de una herramienta de compresión de archivos es WinZip, que admite varios formatos de compresión incluyendo ZIP y RAR.

¿La compresión de archivos afecta la calidad de los archivos?

Con la compresión sin pérdida, la calidad permanece sin cambios. Sin embargo, con la compresión con pérdida, puede haber una disminución notable en la calidad, ya que elimina datos menos importantes para reducir de manera más significativa el tamaño del archivo.

¿Es segura la compresión de archivos?

Sí, la compresión de archivos es segura en términos de integridad de datos, especialmente con la compresión sin pérdida. Sin embargo, como en todos los archivos, los archivos comprimidos pueden ser objeto de malware o virus, por lo que siempre es importante tener un software de seguridad de confianza en funcionamiento.

¿Qué tipos de archivos se pueden comprimir?

Casi todos los tipos de archivos se pueden comprimir, incluyendo archivos de texto, imágenes, audio, video y archivos de software. Sin embargo, el nivel de compresión alcanzable puede variar significativamente entre los tipos de archivos.

¿Qué se entiende por un archivo ZIP?

Un archivo ZIP es un tipo de formato de archivo que utiliza compresión sin pérdida para reducir el tamaño de uno o varios archivos. Varios archivos en un archivo ZIP se agrupan efectivamente en un solo archivo, lo que también facilita la compartición.

¿Puedo comprimir un archivo ya comprimido?

Técnicamente, sí, aunque la reducción de tamaño adicional podría ser mínima o incluso contraproducente. Comprimir un archivo ya comprimido a veces aumenta su tamaño debido a los metadatos agregados por el algoritmo de compresión.

¿Cómo puedo descomprimir un archivo?

Para descomprimir un archivo, generalmente necesitas una herramienta de descompresión, como WinZip o 7-Zip. Estas herramientas pueden extraer los archivos originales del formato comprimido.

Extraer archivos BSD TAR

Arrastra y suelta o haz clic para seleccionar

Privado y seguro

Todo sucede en tu navegador. Tus archivos nunca tocan nuestros servidores.

Ultrarrápido

Sin subidas, sin esperas. Convierte en el momento en que sueltas un archivo.

Realmente gratis

No se requiere cuenta. Sin costos ocultos. Sin trucos de tamaño de archivo.

¿Qué es el formato BSD TAR?

BSD tar

Dos pilares: modelado y codificación

Qué hacen realmente los formatos comunes

Velocidad vs. relación: dónde se sitúan los formatos

Ventanas, bloques y acceso aleatorio

Sin pérdidas vs. con pérdidas

Consejos prácticos

Referencias clave (inmersiones profundas)

Preguntas Frecuentes

¿Qué es la compresión de archivos?

¿Cómo funciona la compresión de archivos?

¿Cuáles son los diferentes tipos de compresión de archivos?

¿Cuál es un ejemplo de una herramienta de compresión de archivos?

¿La compresión de archivos afecta la calidad de los archivos?

¿Es segura la compresión de archivos?

¿Qué tipos de archivos se pueden comprimir?

¿Qué se entiende por un archivo ZIP?

¿Puedo comprimir un archivo ya comprimido?

¿Cómo puedo descomprimir un archivo?

Formatos de archivo compatibles

7zip.7z

Seven Zip

APK.apk

Paquete de Android

AR.ar

ar (archivo Unix)

BIN.bin

binario

BSD TAR.tar

BSD tar

CPIO.cpio

Archivo CPIO

CRX.crx

Extensión Chrome

DEB.deb

Paquete Debian

EGG.egg

Egg

GNU TAR.tar

GNU tar

IPA.ipa

App iOS

ISO.iso

Imagen ISO

JAR.jar

Archivo Java

LHA.lha

Archivo LHA

LXF.lxf

LXF (Formato de Intercambio Lego)

LZH.lzh

Archivo LZH

PAX.pax

Portable Archive eXchange

PAXR.pax

Portable Archive eXchange Reduced

PKZ.zip

PKZ (PKZip)

POSIX.tar

POSIX

PWB.cpio

PWB (Banco de trabajo del programador)

RAR.rar

Archivo RAR

RAW.img

Formato Raw

RPAX.rpax

PAX Redundante (Portable Archive eXchange)

SHAR.shar

Archive de Shell

TARGZ.tar.gz