RAW es un formato de imagen digital que contiene datos sin procesar o mínimamente procesados capturados directamente desde el sensor de imagen de una cámara digital. A diferencia de otros formatos de imagen comunes como JPEG, que aplican compresión y descartan algunos de los datos de imagen originales, los archivos RAW conservan todos los datos originales recopilados por el sensor de la cámara. Esto permite una flexibilidad y un control significativamente mayores en el posprocesamiento, ya que el fotógrafo tiene acceso a la gama completa de datos capturados por la cámara.
El formato RAW no es un formato único y estandarizado, sino más bien un término general que abarca varios formatos propietarios desarrollados por los fabricantes de cámaras. Cada fabricante de cámaras tiene su propio formato RAW específico, como .CR2 para Canon, .NEF para Nikon, .ARW para Sony y .DNG para el formato Digital Negative de Adobe. A pesar de las diferencias en las extensiones de archivo y las estructuras de datos específicas, todos los formatos RAW tienen el mismo propósito de almacenar datos de imagen sin comprimir y mínimamente procesados.
Una de las principales ventajas de disparar en RAW es la mayor profundidad de bits en comparación con los archivos JPEG. Mientras que los archivos JPEG suelen estar limitados a 8 bits por canal de color (rojo, verde y azul), los archivos RAW pueden contener 12, 14 o incluso 16 bits por canal. Esta mayor profundidad de bits permite una gama mucho más amplia de colores y valores tonales, lo que proporciona más latitud para los ajustes en el posprocesamiento sin introducir artefactos o perder detalles.
Otro beneficio de los archivos RAW es la retención de metadatos, que incluye información sobre la configuración de la cámara utilizada durante la captura, como ISO, velocidad de obturación, apertura, balance de blancos y más. Estos metadatos están incrustados dentro del archivo RAW y pueden ser utilizados por el software de posprocesamiento para optimizar los ajustes de imagen y mantener un registro de la configuración original de la cámara.
La flexibilidad de los archivos RAW es particularmente evidente cuando se trata de ajustes de balance de blancos. Dado que los archivos RAW contienen los datos de color sin procesar del sensor de la cámara, la configuración del balance de blancos se puede modificar fácilmente en el posprocesamiento sin una pérdida significativa de calidad. Esto contrasta con los archivos JPEG, donde el balance de blancos se integra permanentemente en la imagen durante el procesamiento en la cámara.
El rango dinámico, que se refiere al rango de valores de luminancia que puede capturar el sensor de la cámara, es otra área en la que sobresalen los archivos RAW. Los archivos RAW suelen contener un rango dinámico más amplio que los archivos JPEG, lo que permite conservar más detalles tanto en las luces como en las sombras. Esto es particularmente útil en escenas de alto contraste, donde el fotógrafo puede querer recuperar detalles en áreas brillantes u oscuras de la imagen.
A pesar de las muchas ventajas de los archivos RAW, también hay algunos inconvenientes a considerar. Uno de los principales desafíos es el mayor tamaño de archivo en comparación con los archivos JPEG. Dado que los archivos RAW contienen datos sin comprimir, requieren más espacio de almacenamiento y pueden llenar rápidamente las tarjetas de memoria. Además, los archivos RAW requieren un software especializado para su visualización y edición, ya que la mayoría de los visores de imágenes estándar no pueden mostrarlos directamente.
Cuando se trata de editar archivos RAW, los fotógrafos tienen una amplia gama de opciones de software disponibles, incluidos Adobe Lightroom, Capture One y DxO PhotoLab. Estos programas ofrecen herramientas avanzadas para ajustar la exposición, el color, la nitidez y otros parámetros de imagen, aprovechando al máximo los datos almacenados en los archivos RAW. Muchos de estos paquetes de software también incluyen perfiles específicos de la cámara que optimizan la representación de archivos RAW de modelos de cámara particulares.
Además de los formatos RAW propietarios utilizados por los fabricantes de cámaras, también existe un formato RAW de código abierto llamado DNG (Digital Negative), desarrollado por Adobe. DNG está diseñado para proporcionar un formato estandarizado y de archivo para almacenar datos de imagen RAW, con el objetivo de garantizar la compatibilidad a largo plazo y reducir la dependencia de formatos propietarios. Algunos fabricantes de cámaras han adoptado DNG como formato opcional, mientras que otros continúan utilizando sus propios formatos RAW propietarios.
Si bien los archivos RAW ofrecen ventajas significativas en términos de calidad de imagen y flexibilidad de edición, es posible que no sean necesarios o prácticos para todas las situaciones de disparo. En los casos en que la velocidad y la simplicidad son prioridades, como en la fotografía deportiva o de eventos, disparar en JPEG puede ser una opción más eficiente. Además, algunos fotógrafos pueden preferir el aspecto del procesamiento JPEG en la cámara, especialmente si han invertido tiempo en desarrollar perfiles de cámara personalizados.
En última instancia, la decisión de disparar en RAW o JPEG (o ambos) depende de las necesidades individuales del fotógrafo, el flujo de trabajo y las preferencias personales. Para aquellos que priorizan la calidad de imagen y la flexibilidad de posprocesamiento, disparar en RAW puede proporcionar una gran cantidad de datos para trabajar y permitir un mayor control creativo. Sin embargo, los fotógrafos también deben considerar factores como los requisitos de almacenamiento, el tiempo de edición y el uso previsto de las imágenes al decidir un formato de archivo.
A medida que la tecnología de imagen digital continúa evolucionando, es probable que los formatos RAW también avancen, ofreciendo profundidades de bits aún mayores, rango dinámico y otras mejoras. Los fabricantes también pueden desarrollar nuevas técnicas de compresión que reduzcan el tamaño de los archivos manteniendo los beneficios de los datos RAW. Independientemente de los desarrollos futuros, comprender las capacidades y limitaciones de los archivos RAW es esencial para los fotógrafos que desean maximizar la calidad y versatilidad de sus imágenes digitales.
La compresión de archivos reduce la redundancia para que la misma información ocupe menos bits. El límite superior de hasta dónde se puede llegar está gobernado por la teoría de la información: para la compresión sin pérdidas, el límite es la entropía de la fuente (véase el teorema de codificación de fuente y su artículo original de 1948 “Una teoría matemática de la comunicación”). Para la compresión con pérdidas, el equilibrio entre la tasa y la calidad se captura mediante la teoría de la tasa-distorsión.
La mayoría de los compresores tienen dos etapas. Primero, un modelo predice o expone la estructura de los datos. Segundo, un codificador convierte esas predicciones en patrones de bits casi óptimos. Una familia clásica de modelado es Lempel-Ziv: LZ77 (1977) y LZ78 (1978) detectan subcadenas repetidas y emiten referencias en lugar de bytes sin procesar. En el lado de la codificación, la codificación de Huffman (véase el artículo original de 1952) asigna códigos más cortos a los símbolos más probables. La codificación aritmética y la codificación por rangos son alternativas más detalladas que se acercan más al límite de la entropía, mientras que los modernos Sistemas Numéricos Asimétricos (ANS) logran una compresión similar con implementaciones rápidas basadas en tablas.
DEFLATE (utilizado por gzip, zlib y ZIP) combina LZ77 con la codificación de Huffman. Sus especificaciones son públicas: DEFLATE RFC 1951, envoltura zlib RFC 1950, y formato de archivo gzip RFC 1952. Gzip está diseñado para la transmisión y explícitamente no intenta proporcionar acceso aleatorio. Las imágenes PNG estandarizan DEFLATE como su único método de compresión (con una ventana máxima de 32 KiB), según la especificación de PNG “Método de compresión 0… deflate/inflate… como máximo 32768 bytes” y W3C/ISO PNG 2ª Edición.
Zstandard (zstd): un compresor de propósito general más nuevo diseñado para altas relaciones de compresión con una descompresión muy rápida. El formato está documentado en RFC 8878 (también espejo HTML) y la especificación de referencia en GitHub. Al igual que gzip, el marco básico no tiene como objetivo el acceso aleatorio. Uno de los superpoderes de zstd son los diccionarios: pequeñas muestras de su corpus que mejoran drásticamente la compresión en muchos archivos pequeños o similares (véase documentación del diccionario python-zstandard y el ejemplo práctico de Nigel Tao). Las implementaciones aceptan diccionarios tanto “no estructurados” como “estructurados” (discusión).
Brotli: optimizado para contenido web (por ejemplo, fuentes WOFF2, HTTP). Mezcla un diccionario estático con un núcleo de entropía+LZ similar a DEFLATE. La especificación es RFC 7932, que también señala una ventana deslizante de 2WBITS−16 con WBITS en [10, 24] (1 KiB−16 B hasta 16 MiB−16 B) y que no intenta el acceso aleatorio. Brotli a menudo supera a gzip en texto web mientras se decodifica rápidamente.
Contenedor ZIP: ZIP es un archivo de ficheros que puede almacenar entradas con varios métodos de compresión (deflate, store, zstd, etc.). El estándar de facto es la APPNOTE de PKWARE (véase APPNOTE portal, una copia alojada, y resúmenes de LC Formato de archivo ZIP (PKWARE) / ZIP 6.3.3).
LZ4 se centra en la velocidad bruta con relaciones modestas. Véase su página del proyecto („compresión extremadamente rápida“) y formato de trama. Es ideal para cachés en memoria, telemetría o rutas calientes donde la descompresión debe ser cercana a la velocidad de la RAM.
XZ / LZMA buscan la densidad (grandes relaciones) con una compresión relativamente lenta. XZ es un contenedor; el trabajo pesado lo realiza normalmente LZMA/LZMA2 (modelado tipo LZ77 + codificación por rangos). Véase formato de archivo .xz, la especificación de LZMA (Pavlov), y las notas del kernel de Linux sobre XZ Embedded. XZ suele comprimir más que gzip y a menudo compite con los códecs modernos de alta relación, pero con tiempos de codificación más lentos.
bzip2 aplica la Transformada de Burrows-Wheeler (BWT), move-to-front, RLE y codificación de Huffman. Suele ser más pequeño que gzip pero más lento; véase el manual oficial y las páginas del manual (Linux).
El „tamaño de la ventana“ importa. Las referencias de DEFLATE solo pueden mirar hacia atrás 32 KiB (RFC 1951 y el límite de 32 KiB de PNG señalado aquí). La ventana de Brotli varía de aproximadamente 1 KiB a 16 MiB (RFC 7932). Zstd ajusta la ventana y la profundidad de búsqueda por nivel (RFC 8878). Los flujos básicos de gzip/zstd/brotli están diseñados para la decodificación secuencial; los formatos base no prometen acceso aleatorio, aunque los contenedores (por ejemplo, índices tar, tramas fragmentadas o índices específicos del formato) pueden superponerlo.
Los formatos anteriores son sin pérdidas: se pueden reconstruir los bytes exactos. Los códecs de medios suelen ser con pérdidas: descartan detalles imperceptibles para alcanzar tasas de bits más bajas. En imágenes, el JPEG clásico (DCT, cuantificación, codificación de entropía) está estandarizado en ITU-T T.81 / ISO/IEC 10918-1. En audio, MP3 (MPEG-1 Layer III) y AAC (MPEG-2/4) se basan en modelos perceptuales y transformadas MDCT (véase ISO/IEC 11172-3, ISO/IEC 13818-7, y un resumen de MDCT aquí). Con y sin pérdidas pueden coexistir (por ejemplo, PNG para activos de interfaz de usuario; códecs web para imágenes/vídeo/audio).
Teoría: Shannon 1948 · Tasa-distorsión · Codificación: Huffman 1952 · Codificación aritmética · Codificación por rangos · ANS. Formatos: DEFLATE · zlib · gzip · Zstandard · Brotli · Trama LZ4 · Formato XZ. Pila BWT: Burrows–Wheeler (1994) · manual de bzip2. Medios: JPEG T.81 · MP3 ISO/IEC 11172-3 · AAC ISO/IEC 13818-7 · MDCT.
En resumen: elija un compresor que se ajuste a sus datos y restricciones, mida con entradas reales y no olvide las ganancias de los diccionarios y el entramado inteligente. Con la combinación adecuada, puede obtener archivos más pequeños, transferencias más rápidas y aplicaciones más ágiles, sin sacrificar la corrección o la portabilidad.
La compresión de archivos es un proceso que reduce el tamaño de un archivo o archivos, típicamente para ahorrar espacio de almacenamiento o acelerar la transmisión a través de una red.
La compresión de archivos funciona identificando y eliminando la redundancia en los datos. Utiliza algoritmos para codificar los datos originales en un espacio menor.
Los dos tipos principales de compresión de archivos son la compresión sin pérdida y la compresión con pérdida. La compresión sin pérdida permite restaurar perfectamente el archivo original, mientras que la compresión con pérdida permite una reducción de tamaño más significativa a costa de alguna pérdida en la calidad de los datos.
Un ejemplo popular de una herramienta de compresión de archivos es WinZip, que admite varios formatos de compresión incluyendo ZIP y RAR.
Con la compresión sin pérdida, la calidad permanece sin cambios. Sin embargo, con la compresión con pérdida, puede haber una disminución notable en la calidad, ya que elimina datos menos importantes para reducir de manera más significativa el tamaño del archivo.
Sí, la compresión de archivos es segura en términos de integridad de datos, especialmente con la compresión sin pérdida. Sin embargo, como en todos los archivos, los archivos comprimidos pueden ser objeto de malware o virus, por lo que siempre es importante tener un software de seguridad de confianza en funcionamiento.
Casi todos los tipos de archivos se pueden comprimir, incluyendo archivos de texto, imágenes, audio, video y archivos de software. Sin embargo, el nivel de compresión alcanzable puede variar significativamente entre los tipos de archivos.
Un archivo ZIP es un tipo de formato de archivo que utiliza compresión sin pérdida para reducir el tamaño de uno o varios archivos. Varios archivos en un archivo ZIP se agrupan efectivamente en un solo archivo, lo que también facilita la compartición.
Técnicamente, sí, aunque la reducción de tamaño adicional podría ser mínima o incluso contraproducente. Comprimir un archivo ya comprimido a veces aumenta su tamaño debido a los metadatos agregados por el algoritmo de compresión.
Para descomprimir un archivo, generalmente necesitas una herramienta de descompresión, como WinZip o 7-Zip. Estas herramientas pueden extraer los archivos originales del formato comprimido.