RAW 是一种数字图像格式,它包含直接从数码相机图像传感器捕获的未经处理或经过最少处理的数据。与 JPEG 等其他常见图像格式不同,JPEG 会应用压缩并丢弃一些原始图像数据,而 RAW 文件会保留相机传感器收集的所有原始数据。这允许在后期处理中获得显著的灵活性和控制力,因为摄影师可以访问相机捕获的全部数据范围。
RAW 格式不是单一的标准化格式,而是一个通用术语,它涵盖了相机制造商开发的各种专有格式。每个相机制造商都有自己特定的 RAW 格式,例如佳能的 .CR2、尼康的 .NEF、索尼的 .ARW 和 Adobe 的 Digital Negative 格式的 .DNG。尽管文件扩展名和特定数据结构不同,但所有 RAW 格式都服务于存储未压缩、经过最少处理的图像数据的相同目的。
与 JPEG 文件相比,以 RAW 格式拍摄的主要优点之一是增加了位深度。虽然 JPEG 文件通常限制为每个颜色通道(红色、绿色和蓝色)8 位,但 RAW 文件每个通道可以包含 12、14 甚至 16 位。这种更高的位深度允许更广泛的颜色和色调值范围,为后期处理中的调整提供了更大的自由度,而不会引入伪影或丢失细节。
RAW 文件的另一个好处是保留了元数据,其中包括有关拍摄期间使用的相机设置的信息,例如 ISO、快门速度、光圈、白平衡等。此元数据嵌入在 RAW 文件中,后期处理软件可以使用它来优化图像调整并保留原始相机设置的记录。
在白平衡调整方面,RAW 文件的灵活性尤为明显。由于 RAW 文件包含来自相机传感器的未处理颜色数据,因此可以在后期处理中轻松修改白平衡设置,而不会显着降低质量。这与 JPEG 文件形成对比,在 JPEG 文件中,白平衡在相机内处理期间永久烘焙到图像中。
动态范围是指相机传感器可以捕获的亮度值范围,这是 RAW 文件表现出色的另一个领域。RAW 文件通常包含比 JPEG 文件更宽的动态范围,从而可以在高光和阴影中保留更多细节。这在高对比度场景中特别有用,在该场景中,摄影师可能希望恢复图像中明亮或黑暗区域的细 节。
尽管 RAW 文件有很多优点,但也有一些缺点需要考虑。与 JPEG 文件相比,主要挑战之一是文件更大。由于 RAW 文件包含未压缩的数据,因此它们需要更多的存储空间,并且可以快速填满存储卡。此外,RAW 文件需要专门的软件才能查看和编辑,因为大多数标准图像查看器无法直接显示它们。
在编辑 RAW 文件时,摄影师可以使用各种软件选项,包括 Adobe Lightroom、Capture One 和 DxO PhotoLab。这些程序提供了用于调整曝光、颜色、锐度和其他图像参数的高级工具,充分利用 RAW 文件中存储的数据。其中许多软件包还包括特定于相机的配置文件,这些配置文件优化了来自特定相机型号的 RAW 文件的渲染。
除了相机制造商使用的专有 RAW 格式外,还有一个由 Adobe 开发的开源 RAW 格式,称为 DNG(Digital Negative)。DNG 被设计为一种标准化的存档格式,用于存储 RAW 图像数据,其目标是确保长期兼容性并减少对专有格式的依赖。一些相机制造商已将 DNG 作为可选格式采用,而另一些相机制造商则继续使用自己的专有 RAW 格式。
虽然 RAW 文件在图像质量和编辑灵活性方面提供了显着的优势,但它们可能不是每种拍摄情况都必需或实用的。在速度和简单性优先的情况下,例如在体育或活动摄影中,以 JPEG 格式拍摄可能是更有效的选择。此外,一些摄影师可能更喜欢相机内 JPEG 处理的外观,特别是如果他们投入时间开发自定义相机配置文件。
最终,以 RAW 或 JPEG(或两者)拍摄的决定取决于个别摄影师的需求、工作流程和个人偏好。对于那些优先考虑图像质量和后期处理灵活性的摄影师来说,以 RAW 格式拍摄可以提供大量数据,并允许更大的创造性控制。但是,摄影师在决定文件格式时还应考虑存储要求、编辑时间和图像的预期用 途。
随着数字成像技术不断发展,RAW 格式也可能会进步,提供更大的位深度、动态范围和其他改进。制造商还可能开发新的压缩技术,在保持 RAW 数据优势的同时减小文件大小。无论未来如何发展,了解 RAW 文件的功能和限制对于希望最大化其数字图像质量和多功能性的摄影师至关重要。
文件压缩通过减少冗余,让相同的信息占用更少的比特。可压缩的上限受信息论约束:对于无损压缩,上界是信源熵(参见香农的信源编码定理及其 1948 年的原始论文《通信的数学理论》)。对于有损压缩,码率与感知质量之间的权衡由率失真理论描述。
大多数压缩器分两步。首先,模型预测或揭示数据中的结构。然后,编码器把这些预测变成近乎最优的比特模式。一个经典的建模家族是 Lempel–Ziv:LZ77 (1977)和 LZ78 (1978) 会检测重复子串并输出引用而不是原始字节。在编码端,霍夫曼编码(见原始论文1952)会为更常见的符号分配更短的代码。算术编码和范围编码能更贴近熵极限,而现代的非对称数值系统(ANS)用查表实现获得相似的压缩率。
DEFLATE(被 gzip、zlib 与 ZIP 采用)结合了 LZ77 和霍夫曼编码。其规范完全公开:DEFLATERFC 1951、zlib 封装RFC 1950以及 gzip 文件格式RFC 1952。Gzip 面向流式传输并明确不提供随机访问。PNG 图像标准化将 DEFLATE 作为唯一的压缩方法(窗口最多 32 KiB),可见 PNG 规范“Compression method 0… deflate/inflate… at most 32768 bytes”和W3C/ISO PNG 第二版。
Zstandard (zstd): 面向高压缩率与快速解压的通用压缩器。格式记录在RFC 8878(还有HTML 镜像)以及 GitHub 上的参考规范