JPEG,即联合图像专家组,是一种常用的有损数字图像压缩方法,尤其适用于数码摄影产生的图像。压缩程度可以调整,允许在存储大小和图像质量之间进行可选择的权衡。JPEG 通常可以实现 10:1 的压缩,而图像质量几乎没有明显损失。
JPEG 压缩算法是 JPEG 标准的核心。该过程从将数字图像从其典型的 RGB 色彩空间转换为称为 YCbCr 的不同色彩空间开始。YCbCr 色彩空间将图像分为亮度 (Y),它表示亮度级别,以及色度 (Cb 和 Cr),它表示颜色信息。这种分离是有益的,因为人眼对亮度的变化比对颜色的变化更敏感,从而允许压缩利用这一点,通过比亮度更多地压缩颜色信息。
一旦图像处于 YCbCr 色彩空间中,JPEG 压缩过程中的下一步就是对色度通道进行下采样。下采样会降低色度信息的解析度,这通常不会显著影响图像的感知质量,因为人眼对颜色细节的敏感度较低。此步骤是可选的,可以根据所需的图像质量和文件大小之间的平衡进行调整。
下采样后,图像被分成块,通常大小为 8x8 像素。然后分别处理每个块。处理每个块的第一步是应用离散余弦变换 (DCT)。DCT 是一种数学运算,它将空间域数据(像素值)转换为频域。结果是一个频率系数矩阵,它根据其空间频率分量表示图像块的数据。
然后对 DCT 产生的频率系数进行量化。量化是将一大组输入值映射到一小组的过程——在 JPEG 的情况下,这意味着降低频率系数的精度。这是有损压缩发生的地方,因为一些图像信息被丢弃。量化步骤由量化表控制,该量化表确定对每个频率分量应用多少压缩。量化表可以调整为偏向更高的图像质量(更少的压缩)或更小的文件大小(更多的压缩)。
量化后,系数按锯齿形顺序排列,从左上角开始,并遵循一种优先考虑低频分量而不是高频分量的模式。这是因为低频分量(表示图像的更均匀部分)比高频分量(表示更精细的细节和边缘)对整体外观更重要。
JPEG 压缩过程中的下一步是熵编码,这是一种无损压缩方法。JPEG 中最常用的熵编码形式是霍夫曼编码,尽管算术编码也是一种选择。霍夫曼编码通过为更频繁出现的项分配更短的代码,为不太频繁出现的项分配更长的代码来工作。由于锯齿形排序倾向于将类似的频率系数分组在一起,因此它提高了霍夫曼编码的效率。
一旦熵编码完成,压缩数据就会存储在符合 JPEG 标准的文件格式中。此文件格式包括一个包含有关图像的信息的标头,例如其尺寸和使用的量化表,然后是霍夫曼编码的图像数据。该文件格式还支持包含元数据,例如 EXIF 数据,其中可以包含有关用于拍摄照片的相机设置、拍摄日期和时间以及其他相关详细信息的信息。
当打开 JPEG 图像时,解压缩过程实质上会逆转压缩步骤。霍夫曼编码的数据被解码,量化的频率系数使用压缩期间使用的相同量化表进行反量化,并对每个块应用逆离散余弦变换 (IDCT) 以将频域数据转换回空间域像素值。
反量化和 IDCT 过程由于压缩的有损性质而引入了一些错误,这就是为什么 JPEG 不适用于将进行多次编辑和重新保存的图像。每次保存 JPEG 图像时,它都会再次经历压缩过程,并且会丢失额外的图像信息。随着时间的推移,这会导致图像质量明显下降,这种现象称为“代损”。
尽管 JPEG 压缩具有有损性质,但由于其灵活性和效率,它仍然是一种流行的图像格式。JPEG 图像的文件大小可以非常小,这使得它们非常适合在带宽和加载时间是重要考虑因素的网络上使用。此外,JPEG 标准包括渐进模式,它允许以这样的方式对图像进行编码,即它可以在多次扫描中解码,每次扫描都会提高图像的分辨率。这对于网络图像特别有用,因为它允许快速显示图像的低质量版本,随着更多数据的下载,质量会得到提高。
JPEG 也有一些限制,并不总是所有类型图像的最佳选择。例如,它不适合具有锐利边缘或高对比度文本的图像,因为压缩会在这些区域周围产生明显的伪影。此外,JPEG 不支持透明度,这是 PNG 和 GIF 等其他格式提供的功能。
为了解决原始 JPEG 标准的一些限制,已经开发了新的格式,例如 JPEG 2000 和 JPEG XR。这些格式提供了改进的压缩效率、对更高位深度的支持以及透明度和无损压缩等附加功能。然而,它们尚未达到与原始 JPEG 格式相同的广泛采用程度。
总之,JPEG 图像格式是数学、人类视觉心理学和计算机科学的复杂平衡。它的广泛使用证明了它在减小文件大小的同时保持大多数应用程序可接受的图像质量方面的有效性。了解 JPEG 的技术方面可以帮助用户在何时使用此格式以及如何优化其图像以平衡最适合其需求的质量和文件大小方面做出明智的决策。
图形交换格式 (GIF) 是一种广泛用于互联网的位图图像格式。最初版本称为 GIF87,由 CompuServe 于 1987 年发布,为其文件下载区域提供彩色图像格式。这是为了响应彩色计算机的增加以及对可以在不同软件和硬件平台上使用的标准图像格式的需求。GIF87 格式虽然在 1989 年被 GIF89a 取代,但它奠定了 GIF 的基本原则。其简单性、广泛支持和可移植性使其成为网络图形的持久选择。
GIF 基于 LZW(Lempel-Ziv-Welch)压缩算法,这是其早期流行的一个关键因素。LZW 算法是一种无损数据压缩技术,这意味着它可以减小文件大小,而不会丢失原始图像的任何信息或质量。在互联网速度慢得多且数据节省至关重要的时期,这一点尤其重要。LZW 算法通过将重复的像素序列替换为单个引用来工作,有效地减少了表示图像所需的数据量。
GIF87 格式的一个决定性特征是对索引颜色的支持。与直接为每个像素存储颜色信息的格式不同,GIF87 使用最多 256 种 颜色的调色板。GIF87 图像中的每个像素都由一个字节表示,该字节引用调色板中的索引。这种基于调色板的方法是在色彩保真度和文件大小之间的一种折衷。它允许使用相对丰富多彩的图像,同时保持数据大小可控,即使在早期网络基础设施的限制下也是如此。
除了其颜色模型之外,GIF87 格式还包括其他几个重要功能。其中之一是其隔行扫描功能,它允许在慢速连接上逐步加载图像。隔行扫描不会从上到下加载图像,而是以多次扫描加载图像,每次扫描都比上一次更详细。这意味着观众可以快速获得图像的粗略预览,从而在万维网的早期阶段显著改善用户体验。
GIF87 文件的结构相对简单,包括一个头文件、一个逻辑屏幕描述符、一个全局颜色表、图像数据,最后是一个尾部以指示文件结束。头文件包含签名(“GIF87a”)和版本信息。逻辑屏幕描述符提供有关图像尺寸的详细信息,以及是否使用全局颜色表。全局颜色表本身紧随其后,其中包含图像中使用的颜色的定义。图像数据段包括有关图像开始和大小的信息,然后是 LZW 压缩的像素数据。最后,文件以一个字节的尾部结束,表示文件结束。
GIF87 格式的一个限制是它不支持动画和透明度。这些功能在其后继产品 GIF89a 中引入。然而,即使没有这些功能,GIF87 也在早期网络中广泛用于徽标、图标和简单图形。该格式能够有效压缩图像,同时保持质量,使其非常适合当时的带宽限制。
GIF87 格式设计的另一个方面是其简单性和易于实现。该格式被设计为易于读写,使其对软件开发人员来说很容易访问。这种易用性帮助 GIF 成为网络上图像的标准格式,几乎所有图像编辑软件和网络浏览器都支持它。GIF 的广泛采用可以说为当今网络上常见的丰富的多媒体体验铺平了道路。
尽管有其优势,GIF87 格式也并非没有争议,特别是关于 LZW 压缩算法。LZW 压缩专利权的持有者 Unisys 在 20 世纪 90 年代中期开始执行其专利权。这种执行引起了广泛的批评,并促进了不受专利问题困扰的替代图像格式的发展。这场争论凸显了软件专利及其对网络技术发展的影响的复杂性。最终,该专利到期,缓解了围绕 GIF 格式的法律问题。
GIF87 对网络图形发展的贡献不可低估。它的引入提供了一种手段,可以在新兴的互联网上轻松共享色彩丰富、紧凑的图像。虽然技术已经进步,新的格式已经出现,但 GIF87 确定的原则仍然影响着图像在网络上的使用方式。例如,在不明显降低质量的情况下强调压缩是现代网络标准的基石。同样,调色板的概念可以在各种形式的新格式中看到,这些格式旨在优化文件大小以适应显示功能。
在其发布后的几十年里,GIF87 已被更高级的格式所取代,这些格式提供了更大的色彩深度、更小的文件大小以及动画和透明度等功能。PNG(便携式网络图形)和 WebP 就是两个这样的例子,它们提供了无损压缩的替代方案,以及对更多颜色和透明度的支持,而没有调色板的限制。尽管如此,GIF(包括 GIF87 和 GIF89a)由于其简单性、广泛支持以及通过动画模因和图形捕捉文化时代精神的独特能力而仍然很流行。
回顾 GIF87 的发展和影响,很明显,它的遗产不仅在于技术规范或它引发的争议,还在于它如何帮助塑造互联网的视觉语言。该格式的限制通常成为创造性的挑战,从而导致了新的数字艺术和交流风格。随着我们继续突破数字图像的可能性的界限,了解 GIF87 等格式的历史和技术基础为创新、标准化和用户体验之间的平衡提供了宝贵的经验教训。
这个转换器完全在您的浏览器中运行。当您选择一个文件时,它将被读入内存并转换为所选格式。 然后,您可以下载转换后的文件。
转换立即开始,大多数文件在一秒钟内完成转换。较大的文件可能需要更长时间。
您的文件永远不会上传到我们的服务器。它们在您的浏览器中转换,然后下载转换后的文件。我们永远看不到您的文件。
我们支持在所有图像格式之间进行转换,包括 JPEG、PNG、GIF、WebP、SVG、BMP、TIFF 等等。
这个转换器完全免费,并将永远免费。因为它在您的浏览器中运行,所以我们不需要为服务器付费,因此我们不需要向您收费。