背景移除将主体与其周围环境分离开来,这样你就可以将其放置在 透明背景上、更换场景或将其合成为新设计。在底层,你正在估算一个 alpha 遮罩——一个从 0 到 1 的每像素不透明度——然后将前景alpha 合成到 其他东西上。这是 Porter–Duff 的数学原理,也是“边缘”和 直接 alpha 与预乘 alpha 等常见陷阱的起因。有关预乘和线性颜色的实用指南,请参阅 微软的 Win2D 笔记、 Søren Sandmann 和 Lomont 关于线性混合的文章。
如果你能控制拍摄,将背景涂成纯色(通常是绿色),然后抠掉该色调。 这种方法速度快,在电影和广播中经过实战检验,非常适合视频。权衡之处在于灯光和服装: 彩色光会溢出到边缘(尤其是头发),所以你需要使用去溢工具来中和污染。 好的入门资料包括 Nuke 的文档、 Mixing Light 和一个实践性的 Fusion 演示。
对于背景杂乱的单张图片,交互式算法需要用户提供一些提示——例如,一个宽松的 矩形或涂鸦——然后收敛到一个清晰的蒙版。经典方法是 GrabCut (书籍章节),它学习前景/背景的颜色模型,并迭代使用图割来分离它们。 你会在 GIMP 的前景选择中看到类似的想法,它基于 SIOX (ImageJ 插件)。
抠图解决在纤细边界(头发、毛皮、烟雾、玻璃)处的部分透明度问题。经典的 闭式抠图 接受一个三元图(绝对前景/绝对背景/未知),并求解一个具有强边缘保真度的 alpha 线性系统。现代的 深度图像抠图 在 Adobe Composition-1K 数据集上训练神经网络(MMEditing 文档),并使用 SAD、MSE、梯度和连通性等指标进行评估(基准解释器)。
相关的分割工作也很有用: DeepLabv3+ 使用编码器-解码器和空洞卷积来细化边界 (PDF); Mask R-CNN 提供每个实例的蒙版 (PDF);以及 SAM (Segment Anything) 是一个 可提示的基础模型,可在不熟悉的图像上进行零样本蒙版生成。
学术著作报告了在 Composition-1K 上的 SAD、MSE、梯度和连通性错误。如果你正在选择一个模型,请查找这些指标 (指标定义; 背景抠图指标部分)。 对于人像/视频,MODNet 和 背景抠图 V2 很强大;对于一般的“显著物体”图像, U2-Net 是一个坚实的基线;对于棘手的透明度, FBA 可能更干净。
JP2 或 JPEG 2000 第 1 部分文件格式是一种图像编码系统,由联合图像专家组创建,作为原始 JPEG 标准的继任者。它于 2000 年推出,正式名称为 ISO/IEC 15444-1 。与它的前身不同,JPEG 2000 被设计为提供一种更高效、更灵活的图像压缩技术,可以解决原始 JPEG 格式的一些局限性。JPEG 2000 使用基于小波的压缩,它允许在同一个文件中进行无损和有损压缩,从而提供更高的可扩展性和图像保真度。
JPEG 2000 格式的一个关键特性是它使用离散小波变换 (DWT),而不是原始 JPEG 格式中使用的离散余弦变换 (DCT)。DWT 比 DCT 具有多个优势,包括更好的压缩效率,特别是对于高分辨率图像,以及减少块状伪影。这是因为小波变换能够以不同的细节级别表示图像,可以根据应用程序的特定需求或用户的偏好进行调整。
JP2 格式支持广泛的色彩空间,包括灰度、RGB、YCbCr 等,以及各种位深度,从二进制图像到每个通道 16 位。这种灵活性使其适用于各种应用程序,从数码摄影到医学成像和遥感。此外,JPEG 2000 通过使用 Alpha 通道支持透明度,这是标准 JPEG 格式中不可能的。
JPEG 2000 的另一个重要优势是它支持渐进解码。这意味着可以在整个文件下载之前以较低的分辨率和质量级别解码和显示图像,这对于 Web 应用程序特别有用。随着更多数据的可用,图像质量可以逐步提高。此功能称为“质量层”,它允许有效利用带宽,并在带宽受限的环境中提供更好的用户体验。
JPEG 2000 还引入了“感兴趣区域”(ROI) 的概念。使用 ROI,图像的某些部分可以比图像的其余部分以更高的质量进行编码。当需要将注意力吸引到图像中的特定区域时,这特别有用,例如在监视或医学诊断中,重点可能放在图像中的特定异常或特征上。
JP2 格式包括强大的元数据处理功能。它可以存储广泛的元数据信息,例如国际电信理事会新闻处 (IPTC) 元数据、Exif 数据、XML 数据,甚至知识产权信息。这种全面的元数据支持促进了更好的图像编目和存档,并确保了有关图像的重要信息得到保留并且可以轻松访问。
抗错性是 JPEG 2000 的另一个特性,使其适用于可能发生数据丢失的网络,例如无线或卫星通信。该格式包括错误检测和纠正机制,这有助于确保即使在传输过程中某些数据已损坏,图像也能正确解码。
与以类似质量级别编码的 JPEG 文件相比,JPEG 2000 文件通常更大,这是其广泛采用的障碍之一。但是,对于图像质量至关重要且文件大小增加不是主要问题的情况,JPEG 2000 提供了明显的优势。还值得注意的是,与 JPEG 相比,该格式的卓越压缩效率可以在更高的质量级别下产生更小的文件大小,特别是对于高分辨率图像。
JP2 格式是可扩展的,并且被设计为称为 JPEG 2000 的更大标准套件的一部分。该套件包括扩展基本格式功能的各个部分,例如支持动态图像(JPEG 2000 第 2 部分)、安全图像传输(JPEG 2000 第 8 部分)和交互式协议(JPEG 2000 第 9 部分)。这种可扩展性确保了该格式可以不断发展以满足未来多媒体应用程序的需求。
在文件结构方面,JP2 文件由一系列盒子组成,每个盒子都包含特定类型的数据。这些盒子包括文件签名盒子,它将文件标识为 JPEG 2000 码流;文件类型盒子,它指定媒体类型和兼容性;以及头文件盒子,它包含图像属性,例如宽度、高度、色彩空间和位深度。其他盒子可以包含颜色规范数据、索引颜色图像的调色板数据、分辨率信息和知识产权数据。
JP2 文件中的实际图像数据包含在“连续码流”框中,其中包括压缩的图像数据和任何编码样式信息。码流被组织成“图块”,它们是图像的独立编码段。此平铺功能允许有效地随机访问图像的各个部分,而无需解码整个图像,这对于大图像或仅需要图像的 一部分时非常有益。
JPEG 2000 中的压缩过程涉及几个步骤。首先,图像可以进行预处理,其中可能包括平铺、颜色转换和降采样。接下来,应用 DWT 将图像数据转换为分层系数集,这些系数以不同的分辨率和质量级别表示图像。然后对这些系数进行量化,这可以以无损或有损的方式进行,并且使用算术编码或二叉树编码等技术对量化值进行熵编码。
采用 JPEG 2000 的挑战之一是编码和解码过程的计算复杂性,它们比原始 JPEG 标准的计算复杂性更高。这限制了它在某些实时或低功耗应用程序中的使用。然而,计算能力的进步以及优化算法和硬件加速器的开发使 JPEG 2000 更容易用于更广泛的应用程序。
尽管有其优势,JPEG 2000 并没有在大多数主流应用程序中取代原始 JPEG 格式。JPEG 的简单性、广泛的支持以及现有基础设施的惯性促成了它持续的主导地位。然而,JPEG 2000 在专业领域找到了一个利基市场,其高级功能(例如更高的动态范围、无损压缩和卓越的图像质量)至关重要。它通常用于医学成像、数字电影、地理空间成像和归档存储,其中该格式的优点超过了文件大小更大、计算要求更高的缺点。
总之,JPEG 2000 图像格式代表了图像压缩技术的一项重大进步,提供了一系列功能,改进了原始 JPEG 标准的局限性。它使用基于小波的压缩可以生成具有可扩展分辨率和质量的高质量图像,并且它对渐进解码、感兴趣区域和强大元数据的支持使其成为许多专业应用程序的通用选择。虽然它尚未成为图像压缩的通用标准,但 JPEG 2000 仍然是图像质量和保真度至关重要的行业的宝贵工具。
这个转换器完全在您的浏览器中运行。当您选择一个文件时,它将被读入内存并转换为所选格式。 然后,您可以下载转换后的文件。
转换立即开始,大多数文件在一秒钟内完成转换。较大的文件可能需要更长时间。
您的文件永远不会上传到我们的服务器。它们在您的浏览器中转换,然后下载转换后的文件。我们永远看不到您的文件。
我们支持在所有图像格式之间进行转换,包括 JPEG、PNG、GIF、WebP、SVG、BMP、TIFF 等等。
这个转换器完全免费,并将永远免费。因为它在您的浏览器中运行,所以我们不需要为服务器付费,因此我们不需要向您收费。
是的!您可以同时转换尽可能多的文件。只需在添加时选择多个文件即可。