JPG 背景移除器
拖放 或 点击选择
私密和安全
一切都在您的浏览器中进行。您的文件绝不接触我们的服务器。
极速
无需上传,无需等待。在您拖放文件的瞬间即可转换。
完全免费
无需帐户。无隐藏费用。无文件大小限制花招。
背景移除将主体与其周围环境分离开来,这样你就可以将其放置在 透明背景上、更换场景或将其合成为新设计。在底层,你正在估算一个 alpha 遮罩——一个从 0 到 1 的每像素不透明度——然后将前景alpha 合成到 其他东西上。这是 Porter–Duff 的数学原理,也是“边缘”和 直接 alpha 与预乘 alpha 等常见陷阱的起因。有关预乘和线性颜色的实用指南,请参阅 微软的 Win2D 笔记、 Søren Sandmann 和 Lomont 关于线性混合的文章。
人们移除背景的主要方式
1) 色度键(“绿/蓝屏”)
如果你能控制拍摄,将背景涂成纯色(通常是绿色),然后抠掉该色调。 这种方法速度快,在电影和广播中经过实战检验,非常适合视频。权衡之处在于灯光和服装: 彩色光会溢出到边缘(尤其是头发),所以你需要使用去溢工具来中和污染。 好的入门资料包括 Nuke 的文档、 Mixing Light 和一个实践性的 Fusion 演示。
2) 交互式分割(经典计算机视觉)
对于背景杂乱的单张图片,交互式算法需要用户提供一些提示——例如,一个宽松的 矩形或涂鸦——然后收敛到一个清晰的蒙版。经典方法是 GrabCut (书籍章节),它学习前景/背景的颜色模型,并迭代使用图割来分离它们。 你会在 GIMP 的前景选择中看到类似的想法,它基于 SIOX (ImageJ 插件)。
3) 图像抠图(细粒度 alpha)
抠图解决在纤细边界(头发、毛皮、烟雾、玻璃)处的部分透明度问题。经典的 闭式抠图 接受一个三元图(绝对前景/绝对背景/未知),并求解一个具有强边缘保真度的 alpha 线性系统。现代的 深度图像抠图 在 Adobe Composition-1K 数据集上训练神经网络(MMEditing 文档),并使用 SAD、MSE、梯度和连通性等指标进行评估(基准解释器)。
4) 深度学习抠图(无三元图)
- U2-Net(显著性物体检测)是一个强大的通用“移除背景”引擎 (代码库)。
- MODNet 针对实时人像抠图(PDF)。
- F, B, Alpha (FBA) 抠图 联合预测前景、背景和 alpha,以减少颜色光晕 (代码库)。
- 背景抠图 V2 假设有一个背景板,并以高达 4K/30fps 的速度实时产生发丝级抠图 (项目页面, 代码库)。
相关的分割工作也很有用: DeepLabv3+ 使用编码器-解码器和空洞卷积来细化边界 (PDF); Mask R-CNN 提供每个实例的蒙版 (PDF);以及 SAM (Segment Anything) 是一个 可提示的基础模型,可在不熟悉的图像上进行零样本蒙版生成。
流行工具的功能
- Photoshop: 移除背景 快速操作在底层运行“选择主体 → 图层蒙版” (此处确认; 教程)。
- GIMP: 前景选择 (SIOX)。
- Canva: 一键式 背景移除器,适用于图像和短视频。
- remove.bg: 用于自动化的 Web 应用程序 + API。
- Apple 设备: 照片/Safari/快速查看中的系统级“从照片背景中提取主体” (iOS 上的抠图)。
更清晰抠图的工作流程提示
- 智能拍摄。 良好的光线和强烈的主体-背景对比度对每种方法都有帮助。对于绿/蓝屏,请计划 去溢 (指南)。
- 从宽到窄。 运行自动选择(选择主体、 U2-Net、 SAM),然后用画笔或抠图(例如 闭式)细化边缘。
- 注意半透明。 玻璃、面纱、运动模糊、飞扬的头发需要真正的 alpha(不仅仅是硬蒙版)。同时恢复 F/B/α 的方法可以最大限度地减少光晕。
- 了解你的 alpha。 直接与预乘产生不同的边缘行为;一致地导出/合成(参见 概述、 Hargreaves)。
- 选择正确的输出。 对于“无背景”,提供一个带有干净 alpha 的光栅图(例如 PNG/WebP),或者如果需要进一步编辑,则保留带有蒙版的图层文件。关键在于你计算的 alpha 质量——植根于 Porter–Duff。
质量与评估
学术著作报告了在 Composition-1K 上的 SAD、MSE、梯度和连通性错误。如果你正在选择一个模型,请查找这些指标 (指标定义; 背景抠图指标部分)。 对于人像/视频,MODNet 和 背景抠图 V2 很强大;对于一般的“显著物体”图像, U2-Net 是一个坚实的基线;对于棘手的透明度, FBA 可能更干净。
常见边缘情况(及修复)
- 头发和毛皮: 倾向于抠图(三元图或像 MODNet 这样的人像抠图)并在棋盘格上检查。
- 精细结构(自行车辐条、鱼线): 使用高分辨率输入和像 DeepLabv3+ 这样的边界感知分割器作为抠图前的预处理步骤。
- 透明物体(烟雾、玻璃): 你需要分数 alpha 和通常的前景色估计 (FBA)。
- 视频会议: 如果你能捕捉到一个干净的背景板, 背景抠图 V2 看起来比简单的“虚拟背景”切换更自然。
这在现实世界中的应用
- 电子商务: 市场(例如亚马逊)通常要求主图背景为纯白色;请参阅 产品图片指南 (RGB 255,255,255)。
- 设计工具: Canva 的 背景移除器 和 Photoshop 的 移除背景 简化了快速抠图。
- 设备上的便利性: iOS/macOS 的“从照片背景中提取主体”非常适合休闲分享。
为什么抠图有时看起来很假(及修复)
- 颜色溢出: 绿色/蓝色光包裹着主体——使用 去溢控制 或有针对性的颜色替换。
- 光晕/边缘: 通常是 alpha 解释不匹配(直接与预乘)或边缘像素被旧背景污染;正确转换/解释 (概述, 详情)。
- 错误的模糊/颗粒: 将一个锐利的主体粘贴到一个柔和的背景上,它会显得突兀;在合成后匹配镜头模糊和颗粒(参见 Porter–Duff 基础)。
TL;DR 速查手册
什么是JPG格式?
联合图像专家小组 JFIF 格式
JPEG 2000 多层 (JPM) 格式是 JPEG 2000 标准的扩展,JPEG 2000 标准是一种图像压缩标准和编码系统。它由联合图像专家组委员会于 2000 年创建, 目的是取代原始 JPEG 标准。JPEG 2000 以其高压缩效率和处理各种图像类型(包括灰度、彩色和多组件图像)的能力而闻名。JPM 格式专门扩展了 JPEG 2000 的功能,以支持复合文档,其中可以包含文本、图形和图像的混合。
JPM 在 JPEG 2000 套件(ISO/IEC 15444-6)的第 6 部分中定义,它旨在将多个图像和相关数据封装到一个文件中。这使其特别适用于需要将不同类型的内容存储在一起的应用程序,例如文档成像、医学成像和技术成像。JPM 格式允许在文档中高效存储页面,每个页面都可以包含具有不同特征的多个图像区域,以及非图像数据,例如注释或元数据。
JPM 的一个关键特性是它使用了 JPEG 2000 代码流 (JPX),它是基本 JPEG 2000 代码流 (JP2) 的扩展版本。JPX 支持更广泛的色彩空间、更复杂的元数据和更高的位深度。在 JPM 文件中,每个图像或“层”都存储为一个单独的 JPX 代码流。这允许根据每个层的特征对其进行压缩,这可以带来更有效的压缩和更高的质量结果,特别是对于具有不同内容类型的复合文档。
JPM 文件的结构是分层的,由一系列盒子组成。盒子是一个自包含的单元,包括一个头和数据。头指定盒子的类型和长度,而数据包含实际内容。JPM 文件中的顶级盒子是签名盒子,它将文件标识为 JPEG 2000 系列文件。在签名框之后,还有文件类型框、头框和内容框等。头框包含有关文件的信息,例如页数和每页的属性,而内容框包含图像数据和任何关联的非图像数据。
在压缩方面,JPM 文件可以使用无损和有损压缩方法。无损压缩确保可以从压缩数据中完美重建原始图像数据,这对于图像完整性至关重要的应用程序(例如医学成像)至关重要。另一方面,有损压缩通过丢弃一些图像数据来允许更小的文件大小,这在不 需要完美保真度的情况下是可以接受的。
JPM 还支持“渐进解码”的概念,这意味着可以在下载或处理全分辨率图像时显示图像的低分辨率版本。这对于大图像或慢速网络连接特别有用,因为它允许用户快速预览,而无需等待整个文件可用。
JPM 的另一个重要方面是对元数据的支持。JPM 文件中的元数据可以包括有关文档的信息,例如作者、标题和关键字,以及有关每个图像的信息,例如拍摄日期、相机设置和地理位置。此元数据可以存储为 XML 格式,使其易于访问和修改。此外,JPM 支持包含 ICC 配置文件,该配置文件定义图像的色彩空间,确保在不同设备上准确地再现色彩。
JPM 文件还能够存储图像的多个版本,每个版本具有不同的分辨率或质量设置。此功能称为“多层”,它允许更有效的存储和传输,因为可以根据应用程序的特定需求或可用带宽选择图像的适当版本。
安全性是 JPM 提供强大功能的另一个领域。该格式支持包含数字签名和加密,可用于验证文档的真实性并保护敏感信息。这在法律和医疗文件管理等领域尤为重要,在这些领域,文件的完整性和机密性至关重要。
尽管有许多优点,但 JPM 格式并未得到广泛采用,尤其是在消费市场。这部分是由于格式的复杂性和处理 JPM 文件所需的计算资源。此外,包括 JPM 在内的 JPEG 2000 系列标准一直受到专利许可问题的影响,与通常不受专利约束的原始 JPEG 标准相比,这阻碍了它的采用。
对于使用 JPM 文件的软件开发人员和工程师,有几个库和工具可用于支持该格式。其中包括 OpenJPEG 库,这是一个开源 JPEG 2000 编解码器,以及来自各种成像软件公司的商业产品。在使用 JPM 文件时,开发人员必须熟悉 JPEG 2000 代码流语法,以及处理复合文档和元数据的 特定要求。
总之,JPM 图像格式是 JPEG 2000 标准的强大扩展,它提供了一系列适合存储和管理复合文档的功能。它对多个图像层、渐进解码、元数据、多层和安全功能的支持使其成为图像质量和文档完整性至关重要的专业和技术应用程序的理想选择。虽然它可能不像其他图像格式那样常用,但其专业功能确保它仍然是文档成像和医学成像等领域的重要工具。