VDA 背景移除器

在您的浏览器中 移除任何图片的背景 。永久免费。

全部本地运行

我们的转换器在您的浏览器中运行,所以我们永远看不到您的数据。

闪电般快速

无需上传文件到服务器,转换立即开始。

默认安全

与其他转换器不同,您的文件永远不会上传给我们。

背景移除将主体与其周围环境分离开来,这样你就可以将其放置在 透明背景上、更换场景或将其合成为新设计。在底层,你正在估算一个 alpha 遮罩——一个从 0 到 1 的每像素不透明度——然后将前景alpha 合成到 其他东西上。这是 Porter–Duff 的数学原理,也是“边缘”和 直接 alpha 与预乘 alpha 等常见陷阱的起因。有关预乘和线性颜色的实用指南,请参阅 微软的 Win2D 笔记 Søren Sandmann Lomont 关于线性混合的文章


人们移除背景的主要方式

1) 色度键(“绿/蓝屏”)

如果你能控制拍摄,将背景涂成纯色(通常是绿色),然后抠掉该色调。 这种方法速度快,在电影和广播中经过实战检验,非常适合视频。权衡之处在于灯光和服装: 彩色光会溢出到边缘(尤其是头发),所以你需要使用去溢工具来中和污染。 好的入门资料包括 Nuke 的文档 Mixing Light 和一个实践性的 Fusion 演示

2) 交互式分割(经典计算机视觉)

对于背景杂乱的单张图片,交互式算法需要用户提供一些提示——例如,一个宽松的 矩形或涂鸦——然后收敛到一个清晰的蒙版。经典方法是 GrabCut 书籍章节),它学习前景/背景的颜色模型,并迭代使用图割来分离它们。 你会在 GIMP 的前景选择中看到类似的想法,它基于 SIOX ImageJ 插件)。

3) 图像抠图(细粒度 alpha)

抠图解决在纤细边界(头发、毛皮、烟雾、玻璃)处的部分透明度问题。经典的 闭式抠图 接受一个三元图(绝对前景/绝对背景/未知),并求解一个具有强边缘保真度的 alpha 线性系统。现代的 深度图像抠图 Adobe Composition-1K 数据集上训练神经网络(MMEditing 文档),并使用 SAD、MSE、梯度和连通性等指标进行评估(基准解释器)。

4) 深度学习抠图(无三元图)

相关的分割工作也很有用: DeepLabv3+ 使用编码器-解码器和空洞卷积来细化边界 PDF); Mask R-CNN 提供每个实例的蒙版 PDF);以及 SAM (Segment Anything) 是一个 可提示的基础模型,可在不熟悉的图像上进行零样本蒙版生成。


流行工具的功能


更清晰抠图的工作流程提示

  1. 智能拍摄。 良好的光线和强烈的主体-背景对比度对每种方法都有帮助。对于绿/蓝屏,请计划 去溢 指南)。
  2. 从宽到窄。 运行自动选择(选择主体、 U2-Net SAM),然后用画笔或抠图(例如 闭式)细化边缘。
  3. 注意半透明。 玻璃、面纱、运动模糊、飞扬的头发需要真正的 alpha(不仅仅是硬蒙版)。同时恢复 F/B/α 的方法可以最大限度地减少光晕。
  4. 了解你的 alpha。 直接与预乘产生不同的边缘行为;一致地导出/合成(参见 概述 Hargreaves)。
  5. 选择正确的输出。 对于“无背景”,提供一个带有干净 alpha 的光栅图(例如 PNG/WebP),或者如果需要进一步编辑,则保留带有蒙版的图层文件。关键在于你计算的 alpha 质量——植根于 Porter–Duff

质量与评估

学术著作报告了在 Composition-1K 上的 SADMSE梯度连通性错误。如果你正在选择一个模型,请查找这些指标 指标定义 背景抠图指标部分)。 对于人像/视频,MODNet 背景抠图 V2 很强大;对于一般的“显著物体”图像, U2-Net 是一个坚实的基线;对于棘手的透明度, FBA 可能更干净。


常见边缘情况(及修复)

  • 头发和毛皮: 倾向于抠图(三元图或像 MODNet 这样的人像抠图)并在棋盘格上检查。
  • 精细结构(自行车辐条、鱼线): 使用高分辨率输入和像 DeepLabv3+ 这样的边界感知分割器作为抠图前的预处理步骤。
  • 透明物体(烟雾、玻璃): 你需要分数 alpha 和通常的前景色估计 FBA)。
  • 视频会议: 如果你能捕捉到一个干净的背景板, 背景抠图 V2 看起来比简单的“虚拟背景”切换更自然。

这在现实世界中的应用


为什么抠图有时看起来很假(及修复)

  • 颜色溢出: 绿色/蓝色光包裹着主体——使用 去溢控制 或有针对性的颜色替换。
  • 光晕/边缘: 通常是 alpha 解释不匹配(直接与预乘)或边缘像素被旧背景污染;正确转换/解释 概述, 详情)。
  • 错误的模糊/颗粒: 将一个锐利的主体粘贴到一个柔和的背景上,它会显得突兀;在合成后匹配镜头模糊和颗粒(参见 Porter–Duff 基础)。

TL;DR 速查手册

  1. 如果你控制拍摄: 使用色度键;均匀打光;计划 去溢
  2. 如果是一次性照片: 尝试 Photoshop 的 移除背景 Canva 的 移除器 remove.bg;用画笔/抠图对头发进行细化。
  3. 如果你需要生产级边缘: 使用抠图( 闭式 或深度)并在透明背景上检查 alpha;注意 alpha 解释
  4. 对于人像/视频: 考虑 MODNet 背景抠图 V2;对于点击引导的分割, SAM 是一个强大的前端。

什么是VDA格式?

Truevision Targa 图像

VICAR(视频图像通信和检索)图像格式是一种主要用于存储科学任务(包括与行星探索、天文学和其他太空科学领域相关的任务)的图像数据的文件格式。VICAR 由美国国家航空航天局喷气推进实验室 (JPL) 于 20 世纪 60 年代开发,旨在促进从航天器和其他来源收集的大量成像数据的存储、通信和处理。与 JPEG 或 PNG 等更常见的图像格式不同,VICAR 格式经过专门设计,以满足科学界的特定需求,为处理研究和探索活动中遇到的复杂图像数据提供了一个强大的框架。

VICAR 文件的结构大致可分为三个主要部分:标签区、图像数据区和可选的 EOL(行尾)标签区。标签区包含有关图像数据的元数据,包括但不限于图像的尺寸、像素的数据类型、获取图像的航天器或仪器的名称以及对图像执行的任何处理。此元数据以人类可读的 ASCII 格式存储,使研究人员无需专门软件即可轻松理解和修改文件的内容。

VICAR 文件的图像数据区包含图像的原始或处理后的像素值。VICAR 支持图像像素的多种数据类型,包括 8 位和 16 位整数、32 位浮点数等。这种灵活性使该格式能够满足科学研究中发现的各种成像要求,例如捕获详细的亮度数据或精确测量物理现象的需要。此外,该格式支持多维图像,不仅可以存储传统的 2D 图像,还可以存储 3D 体积数据和时间序列数据。

VICAR 图像格式的一个重要特性是对可选 EOL(行尾)标签的支持。这些 EOL 标签附加到每行图像数据,并且可以包含特定于该行的附加元数据。此特性在实时传输图像数据的情况下特别有用,因为它允许包含特定于图像每行的遥测或状态信息。此外,EOL 标签的存在可以通过为每行数据提供上下文来促进错误检测和纠正机制。

VICAR 格式的一个主要优势是其可扩展性。该格式的设计方式是可以在不中断读取 VICAR 文件的现有工具或库的情况下将新字段添加到标签区。这种可扩展性确保该格式可以演变以满足新的科学需求和挑战,而不会牺牲向后兼容性。此外,标签区的开放性允许研究人员包含与特定任务或实验相关的自定义元数据,从而增强该格式在不同科学领域的实用性。

VICAR 文件通常使用美国国家航空航天局和其他参与科学研究的组织开发的专门软件进行处理和分析。这些工具能够处理从 VICAR 图像中提取有意义信息所需的复杂操作,例如图像重建、几何校正、辐射校准等。此外,还提供了软件库,允许开发人员将 VICAR 文件处理功能集成到自定义应用程序中,从而促进为特定研究需求开发定制解决方案。

尽管具有显着的优势,但 VICAR 图像格式的使用主要限于科学界和某些专门的应用程序。这种有限的采用主要是由于其特性的特殊性和其结构的复杂性,这些特性和结构经过专门设计以满足科学成像的独特要求。然而,对于从事空间探索、行星科学和天体物理学等领域的研究人员和科学家来说,VICAR 格式是一个无价的工具,它提供了精度、灵活性以及管理复杂图像数据的全面框架。

VICAR 图像格式的开发和维护突出了美国国家航空航天局喷气推进实验室与更广泛的科学界之间的合作努力。随着空间探索任务的复杂性和规模不断增长,拥有一个通用且强大的图像格式的重要性变得越来越明显。通过对 VICAR 格式的改进和支持工具的开发,研究人员可以继续依赖此格式来捕获和分析这些任务生成的大量图像数据。

多年来,标准的重要性在科学界得到了越来越多的认可。VICAR 格式以其有据可查的结构和适应性,成为标准化数据格式在促进科学研究中发挥关键作用的一个主要示例。通过确保不同任务和研究项目之间的一致性和兼容性,像 VICAR 这样的标准使科学家能够更有效地共享、比较和分析数据。

展望未来,VICAR 图像格式的未来可能会受到科学界不断变化的需求和成像技术进步的影响。随着新传感器和仪器的开发,产生更高分辨率的图像和不同类型的数据,VICAR 格式可能会进一步增强以适应这些创新。此外,将人工智能和机器学习技术集成到图像分析过程中可以成为催化剂,使 VICAR 格式能够支持新的数据类型和分析方法。

总之,VICAR 图像格式在科学界(特别是在空间探索和行星科学领域)的图像数据存储和分析中发挥着至关重要的作用。其灵活且可扩展的结构,加上对各种数据类型和维度的强大支持,使其成为研究人员的强大工具。随着科学成像领域的不断发展,VICAR 格式的适应性确保它将继续与未来探索和研究计划生成的大量数据保持相关性和价值。

支持的格式

AAI.aai

AAI Dune 图像

AI.ai

Adobe Illustrator CS2

AVIF.avif

AV1 图像文件格式

AVS.avs

AVS X 图像

BAYER.bayer

原始 Bayer 图像

BMP.bmp

Microsoft Windows 位图

CIN.cin

Cineon 图像文件

CLIP.clip

图像剪贴遮罩

CMYK.cmyk

原始 青色,洋红,黄色,黑色 样本

CMYKA.cmyka

原始 青色,洋红,黄色,黑色,Alpha 样本

CUR.cur

Microsoft 图标

DCX.dcx

ZSoft IBM PC 多页 Paintbrush

DDS.dds

Microsoft DirectDraw Surface

DPX.dpx

SMTPE 268M-2003 (DPX 2.0) 图像

DXT1.dxt1

Microsoft DirectDraw Surface

EPDF.epdf

封装的可移植文档格式

EPI.epi

Adobe 封装的 PostScript 交换格式

EPS.eps

Adobe 封装的 PostScript

EPSF.epsf

Adobe 封装的 PostScript

EPSI.epsi

Adobe 封装的 PostScript 交换格式

EPT.ept

带 TIFF 预览的封装 PostScript

EPT2.ept2

封装的 PostScript 二级带 TIFF 预览

EXR.exr

高动态范围 (HDR) 图像

FARBFELD.ff

Farbfeld

FF.ff

Farbfeld

FITS.fits

灵活图像传输系统

GIF.gif

CompuServe 图形交换格式

GIF87.gif87

CompuServe 图形交换格式 (版本 87a)

GROUP4.group4

原始 CCITT 第四组

HDR.hdr

高动态范围图像

HRZ.hrz

慢扫描电视

ICO.ico

Microsoft 图标

ICON.icon

Microsoft 图标

IPL.ipl

IP2 地点图像

J2C.j2c

JPEG-2000 代码流

J2K.j2k

JPEG-2000 代码流

JNG.jng

JPEG 网络图形

JP2.jp2

JPEG-2000 文件格式

JPC.jpc

JPEG-2000 代码流

JPE.jpe

联合图像专家小组 JFIF 格式

JPEG.jpeg

联合图像专家小组 JFIF 格式

JPG.jpg

联合图像专家小组 JFIF 格式

JPM.jpm

JPEG-2000 文件格式

JPS.jps

联合图像专家小组 JPS 格式

JPT.jpt

JPEG-2000 文件格式

JXL.jxl

JPEG XL 图像

MAP.map

多分辨率无缝图像数据库 (MrSID)

MAT.mat

MATLAB 5 级图像格式

PAL.pal

Palm pixmap

PALM.palm

Palm pixmap

PAM.pam

通用 2D 位图格式

PBM.pbm

便携式位图格式(黑白)

PCD.pcd

照片 CD

PCDS.pcds

照片 CD

PCT.pct

Apple Macintosh QuickDraw/PICT

PCX.pcx

ZSoft IBM PC Paintbrush

PDB.pdb

Palm 数据库图片查看器格式

PDF.pdf

便携式文档格式

PDFA.pdfa

便携式文档归档格式

PFM.pfm

便携式浮点格式

PGM.pgm

便携式灰度图格式(灰度)

PGX.pgx

JPEG 2000 无损格式

PICON.picon

个人图标

PICT.pict

Apple Macintosh QuickDraw/PICT

PJPEG.pjpeg

联合图像专家小组 JFIF 格式

PNG.png

便携式网络图形

PNG00.png00

从原图继承位深度和颜色类型的 PNG

PNG24.png24

不透明或二值透明的 24 位 RGB (zlib 1.2.11)

PNG32.png32

不透明或二值透明的 32 位 RGBA

PNG48.png48

不透明或二值透明的 48 位 RGB

PNG64.png64

不透明或二值透明的 64 位 RGBA

PNG8.png8

不透明或二值透明的 8 位索引

PNM.pnm

便携式任意图

PPM.ppm

便携式像素图格式(彩色)

PS.ps

Adobe PostScript 文件

PSB.psb

Adobe 大型文档格式

PSD.psd

Adobe Photoshop 位图

RGB.rgb

原始 红色,绿色,蓝色 样本

RGBA.rgba

原始 红色,绿色,蓝色,Alpha 样本

RGBO.rgbo

原始 红色,绿色,蓝色,不透明度 样本

SIX.six

DEC SIXEL 图形格式

SUN.sun

Sun Rasterfile

SVG.svg

可缩放矢量图形

SVGZ.svgz

压缩的可缩放矢量图形

TIFF.tiff

标记图像文件格式

VDA.vda

Truevision Targa 图像

VIPS.vips

VIPS 图像

WBMP.wbmp

无线位图 (0级) 图像

WEBP.webp

WebP 图像格式

YUV.yuv

CCIR 601 4:1:1 或 4:2:2

常见问题

这是如何工作的?

这个转换器完全在您的浏览器中运行。当您选择一个文件时,它将被读入内存并转换为所选格式。 然后,您可以下载转换后的文件。

转换一个文件需要多长时间?

转换立即开始,大多数文件在一秒钟内完成转换。较大的文件可能需要更长时间。

我的文件会发生什么?

您的文件永远不会上传到我们的服务器。它们在您的浏览器中转换,然后下载转换后的文件。我们永远看不到您的文件。

我可以转换哪些文件类型?

我们支持在所有图像格式之间进行转换,包括 JPEG、PNG、GIF、WebP、SVG、BMP、TIFF 等等。

这要花多少钱?

这个转换器完全免费,并将永远免费。因为它在您的浏览器中运行,所以我们不需要为服务器付费,因此我们不需要向您收费。

我可以同时转换多个文件吗?

是的!您可以同时转换尽可能多的文件。只需在添加时选择多个文件即可。