DXT1 背景移除器

在您的浏览器中 移除任何图片的背景 。永久免费。

私密和安全

一切都在您的浏览器中进行。您的文件绝不接触我们的服务器。

极速

无需上传,无需等待。在您拖放文件的瞬间即可转换。

完全免费

无需帐户。无隐藏费用。无文件大小限制花招。

背景移除将主体与其周围环境分离开来,这样你就可以将其放置在 透明背景上、更换场景或将其合成为新设计。在底层,你正在估算一个 alpha 遮罩——一个从 0 到 1 的每像素不透明度——然后将前景alpha 合成到 其他东西上。这是 Porter–Duff 的数学原理,也是“边缘”和 直接 alpha 与预乘 alpha 等常见陷阱的起因。有关预乘和线性颜色的实用指南,请参阅 微软的 Win2D 笔记 Søren Sandmann Lomont 关于线性混合的文章


人们移除背景的主要方式

1) 色度键(“绿/蓝屏”)

如果你能控制拍摄,将背景涂成纯色(通常是绿色),然后抠掉该色调。 这种方法速度快,在电影和广播中经过实战检验,非常适合视频。权衡之处在于灯光和服装: 彩色光会溢出到边缘(尤其是头发),所以你需要使用去溢工具来中和污染。 好的入门资料包括 Nuke 的文档 Mixing Light 和一个实践性的 Fusion 演示

2) 交互式分割(经典计算机视觉)

对于背景杂乱的单张图片,交互式算法需要用户提供一些提示——例如,一个宽松的 矩形或涂鸦——然后收敛到一个清晰的蒙版。经典方法是 GrabCut 书籍章节),它学习前景/背景的颜色模型,并迭代使用图割来分离它们。 你会在 GIMP 的前景选择中看到类似的想法,它基于 SIOX ImageJ 插件)。

3) 图像抠图(细粒度 alpha)

抠图解决在纤细边界(头发、毛皮、烟雾、玻璃)处的部分透明度问题。经典的 闭式抠图 接受一个三元图(绝对前景/绝对背景/未知),并求解一个具有强边缘保真度的 alpha 线性系统。现代的 深度图像抠图 Adobe Composition-1K 数据集上训练神经网络(MMEditing 文档),并使用 SAD、MSE、梯度和连通性等指标进行评估(基准解释器)。

4) 深度学习抠图(无三元图)

相关的分割工作也很有用: DeepLabv3+ 使用编码器-解码器和空洞卷积来细化边界 PDF); Mask R-CNN 提供每个实例的蒙版 PDF);以及 SAM (Segment Anything) 是一个 可提示的基础模型,可在不熟悉的图像上进行零样本蒙版生成。


流行工具的功能


更清晰抠图的工作流程提示

  1. 智能拍摄。 良好的光线和强烈的主体-背景对比度对每种方法都有帮助。对于绿/蓝屏,请计划 去溢 指南)。
  2. 从宽到窄。 运行自动选择(选择主体、 U2-Net SAM),然后用画笔或抠图(例如 闭式)细化边缘。
  3. 注意半透明。 玻璃、面纱、运动模糊、飞扬的头发需要真正的 alpha(不仅仅是硬蒙版)。同时恢复 F/B/α 的方法可以最大限度地减少光晕。
  4. 了解你的 alpha。 直接与预乘产生不同的边缘行为;一致地导出/合成(参见 概述 Hargreaves)。
  5. 选择正确的输出。 对于“无背景”,提供一个带有干净 alpha 的光栅图(例如 PNG/WebP),或者如果需要进一步编辑,则保留带有蒙版的图层文件。关键在于你计算的 alpha 质量——植根于 Porter–Duff

质量与评估

学术著作报告了在 Composition-1K 上的 SADMSE梯度连通性错误。如果你正在选择一个模型,请查找这些指标 指标定义 背景抠图指标部分)。 对于人像/视频,MODNet 背景抠图 V2 很强大;对于一般的“显著物体”图像, U2-Net 是一个坚实的基线;对于棘手的透明度, FBA 可能更干净。


常见边缘情况(及修复)

  • 头发和毛皮: 倾向于抠图(三元图或像 MODNet 这样的人像抠图)并在棋盘格上检查。
  • 精细结构(自行车辐条、鱼线): 使用高分辨率输入和像 DeepLabv3+ 这样的边界感知分割器作为抠图前的预处理步骤。
  • 透明物体(烟雾、玻璃): 你需要分数 alpha 和通常的前景色估计 FBA)。
  • 视频会议: 如果你能捕捉到一个干净的背景板, 背景抠图 V2 看起来比简单的“虚拟背景”切换更自然。

这在现实世界中的应用


为什么抠图有时看起来很假(及修复)

  • 颜色溢出: 绿色/蓝色光包裹着主体——使用 去溢控制 或有针对性的颜色替换。
  • 光晕/边缘: 通常是 alpha 解释不匹配(直接与预乘)或边缘像素被旧背景污染;正确转换/解释 概述, 详情)。
  • 错误的模糊/颗粒: 将一个锐利的主体粘贴到一个柔和的背景上,它会显得突兀;在合成后匹配镜头模糊和颗粒(参见 Porter–Duff 基础)。

TL;DR 速查手册

  1. 如果你控制拍摄: 使用色度键;均匀打光;计划 去溢
  2. 如果是一次性照片: 尝试 Photoshop 的 移除背景 Canva 的 移除器 remove.bg;用画笔/抠图对头发进行细化。
  3. 如果你需要生产级边缘: 使用抠图( 闭式 或深度)并在透明背景上检查 alpha;注意 alpha 解释
  4. 对于人像/视频: 考虑 MODNet 背景抠图 V2;对于点击引导的分割, SAM 是一个强大的前端。

什么是DXT1格式?

Microsoft DirectDraw Surface

DXT1 压缩格式是 DirectX 纹理(DirectXTex)系列的一部分,它代表了图像压缩技术的一次重大飞跃,专为计算机图形而设计。它是一种有损压缩技术,在图像质量和存储需求之间取得平衡,使其非常适合实时 3D 应用程序(例如游戏),其中磁盘空间和带宽都是宝贵的资源。从本质上讲,DXT1 格式将纹理数据压缩到其原始大小的一小部分,而无需实时解压缩,从而减少了内存使用量并提高了性能。

DXT1 针对像素块而不是单个像素本身进行操作。具体来说,它处理 4x4 像素块,将每个块压缩到 64 位。这种基于块的压缩方法使 DXT1 能够显著减少表示图像所需的数据量。DXT1 中压缩的本质在于它能够在每个块内找到颜色表示的平衡,从而在实现高压缩比的同时尽可能多地保留细节。

DXT1 的压缩过程可以分解为几个步骤。首先,它识别块内最能代表块的整体颜色范围的两种颜色。这些颜色是根据它们包含块内颜色可变性的能力选择的,它们存储为两种 16 位 RGB 颜色。尽管与原始图像数据相比位深度较低,但此步骤确保保留最关键的颜色信息。

在确定两种原色后,DXT1 使用它们生成两种附加颜色,总共创建四种颜色来表示整个块。这些附加颜色是通过线性插值计算的,这是一个以不同比例混合两种原色的过程。具体来说,第三种颜色是通过将两种原色等量混合而生成的,而第四种颜色要么是偏向第一种颜色的混合,要么是纯黑色,具体取决于纹理的透明度要求。

确定四种颜色后,下一步涉及将原始 4x4 块中的每个像素映射到四种生成颜色中最接近的颜色。此映射通过简单的最近邻算法完成,该算法计算原始像素颜色与四种代表颜色的距离,将像素分配给最接近的匹配项。此过程有效地将块的原始颜色空间量化为四种不同的颜色,这是实现 DXT1 压缩的关键因素。

DXT1 压缩过程的最后一步是对颜色映射信息以及为块选择的两种原始颜色进行编码。两种原始颜色直接存储在压缩块数据中,作为 16 位值。同时,将每个像素映射到四种颜色之一编码为一系列 2 位索引,每个索引指向四种颜色之一。这些索引被打包在一起,并包含 64 位块的剩余位。因此,生成的压缩块既包含颜色信息,也包含在解压缩期间重建块外观所需的映射。

DXT1 中的解压缩被设计为一个简单而快速的过程,使其非常适合实时应用程序。解压缩算法的简单性允许它由现代显卡中的硬件执行,进一步降低了 CPU 的负载,并有助于 DXT1 压缩纹理的性能效率。在解压缩期间,从块数据中检索两种原始颜色,并与 2 位索引一起用于重建块中每个像素的颜色。如有必要,再次采用线性插值方法来导出中间颜色。

DXT1 的优点之一是它显着减少了文件大小,与未压缩的 24 位 RGB 纹理相比,它可以达到 8:1。这种减少不仅节省了磁盘空间,还减少了加载时间,并增加了在给定内存预算内纹理多样性的可能性。此外,DXT1 的性能优势不仅限于存储和带宽节省;通过减少需要处理和传输到 GPU 的数据量,它还有助于提高渲染速度,使其成为游戏和其他图形密集型应用程序的理想格式。

尽管有这些优点,DXT1 并非没有局限性。最显着的是可见伪影的可能性,尤其是在颜色对比度高或细节复杂的纹理中。这些伪影是由量化过程和每个块限制为四种颜色的限制造成的,这可能无法准确表示原始图像的全部颜色范围。此外,为每个块选择两种代表颜色的要求可能导致色带问题,其中颜色之间的过渡变得明显突然且不自然。

此外,DXT1 格式对透明度的处理增加了另一层复杂性。DXT1 支持 1 位 alpha 透明度,这意味着像素可以完全透明或完全不透明。这种二进制透明度方法是通过选择一种生成的颜色来表示透明度来实现的,通常是第四种颜色,如果前两种颜色被选择为它们的数字顺序相反。虽然这允许纹理中有一定程度的透明度,但它非常有限,并且可能导致透明区域周围出现粗糙的边缘,使其不太适合详细的透明度效果。

使用 DXT1 压缩纹理的开发人员经常采用各种技术来减轻这些限制。例如,仔细的纹理设计和使用抖动可以帮助减少压缩伪影和色带的可见性。此外,在处理透明度时,开发人员可以选择使用单独的纹理贴图来处理透明度数据,或者选择提供更细致的透明度处理的其他 DXT 格式,例如 DXT3 或 DXT5,用于透明度质量至关重要的纹理。

DXT1 及其包含在 DirectX API 中的广泛采用凸显了其在实时图形领域的重要性。它在质量和性能之间保持平衡的能力使其成为游戏行业的主流,在游戏行业中,资源的有效利用通常是一个关键问题。除了游戏之外,DXT1 还可以在需要实时渲染的各个领域中找到应用,例如虚拟现实、模拟和 3D 可视化,这突出了其作为压缩格式的多功能性和有效性。

随着技术的进步,纹理压缩技术的演变仍在继续,更新的格式旨在解决 DXT1 的局限性,同时建立在其优势之上。硬件和软件的进步导致了压缩格式的发展,这些格式提供了更高的质量、更好的透明度支持和更有效的压缩算法。然而,DXT1 作为纹理压缩中开创性格式的遗产仍然是无可争议的。它的设计原则以及它在质量、性能和存储效率之间体现的权衡继续影响着未来压缩技术的发展。

总之,DXT1 图像格式代表了纹理压缩领域的重大发展,在图像质量和内存使用之间取得了有效的平衡。虽然它有其局限性,特别是在色彩保真度和透明度处理方面,但它在存储和性能方面的优势不容忽视。对于速度和效率至上的应用程序,DXT1 仍然是一个引人注目的选择。随着计算机图形领域的进步,从 DXT1 的设计和应用中吸取的教训无疑将继续为图像压缩领域的未来创新提供信息和启发。

支持的格式

AAI.aai

AAI Dune 图像

AI.ai

Adobe Illustrator CS2

AVIF.avif

AV1 图像文件格式

BAYER.bayer

原始 Bayer 图像

BMP.bmp

Microsoft Windows 位图

CIN.cin

Cineon 图像文件

CLIP.clip

图像剪贴遮罩

CMYK.cmyk

原始 青色,洋红,黄色,黑色 样本

CUR.cur

Microsoft 图标

DCX.dcx

ZSoft IBM PC 多页 Paintbrush

DDS.dds

Microsoft DirectDraw Surface

DPX.dpx

SMTPE 268M-2003 (DPX 2.0) 图像

DXT1.dxt1

Microsoft DirectDraw Surface

EPDF.epdf

封装的可移植文档格式

EPI.epi

Adobe 封装的 PostScript 交换格式

EPS.eps

Adobe 封装的 PostScript

EPSF.epsf

Adobe 封装的 PostScript

EPSI.epsi

Adobe 封装的 PostScript 交换格式

EPT.ept

带 TIFF 预览的封装 PostScript

EPT2.ept2

封装的 PostScript 二级带 TIFF 预览

EXR.exr

高动态范围 (HDR) 图像

FF.ff

Farbfeld

FITS.fits

灵活图像传输系统

GIF.gif

CompuServe 图形交换格式

HDR.hdr

高动态范围图像

HEIC.heic

高效图像容器

HRZ.hrz

慢扫描电视

ICO.ico

Microsoft 图标

ICON.icon

Microsoft 图标

J2C.j2c

JPEG-2000 代码流

J2K.j2k

JPEG-2000 代码流

JNG.jng

JPEG 网络图形

JP2.jp2

JPEG-2000 文件格式

JPE.jpe

联合图像专家小组 JFIF 格式

JPEG.jpeg

联合图像专家小组 JFIF 格式

JPG.jpg

联合图像专家小组 JFIF 格式

JPM.jpm

JPEG-2000 文件格式

JPS.jps

联合图像专家小组 JPS 格式

JPT.jpt

JPEG-2000 文件格式

JXL.jxl

JPEG XL 图像

MAP.map

多分辨率无缝图像数据库 (MrSID)

MAT.mat

MATLAB 5 级图像格式

PAL.pal

Palm pixmap

PALM.palm

Palm pixmap

PAM.pam

通用 2D 位图格式

PBM.pbm

便携式位图格式(黑白)

PCD.pcd

照片 CD

PCT.pct

Apple Macintosh QuickDraw/PICT

PCX.pcx

ZSoft IBM PC Paintbrush

PDB.pdb

Palm 数据库图片查看器格式

PDF.pdf

便携式文档格式

PDFA.pdfa

便携式文档归档格式

PFM.pfm

便携式浮点格式

PGM.pgm

便携式灰度图格式(灰度)

PGX.pgx

JPEG 2000 无损格式

PICT.pict

Apple Macintosh QuickDraw/PICT

PJPEG.pjpeg

联合图像专家小组 JFIF 格式

PNG.png

便携式网络图形

PNG00.png00

从原图继承位深度和颜色类型的 PNG

PNG24.png24

不透明或二值透明的 24 位 RGB (zlib 1.2.11)

PNG32.png32

不透明或二值透明的 32 位 RGBA

PNG48.png48

不透明或二值透明的 48 位 RGB

PNG64.png64

不透明或二值透明的 64 位 RGBA

PNG8.png8

不透明或二值透明的 8 位索引

PNM.pnm

便携式任意图

PPM.ppm

便携式像素图格式(彩色)

PS.ps

Adobe PostScript 文件

PSB.psb

Adobe 大型文档格式

PSD.psd

Adobe Photoshop 位图

RGB.rgb

原始 红色,绿色,蓝色 样本

RGBA.rgba

原始 红色,绿色,蓝色,Alpha 样本

RGBO.rgbo

原始 红色,绿色,蓝色,不透明度 样本

SIX.six

DEC SIXEL 图形格式

SUN.sun

Sun Rasterfile

SVG.svg

可缩放矢量图形

TIFF.tiff

标记图像文件格式

VDA.vda

Truevision Targa 图像

VIPS.vips

VIPS 图像

WBMP.wbmp

无线位图 (0级) 图像

WEBP.webp

WebP 图像格式

YUV.yuv

CCIR 601 4:1:1 或 4:2:2

常见问题

这是如何工作的?

这个转换器完全在您的浏览器中运行。当您选择一个文件时,它将被读入内存并转换为所选格式。 然后,您可以下载转换后的文件。

转换一个文件需要多长时间?

转换立即开始,大多数文件在一秒钟内完成转换。较大的文件可能需要更长时间。

我的文件会发生什么?

您的文件永远不会上传到我们的服务器。它们在您的浏览器中转换,然后下载转换后的文件。我们永远看不到您的文件。

我可以转换哪些文件类型?

我们支持在所有图像格式之间进行转换,包括 JPEG、PNG、GIF、WebP、SVG、BMP、TIFF 等等。

这要花多少钱?

这个转换器完全免费,并将永远免费。因为它在您的浏览器中运行,所以我们不需要为服务器付费,因此我们不需要向您收费。

我可以同时转换多个文件吗?

是的!您可以同时转换尽可能多的文件。只需在添加时选择多个文件即可。