PGM 背景移除器

任何圖像 中移除背景。在您的瀏覽器中。免費,永遠。

私密與安全

一切都在您的瀏覽器中進行。您的檔案絕不接觸我們的伺服器。

極速

無需上傳,無需等待。在您拖放檔案的瞬間即可轉換。

完全免費

無需帳戶。無隱藏費用。無檔案大小限制花招。

背景移除將主體與其周圍環境分離開來,這樣你就可以將其放置在 透明背景上、更換場景或將其合成為新設計。在底層,你正在估算一個 alpha 遮罩——一個從 0 到 1 的每像素不透明度——然後將前景alpha 合成到 其他東西上。這是 Porter–Duff 的數學原理,也是“邊緣”和 直接 alpha 與預乘 alpha 等常見陷阱的起因。有關預乘和線性顏色的實用指南,請參閱 微軟的 Win2D 筆記 Søren Sandmann Lomont 關於線性混合的文章


人們移除背景的主要方式

1) 色度鍵(「綠/藍幕」)

如果你能控制拍攝,將背景漆成純色(通常是綠色),然後去背該色調。 這種方法速度快,在電影和廣播中經過實戰檢驗,非常適合影片。權衡之處在於燈光和服裝: 彩色光會溢出到邊緣(尤其是頭髮),所以你需要使用去溢工具來中和污染。 好的入門資料包括 Nuke 的文件 Mixing Light 和一個實踐性的 Fusion 示範

2) 互動式分割(傳統電腦視覺)

對於背景雜亂的單張圖片,互動式演算法需要使用者提供一些提示——例如,一個寬鬆的 矩形或塗鴉——然後收斂到一個清晰的遮罩。經典方法是 GrabCut 書中章節),它學習前景/背景的顏色模型,並迭代使用圖割來分離它們。 你會在 GIMP 的前景選擇中看到類似的想法,它基於 SIOX ImageJ 插件)。

3) 影像去背(細緻 alpha)

去背解決在纖細邊界(頭髮、毛皮、煙霧、玻璃)處的部分透明度問題。經典的 封閉式去背 接受一個三元圖(絕對前景/絕對背景/未知),並求解一個具有強邊緣保真度的 alpha 線性系統。現代的 深度影像去背 Adobe Composition-1K 資料集上訓練神經網路(MMEditing 文件),並使用 SAD、MSE、梯度和連通性等指標進行評估(基準解釋器)。

4) 深度學習摳圖(無三元圖)

相關的分割工作也很有用: DeepLabv3+ 使用編碼器-解碼器和空洞卷積來細化邊界 PDF); Mask R-CNN 提供每個實例的遮罩 PDF);以及 SAM (Segment Anything) 是一個 可提示的基礎模型,可在不熟悉的影像上進行零樣本遮罩生成。


流行工具的功能


更清晰摳圖的工作流程提示

  1. 智慧拍攝。 良好的光線和強烈的主體-背景對比度對每種方法都有幫助。對於綠/藍幕,請計劃 去溢 指南)。
  2. 從寬到窄。 執行自動選取(選取主體、 U2-Net SAM),然後用筆刷或去背(例如 封閉式)細化邊緣。
  3. 注意半透明。 玻璃、面紗、運動模糊、飛揚的頭髮需要真正的 alpha(不僅僅是硬遮罩)。同時恢復 F/B/α 的方法可以最大限度地減少光暈。
  4. 了解你的 alpha。 直接與預乘產生不同的邊緣行為;一致地匯出/合成(參見 概述 Hargreaves)。
  5. 選擇正確的輸出。 對於“無背景”,提供一個帶有乾淨 alpha 的點陣圖(例如 PNG/WebP),或者如果需要進一步編輯,則保留帶有遮罩的圖層檔案。關鍵在於你計算的 alpha 品質——植根於 Porter–Duff

品質與評估

學術著作報告了在 Composition-1K 上的 SADMSE梯度連通性錯誤。如果你正在選擇一個模型,請尋找這些指標 指標定義 背景去背指標部分)。 對於人像/影片,MODNet 背景去背 V2 很強大;對於一般的“顯著物體”影像, U2-Net 是一個堅實的基準;對於棘手的透明度, FBA 可能更乾淨。


常見邊緣案例(及修復方式)

  • 頭髮和毛皮: 傾向於去背(三元图或像 MODNet 這樣的人像去背)並在棋盤格上檢查。
  • 精細結構(自行車輻條、魚線): 使用高解析度輸入和像 DeepLabv3+ 這樣的邊界感知分割器作為去背前的預處理步驟。
  • 透明物體(煙霧、玻璃): 你需要分數 alpha 和通常的前景色估計 FBA)。
  • 視訊會議: 如果你能捕捉到一個乾淨的背景板, 背景去背 V2 看起來比簡單的“虛擬背景”切換更自然。

這在現實世界中的應用


為什麼摳圖有時看起來很假(及修復方式)

  • 顏色溢出: 綠色/藍色光包裹著主體——使用 去溢控制 或有針對性的顏色替換。
  • 光暈/邊緣: 通常是 alpha 解釋不匹配(直接與預乘)或邊緣像素被舊背景污染;正確轉換/解釋 概述, 詳情)。
  • 錯誤的模糊/顆粒: 將一個銳利的主體粘貼到一個柔和的背景上,它會顯得突兀;在合成後匹配鏡頭模糊和顆粒(參見 Porter–Duff 基礎)。

TL;DR 速查手冊

  1. 如果你控制拍攝: 使用色度鍵;均勻打光;計劃 去溢
  2. 如果是一次性照片: 嘗試 Photoshop 的 移除背景 Canva 的 移除器 remove.bg;用筆刷/去背對頭髮進行細化。
  3. 如果你需要生產級邊緣: 使用去背( 封閉式 或深度)並在透明背景上檢查 alpha;注意 alpha 解釋
  4. 對於人像/影片: 考慮 MODNet 背景去背 V2;對於點擊引導的分割, SAM 是一個強大的前端。

什麼是 PGM 格式?

可攜式灰度圖格式

可攜式灰階圖格式 (PGM) 是一種廣泛接受且用於影像處理和電腦繪圖的格式,用於以簡單、無裝飾的格式表示灰階影像。它的重要性不僅在於其簡潔性,還在於其在不同運算平台和軟體生態系統中的靈活性與可攜性。在 PGM 格式的脈絡中,灰階影像包含各種灰階,其中每個像素表示從黑色到白色的強度值。PGM 標準的制定主要是為了便於解析和處理影像,同時將運算負擔降至最低,因此特別適合快速影像處理任務和教育用途。

PGM 檔案的結構很簡單,包含標頭和影像資料。標頭本身分為四個部分:魔術數字,用於識別檔案為 PGM,並指出它是二進位或 ASCII 格式;影像的尺寸,由像素的寬度和高度指定;最大灰階值,用於決定每個像素的可能強度值範圍;最後是註解,這是選用的,可以包含用於提供影像額外資訊。魔術數字「P2」表示 ASCII PGM,而「P5」表示二進位 PGM。這種區分在人類可讀性和儲存效率之間取得平衡。

在標頭之後,影像資料以網格格式列出,對應於標頭中指定的像素尺寸。在 ASCII PGM (P2) 中,每個像素的強度值以純文字列出,從影像的左上角到右下角排序,並以空白分隔。值從表示黑色的 0 到標頭中指定的最大灰階值(表示白色)不等。這種格式的可讀性便於輕鬆編輯和除錯,但與其二進位對應格式相比,在檔案大小和解析速度方面效率較低。

另一方面,二進位 PGM 檔案 (P5) 以更緊湊的形式對影像資料進行編碼,使用二進位表示法表示強度值。這種格式顯著減小了檔案大小,並允許更快的讀寫操作,這對於處理大量影像或需要高性能的應用程式很有利。然而,缺點是二進位檔案不可讀,需要專門的軟體才能檢視和編輯。在處理二進位 PGM 時,正確處理二進位資料至關重要,要考慮檔案的編碼和系統的架構,特別是關於位元序。

PGM 格式的靈活性在標頭中的最大灰階值參數中得到證明。此值決定影像的位元深度,而位元深度又決定可以表示的灰階強度範圍。一個常見的選擇是 255,這表示每個像素可以取 0 到 255 之間的任何值,允許在 8 位元影像中使用 256 種不同的灰階。此設定足以應付大多數應用程式;然而,PGM 格式可以容納更高的位元深度,例如每個像素 16 位元,方法是增加最大灰階值。此功能允許表示具有更精細強度漸變的影像,適用於高動態範圍影像應用程式。

PGM 格式的簡潔性也延伸到它的操作和處理。由於該格式有良好的文件記載,並且缺乏在更精密的影像格式中發現的複雜功能,因此撰寫用於解析、修改和產生 PGM 影像的程式可以使用基本的程式設計技能來完成。這種可及性促進了影像處理方面的實驗和學習,使 PGM 成為學術環境和愛好者中的熱門選擇。此外,該格式的簡單性允許有效實作用於過濾、邊緣偵測和對比度調整等任務的演算法,這有助於它在研究和實際應用中持續使用。

儘管有其優點,PGM 格式也有一些限制。最顯著的是缺乏對彩色影像的支援,因為它本質上是為灰階設計的。雖然對於專門處理單色影像的應用程式來說這不是缺點,但對於需要色彩資訊的任務,必須求助於 Netpbm 格式系列中的兄弟格式,例如用於彩色影像的可攜式點陣圖格式 (PPM)。此外,PGM 格式的簡潔性意味著它不支援現代功能,例如壓縮、元資料儲存(超出基本註解)或圖層,這些功能在 JPEG 或 PNG 等更複雜的格式中可用。此限制可能會導致高解析度影像的檔案大小較大,並可能限制其在某些應用程式中的使用。

PGM 格式與其他格式的相容性和易於轉換是其顯著優點之一。由於它以直接且有文件記載的方式對影像資料進行編碼,因此將 PGM 影像轉換為其他格式(或反之亦然)相對簡單。此功能使其成為影像處理管線的絕佳中間格式,其中影像可能來自各種格式,在 PGM 中處理以簡化,然後轉換為適合分發或儲存的最終格式。不同程式設計語言中的許多公用程式和函式庫支援這些轉換程序,加強了 PGM 格式在多功能且適應性強的工作流程中的作用。

PGM 檔案的安全性考量通常圍繞著解析和處理格式不正確或惡意製作的檔案相關的風險。由於其簡潔性,與更複雜的格式相比,PGM 格式不太容易受到特定漏洞的影響。然而,解析 PGM 檔案的應用程式仍應實作強健的錯誤處理,以管理意外輸入,例如不正確的標頭資訊、超出預期尺寸的資料或超出有效範圍的值。確保安全處理 PGM 檔案至關重要,特別是在接受使用者提供影像的應用程式中,以防止潛在的安全漏洞。

展望未來,儘管 PGM 格式簡單且有其限制,但它在科技產業的某些利基市場中持續相關,這突顯了直接且有良好文件記載的檔案格式的價值。它作為教學工具的角色、它適用於快速影像處理任務以及它促進影像格式轉換,說明了檔案格式設計中功能性和複雜性之間平衡的重要性。隨著技術的進步,具有增強功能、更好的壓縮和支援新興影像技術的新影像格式無疑會出現。然而,PGM 格式的遺產將會持續存在,作為未來格式設計的基準,這些格式力求在效能、簡潔性和可攜性之間取得最佳平衡。

總之,可攜式灰階圖格式 (PGM) 儘管簡單,但在數位影像領域中代表著無價的資產。其設計理念以易用性、可及性和直接性為中心,確保了它在從教育到軟體開發的各種領域中持續相關。透過支援灰階影像的有效操作和處理,PGM 格式已穩固地成為影像處理愛好者和專業人士工具包中的主食。無論是利用其教育價值、它在處理管線中的角色,還是它在影像操作中的簡潔性,PGM 格式仍然證明了設計良好的簡單檔案格式在數位技術不斷變化的環境中具有持久的影響力。

支援的格式

AAI.aai

AAI 沙漠圖像

AI.ai

Adobe Illustrator CS2

AVIF.avif

AV1 圖像文件格式

BAYER.bayer

原始 Bayer 圖像

BMP.bmp

Microsoft Windows 點陣圖像

CIN.cin

Cineon 圖像文件

CLIP.clip

圖像剪輯遮罩

CMYK.cmyk

原始青色,洋紅色,黃色和黑色樣本

CUR.cur

Microsoft 圖標

DCX.dcx

ZSoft IBM PC 多頁畫筆

DDS.dds

Microsoft DirectDraw 表面

DPX.dpx

SMTPE 268M-2003 (DPX 2.0) 圖像

DXT1.dxt1

Microsoft DirectDraw 表面

EPDF.epdf

封裝式可攜式文件格式

EPI.epi

Adobe 封裝式 PostScript 交換格式

EPS.eps

Adobe 封裝式 PostScript

EPSF.epsf

Adobe 封裝式 PostScript

EPSI.epsi

Adobe 封裝式 PostScript 交換格式

EPT.ept

帶有 TIFF 預覽的封裝式 PostScript

EPT2.ept2

帶有 TIFF 預覽的封裝式 PostScript Level II

EXR.exr

高人眼動態範圍圖像

FF.ff

Farbfeld

FITS.fits

靈活的圖像傳輸系統

GIF.gif

CompuServe 圖形交換格式

HDR.hdr

高動態範圍圖像

HEIC.heic

高效圖像容器

HRZ.hrz

緩慢掃描電視

ICO.ico

Microsoft 圖標

ICON.icon

Microsoft 圖標

J2C.j2c

JPEG-2000 編碼串

J2K.j2k

JPEG-2000 編碼串

JNG.jng

JPEG 網絡圖形

JP2.jp2

JPEG-2000 文件格式語法

JPE.jpe

聯合攝影專家組 JFIF 格式

JPEG.jpeg

聯合攝影專家組 JFIF 格式

JPG.jpg

聯合攝影專家組 JFIF 格式

JPM.jpm

JPEG-2000 文件格式語法

JPS.jps

聯合攝影專家組 JPS 格式

JPT.jpt

JPEG-2000 文件格式語法

JXL.jxl

JPEG XL 圖像

MAP.map

多解析度無縫圖像數據庫 (MrSID)

MAT.mat

MATLAB 等級 5 圖像格式

PAL.pal

棕櫚點陣圖

PALM.palm

棕櫚點陣圖

PAM.pam

通用二維位圖格式

PBM.pbm

可攜式位圖格式(黑白)

PCD.pcd

Photo CD

PCT.pct

Apple Macintosh QuickDraw/PICT

PCX.pcx

ZSoft IBM PC Paintbrush

PDB.pdb

棕櫚數據庫圖像查看器格式

PDF.pdf

可攜式文件格式

PDFA.pdfa

可攜式文檔檔案格式

PFM.pfm

可攜式浮點格式

PGM.pgm

可攜式灰度圖格式

PGX.pgx

JPEG-2000 VM 格式

PICT.pict

Apple Macintosh QuickDraw/PICT

PJPEG.pjpeg

聯合照相專家組 JFIF 格式(進行中)

PNG.png

可攜式網路圖形格式

PNG00.png00

與原始圖像相同的 PNG 圖像

PNG24.png24

透明背景的 24 位 RGB PNG 圖像

PNG32.png32

帶有透明度通道的 32 位 RGBA PNG 圖像

PNG48.png48

48 位 RGB PNG 圖像

PNG64.png64

帶有透明度通道的 64 位 RGBA PNG 圖像

PNG8.png8

8位的 PNG 圖像

PNM.pnm

可攜式任何圖像格式

PPM.ppm

可攜式像素圖格式(彩色)

PS.ps

Adobe PostScript

PSB.psb

Photoshop大型檔案格式

PSD.psd

Adobe Photoshop bitmap

RGB.rgb

原始紅色,綠色和藍色樣本

RGBA.rgba

原始紅色,綠色,藍色和 Alpha 樣本

RGBO.rgbo

原始紅色,綠色,藍色和不透明度樣本

SIX.six

DEC SIXEL 圖像格式

SUN.sun

SUN 飽和圖像

SVG.svg

可縮放矢量圖形

TIFF.tiff

Tagged Image File Format

VDA.vda

Truevision Targa 圖像

VIPS.vips

VIPS圖像

WBMP.wbmp

無線點陣圖像

WEBP.webp

WebP圖像格式

YUV.yuv

CCIR 601 4:1:1 或 4:2:2

常見問題

這是如何運作的?

這個轉換器完全在您的瀏覽器中運行。當您選擇 一個檔案,它將讀入內存並轉換為所選格式。 然後,您可以下載轉換後的檔案。

轉換一個檔案需要多久?

轉換馬上開始,大部分檔案僅需一秒鐘轉換。 較大的檔案可能需要更長的時間。

我的檔案會發生什麼?

您的檔案絕不會上傳到我們的伺服器。它們在您的瀏覽器中 轉換,然後下載轉換後的檔案。我們從未看到您的檔案。

我可以轉換哪種類型的檔案?

我們支援所有圖形格式之間的轉換,包括 JPEG,PNG,GIF,WebP,SVG,BMP,TIFF,等等。

這需要多少費用?

此轉換器完全免費,且將永遠免費。 由於它在您的瀏覽器中運行,我們無需支付 伺服器費用,所以我們不需要向您收取費用。

我可以一次轉換多個檔案嗎?

可以!您一次可以轉換任意多的檔案。 當您添加檔案時,只需選擇多個檔案即可。