背景移除將主體與其周圍環境分離開來,這樣你就可以將其放置在 透明背景上、更換場景或將其合成為新設計。在底層,你正在估算一個 alpha 遮罩——一個從 0 到 1 的每像素不透明度——然後將前景alpha 合成到 其他東西上。這是 Porter–Duff 的數學原理,也是“邊緣”和 直接 alpha 與預乘 alpha 等常見陷阱的起因。有關預乘和線性顏色的實用指南,請參閱 微軟的 Win2D 筆記、 Søren Sandmann 和 Lomont 關於線性混合的文章。
如果你能控制拍攝,將背景漆成純色(通常是綠色),然後去背該色調。 這種方法速度快,在電影和廣播中經過實戰檢驗,非常適合影片。權衡之處在於燈光和服裝: 彩色光會溢出到邊緣(尤其是頭髮),所以你需要使用去溢工具來中和污染。 好的入門資料包括 Nuke 的文件、 Mixing Light 和一個實踐性的 Fusion 示範。
對於背景雜亂的單張圖片,互動式演算法需要使用者提供一些提示——例如,一個寬鬆的 矩形或塗鴉——然後收斂到一個清晰的遮罩。經典方法是 GrabCut (書中章節),它學習前景/背景的顏色模型,並迭代使用圖割來分離它們。 你會在 GIMP 的前景選擇中看到類似的想法,它基於 SIOX (ImageJ 插件)。
去背解決在纖細邊界(頭髮、毛皮、煙霧、玻璃)處的部分透明度問題。經典的 封閉式去背 接受一個三元圖(絕對前景/絕對背景/未知),並求解一個具有強邊緣保真度的 alpha 線性系統。現代的 深度影像去背 在 Adobe Composition-1K 資料集上訓練神經網路(MMEditing 文件),並使用 SAD、MSE、梯度和連通性等指標進行評估(基準解釋器)。
相關的分割工作也很有用: DeepLabv3+ 使用編碼器-解碼器和空洞卷積來細化邊界 (PDF); Mask R-CNN 提供每個實例的遮罩 (PDF);以及 SAM (Segment Anything) 是一個 可提示的基礎模型,可在不熟悉的影像上進行零樣本遮罩生成。
學術著作報告了在 Composition-1K 上的 SAD、MSE、梯度和連通性錯誤。如果你正在選擇一個模型, 請尋找這些指標 (指標定義; 背景去背指標部分)。 對於人像/影片,MODNet 和 背景去背 V2 很強大;對於一般的“顯著物體”影像, U2-Net 是一個堅實的基準;對於棘手的透明度, FBA 可能更乾淨。
可攜式灰階圖格式 (PGM) 是一種廣泛接受且用於影像處理和電腦繪圖的格式,用於以簡單、無裝飾的格式表示灰階影像。它的重要性不僅在於其簡潔性,還在於其在不同運算平台和軟體生態系統中的靈活性與可攜性。在 PGM 格式的脈絡中,灰階影像包含各種灰階,其中每個像素表示從黑色到白色的強度值。PGM 標準的制定主要是為了便於解析和處理影像,同時將運算負擔降至最低,因此特別適合快速影像處理任務和教育用途。
PGM 檔案的結構很簡單,包含標頭和影像資料。標頭本身分為四個部分:魔術數字,用於識別檔案為 PGM,並指出它是二進位或 ASCII 格式;影像的尺寸,由像素的寬度和高度指定;最大灰階值,用於決定每個像素的可能強度值範圍;最後是註解,這是選用的,可以包含用於提供影像額外資訊。魔術數字「P2」表示 ASCII PGM,而「P5」表示二進位 PGM。這種區分在人類可讀性和儲存效率之間取得平衡。
在標頭之後,影像資料以網格格式列出,對應於標頭中指定的像素尺寸。在 ASCII PGM (P2) 中,每個像素的強度值以純文字列出,從影像的左上角到右下角排序,並以空白分隔。值從表示黑色的 0 到標頭中指定的最大灰階值(表示白色)不等。這種格式的可讀性便於輕鬆編輯和除錯,但與其二進位對應格式相比,在檔案大小和解析速度方面效率較低。
另一方面,二進位 PGM 檔案 (P5) 以更緊湊的形式對影像資料進行編碼,使用二進位表示法表示強度值。這種格式顯著減小了檔案大小,並允許更快的讀寫操作,這對於處理大量影像或需要高性能的應用程式很有利。然而,缺點是二進位檔案不可讀,需要專門的軟體才能檢視和編輯。在處理二進位 PGM 時,正確處理二進位資料至關重要,要考慮檔案的編碼和系統的架構,特別是關於位元序。
PGM 格式的靈活性在標頭中的最大灰階值參數中得到證明。此值決 定影像的位元深度,而位元深度又決定可以表示的灰階強度範圍。一個常見的選擇是 255,這表示每個像素可以取 0 到 255 之間的任何值,允許在 8 位元影像中使用 256 種不同的灰階。此設定足以應付大多數應用程式;然而,PGM 格式可以容納更高的位元深度,例如每個像素 16 位元,方法是增加最大灰階值。此功能允許表示具有更精細強度漸變的影像,適用於高動態範圍影像應用程式。
PGM 格式的簡潔性也延伸到它的操作和處理。由於該格式有良好的文件記載,並且缺乏在更精密的影像格式中發現的複雜功能,因此撰寫用於解析、修改和產生 PGM 影像的程式可以使用基本的程式設計技能來完成。這種可及性促進了影像處理方面的實驗和學習,使 PGM 成為學術環境和愛好者中的熱門選擇。此外,該格式的簡單性允許有效實作用於過濾、邊緣偵測和對比度調整等任務的演算法,這有助於它在研究和實際應用中持續使用。
儘管有其優點,PGM 格式也有一些限制。最顯著的是缺乏對彩色影像的支援,因為它本質上是為灰階設計的。雖然對於專門處理單色影像的應用程式來說這不是缺點,但對於需要色彩資訊的任務,必須求助於 Netpbm 格式系列中的兄弟格式,例如用於彩色影像的可攜式點陣圖格式 (PPM)。此外,PGM 格式的簡潔性意味著它不支援現代功能,例如壓縮、元資料儲存(超出基本註解)或圖層,這些功能在 JPEG 或 PNG 等更複雜的格式中可用。此限制可能會導致高解析度影像的檔案大小較大,並可能限制其在某些應用程式中的使用。
PGM 格式與其他格式的相容性和易於轉換是其顯著優點之一。由於它以直接且有文件記載的方式對影像資料進行編碼,因此將 PGM 影像轉換為其他格式(或反之亦然)相對簡單。此功能使其成為影 像處理管線的絕佳中間格式,其中影像可能來自各種格式,在 PGM 中處理以簡化,然後轉換為適合分發或儲存的最終格式。不同程式設計語言中的許多公用程式和函式庫支援這些轉換程序,加強了 PGM 格式在多功能且適應性強的工作流程中的作用。
PGM 檔案的安全性考量通常圍繞著解析和處理格式不正確或惡意製作的檔案相關的風險。由於其簡潔性,與更複雜的格式相比,PGM 格式不太容易受到特定漏洞的影響。然而,解析 PGM 檔案的應用程式仍應實作強健的錯誤處理,以管理意外輸入,例如不正確的標頭資訊、超出預期尺寸的資料或超出有效範圍的值。確保安全處理 PGM 檔案至關重要,特別是在接受使用者提供影像的應用程式中,以防止潛在的安全漏洞。
展望未來,儘管 PGM 格式簡單且有其限制,但它在科技產業的某些利基市場中持續相關,這突顯了直接且有良好文件記載的檔案格式的價值。它作為教學工具的角色、它適用於快速影像處理任務以及它促進影像格式轉換,說明了檔案格式設計中功能性和複雜性之間平衡的重要性。隨著技術的進步,具有增強功能、更好的壓縮和支援新興影像技術的新影像格式無疑會出現。然而,PGM 格式的遺產將會持續存在,作為未來格式設計的基準,這些格式力求在效能、簡潔性和可攜性之間取得最佳平衡。
總之,可攜式灰階圖格式 (PGM) 儘管簡單,但在數位影像領域中代表著無價的資產。其設計理念以易用性、可及性和直接性為中心,確保了它在從教育到軟體開發的各種領域中持續相關。透過支援灰階影像的有效操作和處理,PGM 格式已穩固地成為影像處理愛好者和專業人士工具包中的主食。無論是利用其教育價值、它在處理管線中的角色,還是它在影像操作中的簡潔性,PGM 格式 仍然證明了設計良好的簡單檔案格式在數位技術不斷變化的環境中具有持久的影響力。
這個轉換器完全在您的瀏覽器中運行。當您選擇 一個檔案,它將讀入內存並轉換為所選格式。 然後,您可以下載轉換後的檔案。
轉換馬上開始,大部分檔案僅需一秒鐘轉換。 較大的檔案可能需要更長的時間。
您的檔案絕不會上傳到我們的伺服器。它們在您的瀏覽器中 轉換,然後下載轉換後的檔案。我們從未看到您的檔案。
我們支援所有圖形格式之間的轉換,包括 JPEG,PNG,GIF,WebP,SVG,BMP,TIFF,等等。
此轉換器完全免費,且將 永遠免費。 由於它在您的瀏覽器中運行,我們無需支付 伺服器費用,所以我們不需要向您收取費用。
可以!您一次可以轉換任意多的檔案。 當您添加檔案時,只需選擇多個檔案即可。