การลบพื้นหลัง แยกวัตถุออกจากสภาพแวดล้อมเพื่อให้คุณสามารถวางไว้บน ความโปร่งใส, สลับฉาก, หรือประกอบเข้ากับการออกแบบใหม่. ภายใต้กระโปรงคุณกำลังประเมิน อัลฟ่าแมท—ความทึบต่อพิกเซลจาก 0 ถึง 1—แล้ว การประกอบอัลฟ่า โฟร์กราวด์ поверх สิ่งอื่น. นี่คือคณิตศาสตร์จาก Porter–Duff และสาเหตุของข้อผิดพลาดที่คุ้นเคยเช่น “ขอบ” และ อัลฟ่าตรงกับอัลฟ่าที่คูณไว้ล่วงหน้า. สำหรับคำแนะนำเชิงปฏิบัติเกี่ยวกับการคูณล่วงหน้าและสีเชิงเส้น, ดู บันทึก Win2D ของ Microsoft, Søren Sandmann, และ บทความของ Lomont เกี่ยวกับการผสมเชิงเส้น.
หากคุณสามารถควบคุมการจับภาพได้, ทาสีพื้นหลังเป็นสีทึบ (ส่วนใหญ่มักเป็นสีเขียว) และ คีย์ สีนั้นออกไป. มันรวดเร็ว, ผ่านการทดสอบการต่อสู้ในภาพยนตร์และการออกอากาศ, และเหมาะสำหรับวิดีโอ. ข้อแลกเปลี่ยนคือแสงและตู้เสื้อผ้า: แสงสีจะรั่วไหลไปยังขอบ (โดยเฉพาะเส้นผม), ดังนั้นคุณจะใช้เครื่องมือ despill เพื่อทำให้การปนเปื้อนเป็นกลาง. ไพรเมอร์ที่ดี ได้แก่ เอกสารของ Nuke, Mixing Light, และการสาธิต Fusion แบบลงมือปฏิบัติ.
สำหรับภาพเดี่ยวที่มีพื้นหลังรก, อัลกอริทึม แบบโต้ตอบ ต้องการคำใบ้จากผู้ใช้เล็กน้อย—เช่น, สี่เหลี่ยมผืนผ้าหลวมๆ หรือลายเส้นขยุกขยิก—และมาบรรจบกันเป็นหน้ากากที่คมชัด. วิธีการที่เป็นที่ยอมรับคือ GrabCut (บทในหนังสือ), ซึ่งเรียนรู้แบบจำลองสีสำหรับโฟร์กราวด์/พื้นหลัง และใช้การตัดกราฟซ้ำๆ เพื่อแยกพวกมัน. คุณจะเห็นแนวคิดที่คล้ายกันใน การเลือกโฟร์กราวด์ของ GIMP โดยใช้ SIOX (ปลั๊กอิน ImageJ).
การทำแมท แก้ปัญหาความโปร่งใสแบบเศษส่วนที่ขอบเขตที่บอบบาง (ผม, ขน, ควัน, แก้ว). การทำแมทแบบปิดคลาสสิก ใช้ trimap (แน่นอน- หน้า/แน่นอน-หลัง/ไม่ทราบ) และแก้ปัญหาระบบเชิงเส้นสำหรับอัลฟ่าที่มีความเที่ยงตรงของขอบสูง. การทำแมทภาพแบบลึกสมัยใหม่ ฝึกอบรมโครงข่ายประสาทเทียมบนชุดข้อมูล Adobe Composition-1K (เอกสาร MMEditing), และได้รับการประเมินด้วยเมตริกเช่น SAD, MSE, Gradient, และ Connectivity (คำอธิบายเกณฑ์มาตรฐาน).
งานแบ่งส่วนที่เกี่ยวข้องก็มีประโยชน์เช่นกัน: DeepLabv3+ ปรับปรุงขอบเขตด้วยตัวเข้ารหัส-ตัวถอดรหัสและคอนโวลูชัน atrous (PDF); Mask R-CNN ให้หน้ากากต่ออินสแตนซ์ (PDF); และ SAM (Segment Anything) เป็น โมเดลพื้นฐาน ที่สามารถแจ้งได้ ที่สร้างหน้ากากแบบ zero-shot บนภาพที่ไม่คุ้นเคย.
งานวิชาการรายงานข้อผิดพลาด SAD, MSE, Gradient, และ Connectivity บน Composition-1K. หากคุณกำลังเลือกโมเดล, ให้มองหาเมตริกเหล่านั้น (คำจำกัดความของเมตริก; ส่วนเมตริกของ Background Matting). สำหรับภาพบุคคล/วิดีโอ, MODNet และ Background Matting V2 แข็งแกร่ง; สำหรับภาพ “วัตถุเด่น” ทั่วไป, U2-Net เป็นพื้นฐานที่มั่นคง; สำหรับความโปร่งใสที่ยาก, FBA อาจสะอาดกว่า.
รูปแบบ Portable Any Map (PNM) เป็นรูปแบบไฟล์ภาพที่เรียบง่าย ออกแบบมาเพื่อให้แลกเปลี่ยนข้อมูลภาพระหว่างแพลตฟอร์มต่างๆ ได้ง่ายขึ้น เป็นคำศัพท์รวมที่อ้างถึงกลุ่มรูปแบบภายใต้ร่มของ Netpbm (Portable BitMap, Portable GrayMap, Portable PixMap) ซึ่งแต่ละรูปแบบออกแบบมาสำหรับประเภทของภาพที่เฉพาะเจาะจง ความงามของรูปแบบ PNM อยู่ที่ความเรียบง่ายและการแสดงภาพที่ตรงไปตรงมา โดยใช้ข้อมูล ASCII หรือไบนารีเพื่อจัดเก็บพิกเซลของภาพ ทำให้สามารถอ่านและเขียนโปรแกรมได้ง่ายอย่างน่าทึ่งโดยไม่ต้องใช้ไลบรารีหรือเครื่องมือการแยกวิเคราะห์ที่ซับซ้อน
ไฟล์ PNM แบ่งออกเป็นสองประเภทหลักตามการเข้ารหัส: รูปแบบ ASCII (Plain) ซึ่งกำหนดโดยตัวเลขวิเศษ 'P1', 'P2' และ 'P3' สำหรับบิตแมป, เกรย์แมป และพิกซ์แมปตามลำดับ และรูปแบบไบนารี (Raw) ซึ่งแสดงโดยตัวเลขวิเศษ 'P4', 'P5' และ 'P6' รูปแบบ ASCII อ่านได้ง่ายกว่ามนุษย์และแยกวิเคราะห์ได้ง่ายกว่า แต่มีประสิทธิภาพน้อยกว่าในแง่ของขนาดไฟล์และความเร็วในการประมวลผลเมื่อเปรียบเทียบกับรูปแบบไบนารี ซึ่งเหมาะสำหรับแอปพลิเคชันในโลกแห่งความจริงที่ประสิทธิภาพและประสิทธิภาพในการจัดเก็บมีความสำคัญ
ไฟล์ PNM แต่ละไฟล์เริ่มต้นด้วยส่วนหัวที่มีตัวเลขวิเศษที่ระบุประเภทของภาพ (PBM, PGM, PPM) ตามด้วยช่องว่าง ขนาดของภาพ (ความกว้างและความสูง) คั่นด้วยช่องว่าง และสำหรับไฟล์ PGM และ PPM ค่าสีสูงสุด (ตามด้วยช่องว่างอีกครั้ง) ซึ่งระบุความลึกของสี ส่วนหัวนั้นเรียบง่าย แต่มีข้อมูลที่จำเป็นทั้งหมดที่จำเป็นสำหรับการตีความส่วนที่เหลือของไฟล์ ซึ่งประกอบด้วยข้อมูลพิกเซล
ข้อมูลพิกเซลในไฟล์ PNM จะถูกจัดเก็บแตกต่างกันไปตามประเภท สำหรับไฟล์ PBM แต่ละพิกเซลจะแสดงเป็นค่าไบนารี (0 หรือ 1) ซึ่งระบุสีดำหรือสีขาว ไฟล์ PGM จัดเก็บแต่ละพิกเซลเป็นค่าเฉดสีเทา โดยปกติจะอยู่ในช่วงตั้งแต่ 0 (สีดำ) ถึงค่าสูงสุดที่ระบุ (สีขาว) ไฟล์ PPM เป็นภาพสี จัดเก็บแต่ละพิกเซลเป็นค่าแยกกันสามค่า (แดง เขียว และน้ำเงิน) โดยแต่ละค่าอยู่ในช่วงตั้งแต่ 0 ถึงค่าสูงสุดที่ระบุ ในรูปแบบ ASCII ค่าเหล่านี้จะแสดงเป็นตัวเลข ASCII ที่คั่นด้วยช่องว่าง ในขณะที่ในรูปแบบไบนารี ค่าเหล่านี้จะถูกจัดเก็บเป็นตัวเลขไบนารี ซึ่งช่วยให้แสดงได้กระช ับยิ่งขึ้น
หนึ่งในลักษณะเฉพาะที่ไม่เหมือนใครของรูปแบบ PNM คือความสามารถในการขยายและแก้ไขได้ง่าย เนื่องจากโครงสร้างที่ตรงไปตรงมา จึงค่อนข้างง่ายสำหรับนักพัฒนาในการสร้างโปรแกรมที่จัดการไฟล์ PNM ตัวอย่างเช่น การแปลงระหว่างรูปแบบ PNM ต่างๆ การเปลี่ยนแปลงขนาดของภาพ หรือการเปลี่ยนความลึกของสีสามารถทำได้ด้วยเทคนิคการเขียนโปรแกรมที่ง่ายดาย สิ่งนี้ทำให้รูปแบบ PNM เป็นตัวเลือกที่ยอดเยี่ยมสำหรับวัตถุประสงค์ทางการศึกษา ซึ่งต้องการความเข้าใจพื้นฐานเกี่ยวกับการถ่ายภาพดิจิทัลและการเขียนโปรแกรม
แม้จะมีข้อดีในเรื่องความเรียบง่ายและความสามารถในการขยายได้ แต่รูปแบบ PNM ก็มีข้อจำกัดที่สำคัญ การขาดการสนับสนุนสำหรับเมตาดาต้า เช่น ข้อมูล EXIF (Exchangeable Image File Format) ซึ่งมีการตั้งค่าจากกล้อง เช่น รูรับแสง เวลาเปิดรับแสง และความเร็ว ISO ทำให้ประโยชน์ใช้สอยของ PNM ในการถ่ายภาพระดับมืออาชีพและแอปพลิเคชันสมัยใหม่ที่พึ่งพาเมตาดาต้าอย่างมาก นอกจากนี้ การไม่มีกลไกการบีบอัดในไฟล์ PNM ทำให้ขนาดไฟล์ใหญ่กว่าเมื่อเปรียบเทียบกับรูปแบบต่างๆ เช่น JPEG หรือ PNG ซึ่งใช้ขั้นตอนวิธีที่ซับซ้อนเพื่อจัดเก็บข้อมูลภาพอย่างมีประสิทธิภาพ
เพื่อลดข้อบกพร่องเหล่านี้ จึงได้มีการพัฒนารูปแบบระดับสูงที่ได้มาจากกลุ่ม Netpbm เช่น Portable Arbitrary Map (PAM) PAM ออกแบบมาให้มีความยืดหยุ่นและทันสมัยกว่า PNM โดยรองรับความลึกของสีและช่องสัญญาณที่หลากหลายยิ่งขึ้น รวมถึงความโปร่งใส ไฟล์ PAM ใช้ตัวเลขวิเศษ 'P7' และเพิ่มฟิลด์ส่วนหัวเพิ่มเติมเพื่อรองรับคุณสมบัติที่ได้รับการปรับปรุงเหล่านี้ อย่างไรก็ตาม แม้จะมีการปรับปรุงเหล่านี้ รูปแบบ PAM และ PNM ก็ยังมีการใช้งานที่จำกัดนอกเหนือจากการศึกษาและแอปพลิเคชันเฉพาะบางอ ย่าง
ความสำคัญของรูปแบบ PNM แม้จะมีข้อจำกัด แต่ก็ไม่สามารถมองข้ามได้ โดยเฉพาะอย่างยิ่งในบริบทของการศึกษาและการพัฒนาซอฟต์แวร์ สำหรับผู้เริ่มต้น รูปแบบนี้ทำหน้าที่เป็นจุดเริ่มต้นที่เข้าถึงได้ในโลกของการถ่ายภาพดิจิทัล ซึ่งความเข้าใจแนวคิดพื้นฐานมีความสำคัญก่อนที่จะก้าวไปสู่หัวข้อที่ซับซ้อนยิ่งขึ้น รูปแบบนี้ให้แนวทางปฏิบัติในการเรียนรู้เกี่ยวกับพิกเซล การประมวลผลภาพ และพื้นฐานของรูปแบบไฟล์โดยไม่ต้องติดหล่มอยู่กับความซับซ้อนของขั้นตอนวิธีการบีบอัดและการจัดการเมตาดาต้าที่พบในรูปแบบขั้นสูงกว่า
จากมุมมองการพัฒนาซอฟต์แวร์ ไฟล์ PNM ทำหน้าที่เป็นรูปแบบตัวกลางที่ยอดเยี่ยมในกระบวนการประมวลผลภาพ เนื่องจากความเรียบง่าย การแปลงภาพจากและไปยัง PNM จึงเป็นงานที่ตรงไปตรงมา ทำให้เหมาะสำหรับขั้นตอนเริ่มต้นของการประมวลผลที่ไม่จำเป็นต้องใช้การดำเนินการที่ซับซ้อน ความสามารถในการทำงานร่วมกันนี้ยังช่วยในการทดสอบและดีบักขั้นตอนวิธีการประมวลผลภาพ เนื่องจากนักพัฒนาสามารถตรวจสอบและแก้ไขไฟล์ PNM ได้อย่างง่ายดายโดยไม่ต้องใช้เครื่องมือเฉพาะทาง
ที่น่าสนใจคือ รูปแบบ PNM ยังพบช่องทางในโดเมนทางวิทยาศาสตร์และการวิจัยบางอย่างที่การควบคุมพิกเซลแต่ละพิกเซลมีความสำคัญ และค่าใช้จ่ายเพิ่มเติมของรูปแบบไฟล์ที่ซับซ้อนนั้นไม่เป็นที่ยอมรับ สิ่งนี้เป็นจริงโดยเฉพาะในด้านต่างๆ เช่น คอมพิวเตอร์วิทัศน์ การจดจำรูปแบบ และการเรียนรู้ของเครื่อง ซึ่งเน้นที่การจัดการและวิเคราะห์ข้อมูลภาพมากกว่าประสิทธิภาพในการจัดเก็บหรือแสดงภาพ ในสาขานี้ การแสดงพิกเซลที่ตรงไปตรงมาในไฟล์ PNM สามารถลดความซับซ้อนของการพัฒนาและการทดสอบขั้นตอนวิธีได้อย่างม าก
ยิ่งไปกว่านั้น ความเปิดกว้างและความเรียบง่ายของรูปแบบ PNM ได้สร้างแรงบันดาลใจให้มีการพัฒนาโปรแกรมและเครื่องมือขนาดเล็กเฉพาะทางมากมายภายในชุมชนโอเพนซอร์ส เครื่องมือเหล่านี้ตอบสนองความต้องการที่หลากหลาย ตั้งแต่การแปลงภาพที่ง่ายไปจนถึงงานเฉพาะทางมากขึ้น เช่น การวิเคราะห์ภาพ การกรอง และการแปลง ความสามารถในการขยายและปรับแต่งเครื่องมือเหล่านี้ได้ง่ายๆ ช่วยให้รูปแบบ PNM ยังคงมีความเกี่ยวข้องและมีประโยชน์ในบริบทเฉพาะ แม้ว่ารูปแบบภาพที่ซับซ้อนกว่าจะแพร่หลายสำหรับการใช้งานทั่วไป
อย่างไรก็ตาม สิ่งสำคัญคือต้องตระหนักว่าเมื่อเทคโนโลยีการถ่ายภาพดิจิทัลก้าวหน้า ความเกี่ยวข้องของรูปแบบ PNM ในแอปพลิเคชันกระแสหลักก็ลดลงอย่างต่อเนื่อง ความต้องการที่เพิ่มขึ้นสำหรับภาพความละเอียดสูง การจัดการสีที่ซับซ้อน และการบีบอัดที่มีประสิทธิภาพเพื่อประหยัดพื้นที่จัดเก็บและเวลาในการถ่ายโอน หมายความว่ารูปแบบต่างๆ เช่น JPEG, PNG และ WebP มักเป็นตัวเลือกที่เหมาะสมกว่าสำหรับนักพัฒนาเว็บ ช่างภาพ และผู้ใช้ทั่วไป อย่างไรก็ตาม มรดกของรูปแบบ PNM โดยเฉพาะอย่างยิ่งการเน้นความเรียบง่ายและการเข้าถึงได้ ยังคงมีอิทธิพลต่อการพัฒนาของรูปแบบภาพใหม่และเครื่องมือการประมวลผล
ในขณะที่รูปแบบ PNM อาจไม่ใช่ตัวเลือกแรกสำหรับแอปพลิเคชัน
ตัวแปลงนี้ทำงานอย่างสมบูรณ์ในเบราว์เซอร์ของคุณ เมื่อคุณเลือกไฟล์ ไฟล์จะถูกอ่านเข้าไปในหน่วยความจำและแปลงเป็นรูปแบบที่เลือก จากนั้นคุณสามารถดาวน์โหลดไฟล์ที่แปลงแล้วได้
การแปลงจะเริ่มขึ้นทันที และไฟล์ส่วนใหญ่จะถูกแปลงภายในเวลาไม่ถึงหนึ่งวินาที ไฟล์ขนาดใหญ่อาจใช้เวลานานกว่านั้น
ไฟล์ของคุณจะไม่ถูกอัปโหลดไปยังเซิร์ฟเวอร์ของเรา ไฟล์เหล่านั้นจะถูกแปลงในเบราว์เซอร์ของคุณ จากนั้นไฟล์ที่แปลงแล้วจะถูกดาวน์โ หลด เราไม่เคยเห็นไฟล์ของคุณ
เรารองรับการแปลงระหว่างรูปแบบภาพทั้งหมด รวมถึง JPEG, PNG, GIF, WebP, SVG, BMP, TIFF และอื่นๆ
ตัวแปลงนี้ฟรีโดยสมบูรณ์ และจะฟรีตลอดไป เนื่องจากทำงานในเบราว์เซอร์ของคุณ เราจึงไม่ต้องจ่ายค่าเซิร์ฟเวอร์ ดังนั้นเราจึงไม่เรียกเก็บเงินจากคุณ
ใช่! คุณสามารถแปลงไฟล์ได้มากเท่าที่คุณต้องการในคราวเดียว เพียงเลือกหลายไฟล์เมื่อคุณเพิ่ม