การลบพื้นหลัง แยกวัตถุออกจากสภาพแวดล้อมเพื่อให้คุณสามารถวางไว้บน ความโปร่งใส, สลับฉาก, หรือประกอบเข้ากับการออกแบบใหม่. ภายใต้กระโปรงคุณกำลังประเมิน อัลฟ่าแมท—ความทึบต่อพิกเซลจาก 0 ถึง 1—แล้ว การประกอบอัลฟ่า โฟร์กราวด์ поверх สิ่งอื่น. นี่คือคณิตศาสตร์จาก Porter–Duff และสาเหตุของข้อผิดพลาดที่คุ้นเคยเช่น “ขอบ” และ อัลฟ่าตรงกับอัลฟ่าที่คูณไว้ล่วงหน้า. สำหรับคำแนะนำเชิงปฏิบัติเกี่ยวกับการคูณล่วงหน้าและสีเชิงเส้น, ดู บันทึก Win2D ของ Microsoft, Søren Sandmann, และ บทความของ Lomont เกี่ยวกับการผสมเชิงเส้น.
หากคุณสามารถควบคุมการจับภาพได้, ทาสีพื้นหลังเป็นสีทึบ (ส่วนใหญ่มักเป็นสีเขียว) และ คีย์ สีนั้นออกไป. มันรวดเร็ว, ผ่านการทดสอบการต่อสู้ในภาพยนตร์และการออกอากาศ, และเหมาะสำหรับวิดีโอ. ข้อแลกเปลี่ยนคือแสงและตู้เสื้อผ้า: แสงสีจะรั่วไหลไปยังขอบ (โดยเฉพาะเส้นผม), ดังนั้นคุณจะใช้เครื่องมือ despill เพื่อทำให้การปนเปื้อนเป็นกลาง. ไพรเมอร์ที่ดี ได้แก่ เอกสารของ Nuke, Mixing Light, และการสาธิต Fusion แบบลงมือปฏิบัติ.
สำหรับภาพเดี่ยวที่มีพื้นหลังรก, อัลกอริทึม แบบโต้ตอบ ต้องการคำใบ้จากผู้ใช้เล็กน้อย—เช่น, สี่เหลี่ยมผืนผ้าหลวมๆ หรือลายเส้นขยุกขยิก—และมาบรรจบกันเป็นหน้ากากที่คมชัด. วิธีการที่เป็นที่ยอมรับคือ GrabCut (บทในหนังสือ), ซึ่งเรียนรู้แบบจำลองสีสำหรับโฟร์กราวด์/พื้นหลัง และใช้การตัดกราฟซ้ำๆ เพื่อแยกพวกมัน. คุณจะเห็นแนวคิดที่คล้ายกันใน การเลือกโฟร์กราวด์ของ GIMP โดยใช้ SIOX (ปลั๊กอิน ImageJ).
การทำแมท แก้ปัญหาความโปร่งใสแบบเศษส่วนที่ขอบเขตที่บอบบาง (ผม, ขน, ควัน, แก้ว). การทำแมทแบบปิดคลาสสิก ใช้ trimap (แน่นอน- หน้า/แน่นอน-หลัง/ไม่ทราบ) และแก้ปัญหาระบบเชิงเส้นสำหรับอัลฟ่าที่มีความเที่ยงตรงของขอบสูง. การทำแมทภาพแบบลึกสมัยใหม่ ฝึกอบรมโครงข่ายประสาทเทียมบนชุดข้อมูล Adobe Composition-1K (เอกสาร MMEditing), และได้รับการประเมินด้วยเมตริกเช่น SAD, MSE, Gradient, และ Connectivity (คำอธิบายเกณฑ์มาตรฐาน).
งานแบ่งส่วนที่เกี่ยวข้องก็มีประโยชน์เช่นกัน: DeepLabv3+ ปรับปรุงขอบเขตด้วยตัวเข้ารหัส-ตัวถอดรหัสและคอนโวลูชัน atrous (PDF); Mask R-CNN ให้หน้ากากต่ออินสแตนซ์ (PDF); และ SAM (Segment Anything) เป็น โมเดลพื้นฐาน ที่สามารถแจ้งได้ ที่สร้างหน้ากากแบบ zero-shot บนภาพที่ไม่คุ้นเคย.
งานวิชาการรายงานข้อผิดพลาด SAD, MSE, Gradient, และ Connectivity บน Composition-1K. หากคุณกำลังเลือกโมเดล, ให้มองหาเมตริกเหล่านั้น (คำจำกัดความของเมตริก; ส่วนเมตริกของ Background Matting). สำหรับภาพบุคคล/วิดีโอ, MODNet และ Background Matting V2 แข็งแกร่ง; สำหรับภาพ “วัตถุเด่น” ทั่วไป, U2-Net เป็นพื้นฐานที่มั่นคง; สำหรับความโปร่งใสที่ยาก, FBA อาจสะอาดกว่า.
รูปแบบภาพ JPEG 2000 ซึ่งมักย่อว่า JP2 เป็นระบบการเข้ารหัสภาพที่สร้างขึ้นเพื่อเป็นตัวสืบทอดมาตรฐาน JPEG เดิม โดยคณะกรรมการ Joint Photographic Experts Group พัฒนาขึ้นในช่วงต้นทศวรรษ 2000 ด้วยจุดประสงค์เพื่อให้รูปแบบภาพใหม่ที่สามารถเอาชนะข้อจำกัดบางประการของรูปแบบ JPEG แบบดั้งเดิมได้ JPEG 2000 ไม่ควรสับสนกับรูปแบบ JPEG มาตรฐานที่ใช้ส่วนขยายไฟล์ .jpg หรือ .jpeg JPEG 2000 ใช้ส่วนขยาย .jp2 สำหรับไฟล์และมีการปรับปรุงที่สำคัญหลายประการเหนือกว่ารุ่นก่อน รวมถึงคุณภาพของภาพที่ดีกว่าในอัตราการบีบอัดที่สูงกว่า รองรับความลึกของบิตที่สูงกว่า และการจัดการความโปร่งใสที่ดีขึ้นผ่านช่องอัลฟา
หนึ่งในคุณสมบัติหลักของ JPEG 2000 คือการใช้การบีบอัดเวฟเล็ต ซึ่งตรงกันข้ามกับการแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) ที่ใช้ในรูปแบบ JPEG เดิม การบีบอัดเวฟเล็ตเป็นรูปแบบหนึ่งของการบีบอัดข้อมูลที่เหมาะสำหรับการบีบอัดภาพ ซึ่งขนาดของไฟล์จะลดลงโดยไม่ลดทอนคุณภาพ ซึ่งทำได้โดยการแปลงภาพเป็นโดเมนเวฟเล็ตที่ข้อมูลภาพถูกจัดเก็บในลักษณะที่ช่วยให้ระดับรายละเอียดแตกต่างกันไป ซึ่งหมายความว่า JPEG 2000 สามารถให้การบีบอัดแบบไม่สูญเสียและแบบสูญเสียได้ภายในรูปแบบไฟล์เดียวกัน ซึ่งให้ความยืดหยุ่นตามความต้องการของผู้ใช้
อีกหนึ่งข้อได้เปรียบที่สำคัญของ JPEG 2000 คือการรองรับกา รถอดรหัสแบบก้าวหน้า คุณสมบัตินี้ช่วยให้สามารถแสดงภาพเวอร์ชันความละเอียดต่ำได้ในขณะที่ยังดาวน์โหลดไฟล์อยู่ ซึ่งอาจเป็นประโยชน์อย่างยิ่งสำหรับภาพบนเว็บ เมื่อได้รับข้อมูลเพิ่มเติม คุณภาพของภาพจะค่อยๆ ดีขึ้นจนกว่าจะแสดงภาพความละเอียดเต็มรูปแบบ ซึ่งตรงกันข้ามกับรูปแบบ JPEG มาตรฐานที่สามารถแสดงภาพได้หลังจากดาวน์โหลดไฟล์ทั้งหมดแล้วเท่านั้น
JPEG 2000 ยังนำเสนอแนวคิดของพื้นที่ที่สนใจ (ROI) ซึ่งช่วยให้สามารถบีบอัดส่วนต่างๆ ของภาพด้วยระดับคุณภาพที่แตกต่างกันได้ ตัวอย่างเช่น ในภาพถ่ายของบุคคล ใบหน้าของบุคคลนั้นสามารถเข้ารหัสด้วยคุณภาพที่สูงกว่าพื้นหลัง การควบคุมคุณภาพแบบเลือกนี้มีประโยชน์มากในแอปพลิเคชันที่ส่วนใดส่วนหนึ่งของภาพมีความสำคัญมากกว่าส่วนอื่นๆ
รูปแบบ JPEG 2000 ยังมีการปรับขนาดได้สูง รองรับความละเอียดขอ งภาพ ความลึกของสี และส่วนประกอบของภาพที่หลากหลาย การปรับขนาดนี้ครอบคลุมทั้งมิติเชิงพื้นที่และคุณภาพ ซึ่งหมายความว่าไฟล์ JPEG 2000 เดียวสามารถจัดเก็บความละเอียดและระดับคุณภาพได้หลายระดับ ซึ่งสามารถแยกออกมาตามความจำเป็นสำหรับแอปพลิเคชันหรืออุปกรณ์ต่างๆ ซึ่งทำให้ JPEG 2000 เป็นตัวเลือกที่ยอดเยี่ยมสำหรับการใช้งานที่หลากหลาย ตั้งแต่ภาพยนตร์ดิจิทัลไปจนถึงการถ่ายภาพทางการแพทย์ ซึ่งผู้ใช้ที่แตกต่างกันอาจต้องการแอตทริบิวต์ของภาพที่แตกต่างกัน
ในแง่ของความแม่นยำของสี JPEG 2000 รองรับได้สูงสุด 16 บิตต่อช่องสี เมื่อเทียบกับ 8 บิตต่อช่องใน JPEG มาตรฐาน ความลึกของบิตที่เพิ่มขึ้นนี้ช่วยให้มีช่วงสีที่กว้างขึ้นมากและการไล่ระดับสีที่ละเอียดอ่อนยิ่งขึ้น ซึ่งมีความสำคัญอย่างยิ่งสำหรับการแก้ไขและการพิมพ์ภาพระดับไฮเอนด์ที่ความเที่ยง ตรงของสีมีความสำคัญ
JPEG 2000 ยังมีคุณสมบัติการทนต่อข้อผิดพลาดที่แข็งแกร่ง ซึ่งทำให้เหมาะสำหรับการส่งภาพผ่านเครือข่ายที่มีความเสี่ยงสูงต่อการเสียหายของข้อมูล เช่น เครือข่ายไร้สายหรืออินเทอร์เน็ต รูปแบบนี้สามารถรวมเช็คซัมและการตรวจสอบความสมบูรณ์ของข้อมูลอื่นๆ เพื่อให้แน่ใจว่าสามารถสร้างภาพขึ้นใหม่ได้แม้ว่าแพ็กเก็ตข้อมูลบางส่วนจะสูญหายระหว่างการส่ง
แม้จะมีข้อดีมากมาย แต่ JPEG 2000 ก็ยังไม่ได้รับการยอมรับอย่างแพร่หลายเมื่อเทียบกับรูปแบบ JPEG เดิม สาเหตุหนึ่งคือความซับซ้อนของอัลกอริทึมการบีบอัด JPEG 2000 ซึ่งต้องใช้พลังในการประมวลผลมากกว่าในการเข้ารหัสและถอดรหัสภาพ ซึ่งทำให้ไม่น่าสนใจสำหรับเครื่องใช้ไฟฟ้าสำหรับผู้บริโภคและแพลตฟอร์มเว็บ ซึ่งมักให้ความสำคัญกับความเร็วและความเรียบง่าย นอกจากนี้ รูปแบบ JPEG เดิมยัง ฝังรากลึกในอุตสาหกรรมและมีระบบนิเวศของซอฟต์แวร์และฮาร์ดแวร์ที่กว้างขวาง ซึ่งทำให้รูปแบบใหม่ยากที่จะได้รับการยอมรับ
อีกปัจจัยหนึ่งที่จำกัดการนำ JPEG 2000 มาใช้คือปัญหาสิทธิบัตร มาตรฐาน JPEG 2000 รวมถึงเทคโนโลยีที่ได้รับการจดสิทธิบัตรโดยหน่วยงานต่างๆ ซึ่งนำไปสู่ความกังวลเกี่ยวกับค่าธรรมเนียมการอนุญาตและข้อจำกัดทางกฎหมาย แม้ว่าสิทธิบัตรเหล่านี้หลายฉบับจะหมดอายุหรือได้รับการเผยแพร่ในเงื่อนไขที่สมเหตุสมผลและไม่เลือกปฏิบัติ แต่ความไม่แน่นอนในเบื้องต้นก็มีส่วนทำให้บางองค์กรลังเลที่จะนำรูปแบบนี้มาใช้
แม้จะมีความท้าทายเหล่านี้ แต่ JPEG 2000 ก็ได้พบช่องทางในสาขาอาชีพบางอย่างที่คุณสมบัติขั้นสูงมีค่าเป็นพิเศษ ตัวอย่างเช่น ในภาพยนตร์ดิจิทัล JPEG 2000 ใช้เป็นส่วนหนึ่งของข้อกำหนด Digital Cinema Initiatives (DCI) สำหรับการจัดจำหน่ายและฉายภาพยน ตร์ การแสดงภาพคุณภาพสูงและการปรับขนาดได้ทำให้เหมาะสำหรับความต้องการของจอภาพยนตร์ความละเอียดสูง
ในแวดวงการเก็บถาวรและการเก็บรักษาแบบดิจิทัล JPEG 2000 ก็เป็นที่นิยมสำหรับความสามารถในการบีบอัดแบบไม่สูญเสียและความสามารถในการจัดเก็บภาพในลักษณะที่มีประสิทธิภาพและเอื้อต่อการเก็บรักษาในระยะยาว ห้องสมุด พิพิธภัณฑ์ และสถาบันอื่นๆ ที่ต้องการสำเนาดิจิทัลคุณภาพสูงของคอลเลกชันมักเลือก JPEG 2000 ด้วยเหตุผลเหล่านี้
อุตสาหกรรมการถ่ายภาพทางการแพทย์เป็นอีกหนึ่งพื้นที่ที่ JPEG 2000 ได้รับการนำไปใช้อย่างประสบความสำเร็จ การรองรับความลึกของบิตที่สูงและการบีบอัดแบบไม่สูญเสียของรูปแบบนี้มีความสำคัญเพื่อให้แน่ใจว่าภาพทางการแพทย์ เช่น รังสีเอกซ์และการสแกน MRI ยังคงรายละเอียดที่จำเป็นทั้งหมดสำหรับการวินิจฉัยและการวิเคราะห์ที่แม่ นยำ นอกจากนี้ ความสามารถในการจัดการไฟล์ภาพขนาดใหญ่มากอย่างมีประสิทธิภาพยังทำให้ JPEG 2000 เหมาะสำหรับภาคส่วนนี้
JPEG 2000 ยังมีชุดความสามารถของเมตาดาต้าที่หลากหลาย ซึ่งช่วยให้สามารถฝังข้อมูลที่ครอบคลุมภายในไฟล์ภาพได้เอง ซึ่งอาจรวมถึงข้อมูลลิขสิทธิ์ การตั้งค่ากล้อง ข้อมูลตำแหน่งทางภูมิศาสตร์ และอื่นๆ คุณสมบัตินี้มีประโยชน์อย่างยิ่งสำหรับระบบการจัดการสินทรัพย์และแอปพลิเคชันอื่นๆ ที่การติดตามที่มาและคุณสมบัติของภาพมีความสำคัญ
โดยสรุปแล้ว รูปแบบภาพ JPEG 2000 มีคุณสมบัติขั้นสูงมากมายที่ให้ประโยชน์อย่างมากในแง่ของคุณภาพของภาพ ความยืดหยุ่น และความแข็งแกร่ง การใช้การบีบอัดเวฟเล็ตช่วยให้ได้ภาพคุณภาพสูงในขนาดไฟล์ที่เล็กลง และการรองรับการถอดรหัสแบบก้าวหน้า พื้นที่ที่สนใจ และการปรับขนาดได้ทำให้เป็นตัวเลือกที่หลากหลายสำหรับแอปพลิเคชันมากมาย แม้ว่าจะยังไม่สามารถแทนที่รูปแบบ JPEG เดิมในการใช้งานทั่วไป แต่ JPEG 2000 ก็ได้กลายเป็นรูปแบบที่เลือกใช้ในอุตสาหกรรมที่ต้องการข้อได้เปรียบที่ไม่เหมือนใครมากที่สุด เมื่อเทคโนโลยียังคงก้าวหน้าและความต้องการการถ่ายภาพด