การลบพื้นหลัง แยกวัตถุออกจากสภาพแวดล้อมเพื่อให้คุณสามารถวางไว้บน ความโปร่งใส, สลับฉาก, หรือประกอบเข้ากับการออกแบบใหม่. ภายใต้กระโปรงคุณกำลังประเมิน อัลฟ่าแมท—ความทึบต่อพิกเซลจาก 0 ถึง 1—แล้ว การประกอบอัลฟ่า โฟร์กราวด์ поверх สิ่งอื่น. นี่คือคณิตศาสตร์จาก Porter–Duff และสาเหตุของข้อผิดพลาดที่คุ้นเคยเช่น “ขอบ” และ อัลฟ่าตรงกับอัลฟ่าที่คูณไว้ล่วงหน้า. สำหรับคำแนะนำเชิงปฏิบัติเกี่ยวกับการคูณล่วงหน้าและสีเชิงเส้น, ดู บันทึก Win2D ของ Microsoft, Søren Sandmann, และ บทความของ Lomont เกี่ยวกับการผสมเชิงเส้น.
หากคุณสามารถควบคุมการจับภาพได้, ทาสีพื้นหลังเป็นสีทึบ (ส่วนใหญ่มักเป็นสีเขียว) และ คีย์ สีนั้นออกไป. มันรวดเร็ว, ผ่านการทดสอบการต่อสู้ในภาพยนตร์และการออกอากาศ, และเหมาะสำหรับวิดีโอ. ข้อแลกเปลี่ยนคือแสงและตู้เสื้อผ้า: แสงสีจะรั่วไหลไปยังขอบ (โดยเฉพาะเส้นผม), ดังนั้นคุณจะใช้เครื่องมือ despill เพื่อทำให้การปนเปื้อนเป็นกลาง. ไพรเมอร์ที่ดี ได้แก่ เอกสารของ Nuke, Mixing Light, และการสาธิต Fusion แบบลงมือปฏิบัติ.
สำหรับภาพเดี่ยวที่มีพื้นหลังรก, อัลกอริทึม แบบโต้ตอบ ต้องการคำใบ้จากผู้ใช้เล็กน้อย—เช่น, สี่เหลี่ยมผืนผ้าหลวมๆ หรือลายเส้นขยุกขยิก—และมาบรรจบกันเป็นหน้ากากที่คมชัด. วิธีการที่เป็นที่ยอมรับคือ GrabCut (บทในหนังสือ), ซึ่งเรียนรู้แบบจำลองสีสำหรับโฟร์กราวด์/พื้นหลัง และใช้การตัดกราฟซ้ำๆ เพื่อแยกพวกมัน. คุณจะเห็นแนวคิดที่คล้ายกันใน การเลือกโฟร์กราวด์ของ GIMP โดยใช้ SIOX (ปลั๊กอิน ImageJ).
การทำแมท แก้ปัญหาความโปร่งใสแบบเศษส่วนที่ขอบเขตที่บอบบาง (ผม, ขน, ควัน, แก้ว). การทำแมทแบบปิดคลาสสิก ใช้ trimap (แน่นอน- หน้า/แน่นอน-หลัง/ไม่ทราบ) และแก้ปัญหาระบบเชิงเส้นสำหรับอัลฟ่าที่มีความเที่ยงตรงของขอบสูง. การทำแมทภาพแบบลึกสมัยใหม่ ฝึกอบรมโครงข่ายประสาทเทียมบนชุดข้อมูล Adobe Composition-1K (เอกสาร MMEditing), และได้รับการประเมินด้วยเมตริกเช่น SAD, MSE, Gradient, และ Connectivity (คำอธิบายเกณฑ์มาตรฐาน).
งานแบ่งส่วนที่เกี่ยวข้องก็มีประโยชน์เช่นกัน: DeepLabv3+ ปรับปรุงขอบเขตด้วยตัวเข้ารหัส-ตัวถอดรหัสและคอนโวลูชัน atrous (PDF); Mask R-CNN ให้หน้ากากต่ออินสแตนซ์ (PDF); และ SAM (Segment Anything) เป็น โมเดลพื้นฐาน ที่สามารถแจ้งได้ ที่สร้างหน้ากากแบบ zero-shot บนภาพที่ไม่คุ้นเคย.
งานวิชาการรายงานข้อผิดพลาด SAD, MSE, Gradient, และ Connectivity บน Composition-1K. หากคุณกำลังเลือกโมเดล, ให้มองหาเมตริกเหล่านั้น (คำจำกัดความของเมตริก; ส่วนเมตริกของ Background Matting). สำหรับภาพบุคคล/วิดีโอ, MODNet และ Background Matting V2 แข็งแกร่ง; สำหรับภาพ “วัตถุเด่น” ทั่วไป, U2-Net เป็นพื้นฐานที่มั่นคง; สำหรับความโปร่งใสที่ยาก, FBA อาจสะอาดกว่า.
รูปแบบ Digital Picture Exchange (DPX) เป็นรูปแบบไฟล์ภาพที่ออกแบบมาโดยเฉพาะสำหรับการถ่ายโอนเฟรมนิ่งและลำดับภาพระหว่างอุปกรณ์และแอปพลิเคชันต่างๆ ในอุตสาหกรรมภาพยนตร์และโทรทัศน์ รูปแบบ DPX พัฒนาขึ้นจากรูปแบบไฟล์ Cineon (.cin) ของ Kodak เพื่อทำให้การแลกเปลี่ยนภาพยนตร์และเมตาข้อมูลระหว่างระบบดิจิทัลอินเตอร์มีเดียต (DI) แอปพลิเคชันวิชวลเอฟเฟกต์ (VFX) และเครื่องมือเกรดสีเป็นมาตรฐาน Society of Motion Picture and Television Engineers (SMPTE) ได้ทำให้รูปแบบ DPX เป็นมาตรฐานภายใต้ SMPTE 268M เพื่อให้มั่นใจถึงความเข้ากันได้อย่างครอบคลุมและการยอมรับอย่างกว้างขวางในอุตสาหกรรม
ไฟล์ DPX เป็นภาพบิตแมปขนาดใหญ่ที่ไม่บีบอัดซึ่งจัดเก็บข้อมูลภาพในลักษณะที่ตรงไปตรงมา ช่วยให้ได้ภาพคุณภาพสูง ความละเอียดสูงที่จำเป็นสำหรับการผลิตภาพยนตร์และโทรทัศน์ระดับมืออาชีพ ไฟล์เหล่านี้สามารถจัดเก็บข้อมูลภาพที่ความละเอียด อัตราส่วนภาพ และความลึกของสีต่างๆ ซึ่งทำให้มีความหลากหลายอย่างเหลือเชื่อ โดยทั่วไปแล้ว ไฟล์ DPX จะใช้ความลึกของสีแบบล็อก 10 บิตหรือแบบเชิงเส้น 16 บิตเพื่อรองรับช่วงไดนามิกสูงที่จำเป็นในเวิร์กโฟลว์วิดีโอและภาพยนตร์ระดับมืออาชีพ ความสามารถนี้ช่วยให้มั่นใจได้ว่าไฟล์ DPX สามารถแสดงช่วงความสว่างที่กว้าง ตั้งแต่เงาที่มืดที่สุดไปจนถึงไฮไลต์ที่สว่างที่สุด โดย ไม่สูญเสียข้อมูล
หนึ่งในคุณสมบัติหลักของรูปแบบ DPX คือการรองรับเมตาข้อมูลที่ครอบคลุม เมตาข้อมูลนี้สามารถรวมข้อมูลเกี่ยวกับแหล่งที่มาของภาพยนตร์หรือวิดีโอ เช่น ประเภทของภาพยนตร์ รายละเอียดการผลิต ข้อมูลจำเพาะของกล้อง และไทม์โค้ดของเฟรม นอกจากนี้ยังสามารถพกพาข้อมูลการจัดการสี รวมถึงสีหลัก ลักษณะการถ่ายโอน และข้อมูลสี เมตาข้อมูลที่มีอยู่มากมายนี้มีความสำคัญอย่างยิ่งเพื่อให้มั่นใจว่าภาพได้รับการประมวลผลและสร้างซ้ำอย่างถูกต้องในอุปกรณ์และแอปพลิเคชันต่างๆ โดยรักษาความสม่ำเสมอในการเกรดสีและการใช้เอฟเฟกต์ตลอดกระบวนการโพสต์โปรดักชัน
ส่วนหัวของไฟล์ DPX มีบทบาทสำคัญในการจัดเก็บเมตาข้อมูลและแนะนำแอปพลิเคชันเกี่ยวกับวิธีการตีความข้อมูลภาพอย่างถูกต้อง ส่วนหัวแบ่งออกเป็นส่วนต่างๆ รวมถึงข้อมูลไฟล์ ข้อมู ลภาพ ข้อมูลการวางแนว ข้อมูลภาพยนตร์ และข้อมูลโทรทัศน์ โดยแต่ละส่วนมีประเภทเมตาข้อมูลเฉพาะตัว ตัวอย่างเช่น ส่วนข้อมูลไฟล์มีข้อมูลทั่วไป เช่น หมายเลขเวอร์ชันของรูปแบบ DPX และขนาดไฟล์ ในขณะที่ส่วนข้อมูลภาพจะให้รายละเอียดเกี่ยวกับความละเอียด อัตราส่วนภาพ และข้อมูลสีของภาพ
ในแง่ของข้อมูลจำเพาะทางเทคนิค ไฟล์ DPX สามารถบันทึกได้ทั้งแบบบิ๊กเอนเดียนหรือลิตเทิลเอนเดียน ทำให้สามารถปรับให้เข้ากับสภาพแวดล้อมการคำนวณที่แตกต่างกันได้ คุณสมบัติที่โดดเด่นของรูปแบบ DPX คือความสามารถในการจัดเก็บภาพหลายภาพภายในไฟล์เดียว ซึ่งช่วยให้สามารถแสดงเนื้อหาแบบสเตอริโอสโคปิก (3 มิติ) หรือลำดับภาพสำหรับงานแอนิเมชันและเอฟเฟกต์ คุณสมบัตินี้เน้นย้ำถึงการออกแบบรูปแบบให้มีความยืดหยุ่นในเวิร์กโฟลว์การผลิตที่ซับซ้อน ช่วยให้สามารถรวมแล ะแลกเปลี่ยนเนื้อหาได้อย่างราบรื่น
รูปแบบ DPX รองรับโมเดลสีต่างๆ รวมถึง RGB, CIE XYZ และ YCbCr ซึ่งช่วยให้เข้ากันได้กับอุปกรณ์อินพุตและเอาต์พุตที่หลากหลาย สำหรับภาพ RGB แต่ละช่อง (สีแดง สีเขียว และสีน้ำเงิน) มักจะถูกจัดเก็บแยกกัน และมีการรองรับช่องอัลฟาเพิ่มเติมสำหรับข้อมูลความโปร่งใส ซึ่งมีความสำคัญสำหรับการจัดองค์ประกอบในเอฟเฟกต์ภาพ ความยืดหยุ่นในการแสดงสีนี้ช่วยให้มั่นใจได้ว่าไฟล์ DPX สามารถใช้ในกระบวนการประมวลผลภาพดิจิทัลเกือบทุกประเภท ตั้งแต่การจับภาพเริ่มต้นจนถึงการส่งมอบขั้นสุดท้าย
การบีบอัดไม่ใช่คุณสมบัติหลักของรูปแบบ DPX เนื่องจากมีจุดมุ่งหมายเพื่อรักษาความเที่ยงตรงและรายละเอียดของภาพสูงสุดสำหรับการใช้งานระดับมืออาชีพ อย่างไรก็ตาม เพื่อจัดการกับขนาดไฟล์ขนาดใหญ่ที่เกิดขึ้น โดยเฉพาะอย่างยิ่งเมื่อจัดการ กับไฟล์ความละเอียดสูงหรือไฟล์หลายภาพ แอปพลิเคชันที่ใช้ DPX มักจะใช้โซลูชันการจัดการและจัดเก็บไฟล์ของตนเอง โซลูชันเหล่านี้อาจรวมถึงระบบจัดเก็บความจุสูง ความเร็วสูง และโปรโตคอลการถ่ายโอนไฟล์ที่มีประสิทธิภาพเพื่อจัดการกับปริมาณข้อมูลจำนวนมากที่เกี่ยวข้องกับไฟล์ DPX ได้อย่างมีประสิทธิภาพ
ไฟล์ DPX มักใช้ในพื้นที่สีเชิงเส้น ซึ่งหมายความว่าค่าที่จัดเก็บไว้แสดงถึงระดับแสงเชิงเส้น การทำงานในพื้นที่สีเชิงเส้นช่วยให้สามารถคำนวณและจัดการแสงและสีได้แม่นยำยิ่งขึ้น ซึ่งมีความสำคัญในการสร้างเอฟเฟกต์ที่สมจริงและภาพคอมโพสิตคุณภาพสูง อย่างไรก็ตาม การรองรับพื้นที่สีล็อกยังรองรับเวิร์กโฟลว์ที่พึ่งพาเส้นตอบสนองแบบฟิล์ม ซึ่งให้ความหลากหลายในการจัดการวัสดุต้นทางและตัวเลือกด้านสุนทรียศาสตร์ที่แตกต่างกัน
การควบคุ มเวอร์ชันและการจัดการการแก้ไขมีความสำคัญในสภาพแวดล้อมการทำงานร่วมกัน และในขณะที่รูปแบบ DPX เองไม่รองรับการจัดเวอร์ชันโดยตรงภายในโครงสร้างไฟล์ แต่สามารถใช้ฟิลด์เมตาข้อมูลในส่วนหัวเพื่อติดตามข้อมูลเวอร์ชัน หมายเลขฉาก และหมายเลขเทค วิธีนี้ช่วยให้ทีมสามารถจัดระเบียบ จัดการ และดึงเวอร์ชันเฉพาะของภาพหรือลำดับภาพตลอดกระบวนการผลิต ซึ่งส่งเสริมประสิทธิภาพและลดโอกาสเกิดข้อผิดพลาดหรือการเขียนทับ
นอกเหนือจากข้อมูลจำเพาะทางเทคนิคแล้ว ความสำคัญของรูปแบบ DPX อยู่ที่บทบาทในการเชื่อมช่องว่างระหว่างการผลิตภาพยนตร์แบบดั้งเดิมและกระบวนการโพสต์โปรดักชันแบบดิจิทัล โดยการจัดเตรียมรูปแบบมาตรฐานที่เชื่อถือได้สำหรับการแลกเปลี่ยนภาพ DPX ช่วยให้สามารถรวมองค์ประกอบแบบอะนาล็อกและดิจิทัลได้อย่างราบรื่นภายในกระบวนการสร้างภาพยนตร์ การรวมเข้าด้วยกันนี้มีความสำคัญต่อการรักษาเจตนารมณ์ทางศิลปะของผู้สร้างภาพยนตร์ในขณะที่ใช้ประโยชน์จากข้อได้เปรียบด้านความคิดสร้างสรรค์และเทคนิคของเทคนิคโพสต์โปรดักชันแบบดิจิทัล
การปรับใช้และการใช้รูปแบบ DPX ในซอฟต์แวร์และฮาร์ดแวร์มาตรฐานอุตสาหกรรมเน้นย้ำถึงความสำคัญของรูปแบบนี้ ระบบดิจิทัลอินเตอร์มีเดียตหลัก ซอฟต์แวร์เอฟเฟกต์ภาพ และเครื่องมือเกรดสีรองรับรูปแบบ DPX ซึ่งช่วยให้เวิร์กโฟลว์ราบรื่นในขั้นตอนการผลิตที่แตกต่างกัน ความสามารถในการจัดการไฟล์ DPX ถือเป็นข้อกำหนดพื้นฐานสำหรับซอฟต์แวร์ระดับมืออาชีพในอุตสาหกรรมภาพยนตร์และโทรทัศน์ ซึ่งแสดงให้เห็นถึงอิทธิพลที่แพร่หลายของรูปแบบนี้
แม้จะมีจุดแข็ง แต่รูปแบบ DPX ก็ยังคงเผชิญกับความท้าทาย โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับขนาดไฟล์ขนาดให ญ่และความจำเป็นในการจัดเก็บและแบนด์วิดธ์จำนวนมากเพื่อจัดการไฟล์เหล่านี้อย่างมีประสิทธิภาพ การเกิดขึ้นของรูปแบบภาพและตัวแปลงสัญญาณใหม่ๆ ที่ให้ภาพคุณภาพสูงพร้อมตัวเลือกการบีบอัดทำให้เกิดภูมิทัศน์การแข่งขัน อย่างไรก็ตาม การเน้นย้ำถึงคุณภาพของภาพที่ไม่มีการประนีประนอมของรูปแบบ DPX รวมกับการรองรับเมตา