การลบพื้นหลัง แยกวัตถุออกจากสภาพแวดล้อมเพื่อให้คุณสามารถวางไว้บน ความโปร่งใส, สลับฉาก, หรือประกอบเข้ากับการออกแบบใหม่. ภายใต้กระโปรงคุณกำลังประเมิน อัลฟ่าแมท—ความทึบต่อพิกเซลจาก 0 ถึง 1—แล้ว การประกอบอัลฟ่า โฟร์กราวด์ поверх สิ่งอื่น. นี่คือคณิตศาสตร์จาก Porter–Duff และสาเหตุของข้อผิดพลาดที่คุ้นเคยเช่น “ขอบ” และ อัลฟ่าตรงกับอัลฟ่าที่คูณไว้ล่วงหน้า. สำหรับคำแนะนำเชิงปฏิบัติเกี่ยวกับการคูณล่วงหน้าและสีเชิงเส้น, ดู บันทึก Win2D ของ Microsoft, Søren Sandmann, และ บทความของ Lomont เกี่ยวกับการผสมเชิงเส้น.
หากคุณสามารถควบคุมการจับภาพได้, ทาสีพื้นหลังเป็นสีทึบ (ส่วนใหญ่มักเป็นสีเขียว) และ คีย์ สีนั้นออกไป. มันรวดเร็ว, ผ่านการทดสอบการต่อสู้ในภาพยนตร์และการออกอากาศ, และเหมาะสำหรับวิดีโอ. ข้อแลกเปลี่ยนคือแสงและตู้เสื้อผ้า: แสงสีจะรั่วไหลไปยังขอบ (โดยเฉพาะเส้นผม), ดังนั้นคุณจะใช้เครื่องมือ despill เพื่อทำให้การปนเปื้อนเป็นกลาง. ไพรเมอร์ที่ดี ได้แก่ เอกสารของ Nuke, Mixing Light, และการสาธิต Fusion แบบลงมือปฏิบัติ.
สำหรับภาพเดี่ยวที่มีพื้นหลังรก, อัลกอริทึม แบบโต้ตอบ ต้องการคำใบ้จากผู้ใช้เล็กน้อย—เช่น, สี่เหลี่ยมผืนผ้าหลวมๆ หรือลายเส้นขยุกขยิก—และมาบรรจบกันเป็นหน้ากากที่คมชัด. วิธีการที่เป็นที่ยอมรับคือ GrabCut (บทในหนังสือ), ซึ่งเรียนรู้แบบจำลองสีสำหรับโฟร์กราวด์/พื้นหลัง และใช้การตัดกราฟซ้ำๆ เพื่อแยกพวกมัน. คุณจะเห็นแนวคิดที่คล้ายกันใน การเลือกโฟร์กราวด์ของ GIMP โดยใช้ SIOX (ปลั๊กอิน ImageJ).
การทำแมท แก้ปัญหาความโปร่งใสแบบเศษส่วนที่ขอบเขตที่บอบบาง (ผม, ขน, ควัน, แก้ว). การทำแมทแบบปิดคลาสสิก ใช้ trimap (แน่นอน-หน้า/แน่นอน-หลัง/ไม่ทราบ) และแก้ปัญหาระบบเชิงเส้นสำหรับอัลฟ่าที่มีความเที่ยงตรงของขอบสูง. การทำแมทภาพแบบลึกสมัยใหม่ ฝึกอบรมโครงข่ายประสาทเทียมบนชุดข้อมูล Adobe Composition-1K (เอกสาร MMEditing), และได้รับการประเมินด้วยเมตริกเช่น SAD, MSE, Gradient, และ Connectivity (คำอธิบายเกณฑ์มาตรฐาน).
งานแบ่งส่วนที่เกี่ยวข้องก็มีประโยชน์เช่นกัน: DeepLabv3+ ปรับปรุงขอบเขตด้วยตัวเข้ารหัส-ตัวถอดรหัสและคอนโวลูชัน atrous (PDF); Mask R-CNN ให้หน้ากากต่ออินสแตนซ์ (PDF); และ SAM (Segment Anything) เป็น โมเดลพื้นฐาน ที่สามารถแจ้งได้ ที่สร้างหน้ากากแบบ zero-shot บนภาพที่ไม่คุ้นเคย.
งานวิชาการรายงานข้อผิดพลาด SAD, MSE, Gradient, และ Connectivity บน Composition-1K. หากคุณกำลังเลือกโมเดล, ให้มองหาเมตริกเหล่านั้น (คำจำกัดความของเมตริก; ส่วนเมตริกของ Background Matting). สำหรับภาพบุคคล/วิดีโอ, MODNet และ Background Matting V2 แข็งแกร่ง; สำหรับภาพ “วัตถุเด่น” ทั่วไป, U2-Net เป็นพื้นฐานที่มั่นคง; สำหรับความโปร่งใสที่ยาก, FBA อาจสะอาดกว่า.
รูปแบบการบีบอัด DXT1 ซึ่งเป็นส่วนหนึ่งของตระกูล DirectX Texture (DirectXTex) เป็นก้าวกระโดดที่สำคัญในเทคโนโลยีการบีบอัดภาพที่ออกแบบมาโดยเฉพาะสำหรับกราฟิกคอมพิวเตอร์ เป็นเทคนิคการบีบอัดแบบสูญเสียที่สร้างสมดุลระหว่างคุณภาพของภาพกับความต้องการพื้นที่จัดเก็บ ทำให้เหมาะอย่างยิ่งสำหรับแอปพลิเคชัน 3 มิติแบบเรียลไทม์ เช่น เกม ซึ่งทั้งพื้นที่ดิสก์และแบนด์วิดท์เป็นสิ่งที่มีค่า ในแกนหลัก รูปแบบ DXT1 จะบีบอัดข้อมูลพื้นผิวให้มีขนาดเล็กลงกว่าขนาดเดิมโดยไม่ต้องใช้การคลายการบีบอัดแบบเรียลไทม์ จึงช่วยลดการใช้หน่วยความจำและเพิ่มประสิทธิภาพการทำงาน
DXT1 ทำงานบนบล็อกของพิกเซลมากกว่าพิกเซลแต่ละพิกเซลโดยเฉพาะ โดยจะประมวลผลบล็อกพิกเซลขนาด 4x4 และบีบอัดแต่ละบล็อกให้เหลือ 64 บิต วิธีการนี้คือการบีบอัดแบบแบ่งบล็อก ซึ่งเป็นสิ่งที่ทำให้ DXT1 สามารถลดปริมาณข้อมูลที่จำเป็นในการแสดงภาพได้อย่างมาก สาระสำคัญของการบีบอัดใน DXT1 อยู่ที่ความสามารถในการหาสมดุลในการแสดงสีภายในแต่ละบล็อก จึงรักษาไว้ซึ่งรายละเอียดให้ได้มากที่สุดเท่าที่จะเป็นไปได้ในขณะที่บรรลุอัตราการบีบอัดสูง
กระบวนการบีบอัดของ DXT1 สามารถแบ่งออกเป็นหลายขั้นตอน ขั้นแรกคือการระบุสองสีภายในบล็อกที่เป็นตัวแทนของช่วงสีโดยรวมของบล็อกมากที่สุด สีเ หล่านี้จะถูกเลือกตามความสามารถในการครอบคลุมความแปรผันของสีภายในบล็อก และจะถูกจัดเก็บเป็นสี RGB 16 บิตสองสี แม้ว่าความลึกของบิตจะต่ำกว่าข้อมูลภาพต้นฉบับ แต่ขั้นตอนนี้ก็ช่วยให้มั่นใจได้ว่าข้อมูลสีที่สำคัญที่สุดจะยังคงอยู่
หลังจากกำหนดสีหลักสองสีแล้ว DXT1 จะใช้สีเหล่านั้นเพื่อสร้างสีเพิ่มเติมอีกสองสี รวมเป็นสีทั้งหมดสี่สีที่จะแสดงทั้งบล็อก สีเพิ่มเติมเหล่านี้จะคำนวณผ่านการแทรกสอดเชิงเส้น ซึ่งเป็นกระบวนการที่ผสมสีหลักสองสีในสัดส่วนที่ต่างกัน โดยเฉพาะ สีที่สามจะถูกสร้างขึ้นโดยการผสมสีหลักสองสีอย่างเท่าๆ กัน ในขณะที่สีที่สี่จะเป็นการผสมที่เน้นสีแรกหรือสีดำล้วน ขึ้นอยู่กับความต้องการความโปร่งใสของพื้นผิว
เมื่อกำหนดสีทั้งสี่แล้ว ขั้นตอนต่อไปคือการแม็ปพิกเซลแต่ละพิกเซลในบล็อก 4x4 ต้นฉบับไปยังสีที่ใกล ้เคียงที่สุดในสีที่สร้างขึ้นทั้งสี่ การแม็ปนี้จะทำผ่านอัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุด ซึ่งจะคำนวณระยะห่างระหว่างสีพิกเซลต้นฉบับและสีตัวแทนทั้งสี่ และกำหนดพิกเซลให้กับการจับคู่ที่ใกล้ที่สุด กระบวนการนี้จะทำให้ปริภูมิสีต้นฉบับของบล็อกมีปริมาณเท่ากับสีที่แตกต่างกันสี่สี ซึ่งเป็นปัจจัยสำคัญในการบรรลุการบีบอัดของ DXT1
ขั้นตอนสุดท้ายในกระบวนการบีบอัด DXT1 คือการเข้ารหัสข้อมูลการแม็ปสีพร้อมกับสีต้นฉบับสองสีที่เลือกไว้สำหรับบล็อก สีต้นฉบับสองสีจะถูกจัดเก็บโดยตรงในข้อมูลบล็อกที่บีบอัดเป็นค่า 16 บิต ในขณะเดียวกัน การแม็ปของแต่ละพิกเซลไปยังหนึ่งในสี่สีจะถูกเข้ารหัสเป็นดัชนี 2 บิต โดยแต่ละดัชนีจะชี้ไปที่หนึ่งในสี่สี ดัชนีเหล่านี้จะถูกจัดเก็บรวมกันและครอบคลุมบิตที่เหลือของบล็อก 64 บิต บล็อกที่บีบอัดที่ได้ จึงมีทั้งข้อมูลสีและการแม็ปที่จำเป็นในการสร้างรูปลักษณ์ของบล็อกใหม่ในระหว่างการคลายการบีบอัด
การคลายการบีบอัดใน DXT1 ได้รับการออกแบบมาให้เป็นกระบวนการที่ตรงไปตรงมาและรวดเร็ว ทำให้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันแบบเรียลไทม์ ความเรียบง่ายของอัลกอริทึมการคลายการบีบอัดช่วยให้สามารถดำเนินการได้โดยฮาร์ดแวร์ในกราฟิกการ์ดสมัยใหม่ ซึ่งจะช่วยลดภาระบน CPU และเพิ่มประสิทธิภาพการทำงานของพื้นผิวที่บีบอัดด้วย DXT1 ในระหว่างการคลายการบีบอัด สีต้นฉบับสองสีจะถูกดึงมาจากข้อมูลบล็อกและใช้ร่วมกับดัชนี 2 บิตเพื่อสร้างสีของแต่ละพิกเซลในบล็อก วิธีการแทรกสอดเชิงเส้นจะถูกนำมาใช้เพื่อหาสีกลางหากจำเป็น
ข้อดีอย่างหนึ่งของ DXT1 คือการลดขนาดไฟล์ลงอย่างมาก ซึ่งอาจมากถึง 8:1 เมื่อเทียบกับพื้นผิว RGB 24 บิตที่ไม่บีบอัด การลดลงนี้ไม่เพ ียงแต่จะช่วยประหยัดพื้นที่ดิสก์เท่านั้น แต่ยังช่วยลดเวลาในการโหลดและเพิ่มศักยภาพในการเปลี่ยนแปลงพื้นผิวภายในงบประมาณหน่วยความจำที่กำหนด นอกจากนี้ ข้อดีด้านประสิทธิภาพของ DXT1 ไม่ได้จำกัดอยู่แค่การประหยัดพื้นที่จัดเก็บและแบนด์วิดท์เท่านั้น แต่ยังช่วยให้การแสดงผลเร็วขึ้นอีกด้วย โดยการลดปริมาณข้อมูลที่ต้องประมวลผลและถ่ายโอนไปยัง GPU ทำให้เป็นรูปแบบที่เหมาะสำหรับการเล่นเกมและแอปพลิเคชันที่ใช้กราฟิกอย่างหนัก
แม้จะมีข้อดี แต่ DXT1 ก็มีข้อจำกัด ข้อจำกัดที่เห็นได้ชัดที่สุดคือศักยภาพของสิ่งประดิษฐ์ที่มองเห็นได้ โดยเฉพาะในพื้นผิวที่มีคอนทราสต์ของสีสูงหรือรายละเอียดที่ซับซ้อน สิ่งประดิษฐ์เหล่านี้เกิดจากกระบวนการปริมาณและข้อจำกัดของสีสี่สีต่อบล็อก ซึ่งอาจไม่แสดงช่วงสีเต็มของภาพต้นฉบับได้อย่างแม่นยำ นอกจากนี้ ความจำเป็นในการเลือกสีตัวแทนสองสีสำหรับแต่ละบล็อกอาจนำไปสู่ปัญหาแถบสี ซึ่งการเปลี่ยนผ่านระหว่างสีจะกลายเป็นแบบฉับพลันและไม่เป็นธรรมชาติ
ยิ่งไปกว่านั้น การจัดการความโปร่งใสของรูปแบบ DXT1 ยังเพิ่มความซับซ้อนอีกชั้นหนึ่ง DXT1 รองรับความโปร่งใสของอัลฟา 1 บิต ซึ่งหมายความว่าพิกเซลสามารถโปร่งใสได้เต็มที่หรือทึบแสงได้เต็มที่ แนวทางแบบไบนารีนี้ใช้ในการจัดการความโปร่งใสโดยการเลือกหนึ่งในสีที่สร้างขึ้นเพื่อแสดงความโปร่งใส โดยปกติจะเป็นสีที่สี่หากเลือกสีสองสีแรกให้มีลำดับตัวเลขที่กลับกัน แม้ว่าวิธีนี้จะช่วยให้พื้นผิวมีความโปร่งใสในระดับหนึ่ง แต่ก็ค่อนข้างจำกัดและอาจทำให้เกิดขอบที่หยาบรอบๆ บริเวณที่โปร่งใส ทำให้ไม่เหมาะสำหรับเอฟเฟกต์ความโปร่งใสโดยละเอียด
นักพัฒนาที่ทำงานกับพื้นผิวที่บีบอัดด้วย DXT1 มักจะใช้เทคนิคต่างๆ เพื่อลดข้อจำกัดเหล่านี้ ตัวอย่างเช่น การออกแบบพื้นผิวอย่างระมัดระวังและการใช้การกระจายจุดสามารถช่วยลดการมองเห็นของสิ่งประดิษฐ์จากการบีบอัดและแถบสี นอกจากนี้ เมื่อจัดการกับความโปร่งใส นักพัฒนาอาจเลือกใช้แผนที่พื้นผิวแยกต่างหากสำหรับข้อมูลความโปร่งใส หรือเลือกใช้รูปแบบ DXT อื่นๆ ที่มีการจัดการความโปร่งใสที่ละเอียดอ่อนกว่า เช่น DXT3 หรือ DXT5 สำหรับพื้นผิวที่ความโปร่งใสคุณภาพสูงมีความสำคัญ
การนำ DXT1 มาใช้กันอย่างแพร่หลายและการรวมไว้ใน DirectX API เน้นให้เห็นถึงความสำคัญในด้านกราฟิกแบบเรียลไทม์ ความสามารถในการรักษาสมดุลระหว่างคุณภาพและประสิทธิภาพทำให้เป็นสิ่งสำคัญในอุตสาหกรรมเกม ซึ่งการใช้ทรัพยากรอย่างมีประสิทธิภาพมักเป็นสิ่งที่สำคัญ นอกเหนือจากเกม
ตัวแปลงนี้ทำงานอย่างสมบูรณ์ในเบราว์เซอร์ของคุณ เมื่อคุณเลือกไฟล์ ไฟล์จะถูกอ่านเข้าไปในหน่วยความจำและแปลงเป็นรูปแบบที่เลือก จากนั้นคุณสามารถดาวน์โหลดไฟล์ที่แปลงแล้วได้
การแปลงจะเริ่มขึ ้นทันที และไฟล์ส่วนใหญ่จะถูกแปลงภายในเวลาไม่ถึงหนึ่งวินาที ไฟล์ขนาดใหญ่อาจใช้เวลานานกว่านั้น
ไฟล์ของคุณจะไม่ถูกอัปโหลดไปยังเซิร์ฟเวอร์ของเรา ไฟล์เหล่านั้นจะถูกแปลงในเบราว์เซอร์ของคุณ จากนั้นไฟล์ที่แปลงแล้วจะถูกดาวน์โหลด เราไม่เคยเห็นไฟล์ของคุณ
เรารองรับการแปลงระหว่างรูปแบบภาพทั้งหมด รวมถึง JPEG, PNG, GIF, WebP, SVG, BMP, TIFF และอื่นๆ
ตัวแปลงนี้ฟรีโดยสมบูรณ์ และจะฟรีตลอดไป เนื่องจากทำงานในเบราว์เซอร์ของคุณ เราจึงไม่ต้องจ่ายค่าเซิร์ฟเวอร์ ดังนั้นเราจึงไม่เรียกเก็บเงินจากคุณ
ใช่! คุณ สามารถแปลงไฟล์ได้มากเท่าที่คุณต้องการในคราวเดียว เพียงเลือกหลายไฟล์เมื่อคุณเพิ่ม