การลบพื้นหลัง แยกวัตถุออกจากสภาพแวดล้อมเพื่อให้คุณสามารถวางไว้บน ความโปร่งใส, สลับฉาก, หรือประกอบเข้ากับการออกแบบใหม่. ภายใต้กระโปรงคุณกำลังประเมิน อัลฟ่าแมท—ความทึบต่อพิกเซลจาก 0 ถึง 1—แล้ว การประกอบอัลฟ่า โฟร์กราวด์ поверх สิ่งอื่น. นี่คือคณิตศาสตร์จาก Porter–Duff และสาเหตุของข้อผิดพลาดที่คุ้นเคยเช่น “ขอบ” และ อัลฟ่าตรงกับอัลฟ่าที่คูณไว้ล่วงหน้า. สำหรับคำแนะนำเชิงปฏิบัติเกี่ยวกับการคูณล่วงหน้าและสีเชิงเส้น, ดู บันทึก Win2D ของ Microsoft, Søren Sandmann, และ บทความของ Lomont เกี่ยวกับการผสมเชิงเส้น.
หากคุณสามารถควบคุมการจับภาพได้, ทาสีพื้นหลังเป็นสีทึบ (ส่วนใหญ่มักเป็นสีเขียว) และ คีย์ สีนั้นออกไป. มันรวดเร็ว, ผ่านการทดสอบการต่อสู้ในภาพยนตร์และการออกอากาศ, และเหมาะสำหรับวิดีโอ. ข้อแลกเปลี่ยนคือแสงและตู้เสื้อผ้า: แสงสีจะรั่วไหลไปยังขอบ (โดยเฉพาะเส้นผม), ดังนั้นคุณจะใช้เครื่องมือ despill เพื่อทำให้การปนเปื้อนเป็นกลาง. ไพรเมอร์ที่ดี ได้แก่ เอกสารของ Nuke, Mixing Light, และการสาธิต Fusion แบบลงมือปฏิบัติ.
สำหรับภาพเดี่ยวที่มีพื้นหลังรก, อัลกอริทึม แบบโต้ตอบ ต้องการคำใบ้จากผู้ใช้เล็กน้อย—เช่น, สี่เหลี่ยมผืนผ้าหลวมๆ หรือลายเส้นขยุกขยิก—และมาบรรจบกันเป็นหน้ากากที่คมชัด. วิธีการที่เป็นที่ยอมรับคือ GrabCut (บทในหนังสือ), ซึ่งเรียนรู้แบบจำลองสีสำหรับโฟร์กราวด์/พื้นหลัง และใช้การตัดกราฟซ้ำๆ เพื่อแยกพวกมัน. คุณจะเห็นแนวคิดที่คล้ายกันใน การเลือกโฟร์กราวด์ของ GIMP โดยใช้ SIOX (ปลั๊กอิน ImageJ).
การทำแมท แก้ปัญหาความโปร่งใสแบบเศษส่วนที่ขอบเขตที่บอบบาง (ผม, ขน, ควัน, แก้ว). การทำแมทแบบปิดคลาสสิก ใช้ trimap (แน่นอน- หน้า/แน่นอน-หลัง/ไม่ทราบ) และแก้ปัญหาระบบเชิงเส้นสำหรับอัลฟ่าที่มีความเที่ยงตรงของขอบสูง. การทำแมทภาพแบบลึกสมัยใหม่ ฝึกอบรมโครงข่ายประสาทเทียมบนชุดข้อมูล Adobe Composition-1K (เอกสาร MMEditing), และได้รับการประเมินด้วยเมตริกเช่น SAD, MSE, Gradient, และ Connectivity (คำอธิบายเกณฑ์มาตรฐาน).
งานแบ่งส่วนที่เกี่ยวข้องก็มีประโยชน์เช่นกัน: DeepLabv3+ ปรับปรุงขอบเขตด้วยตัวเข้ารหัส-ตัวถอดรหัสและคอนโวลูชัน atrous (PDF); Mask R-CNN ให้หน้ากากต่ออินสแตนซ์ (PDF); และ SAM (Segment Anything) เป็น โมเดลพื้นฐาน ที่สามารถแจ้งได้ ที่สร้างหน้ากากแบบ zero-shot บนภาพที่ไม่คุ้นเคย.
งานวิชาการรายงานข้อผิดพลาด SAD, MSE, Gradient, และ Connectivity บน Composition-1K. หากคุณกำลังเลือกโมเดล, ให้มองหาเมตริกเหล่านั้น (คำจำกัดความของเมตริก; ส่วนเมตริกของ Background Matting). สำหรับภาพบุคคล/วิดีโอ, MODNet และ Background Matting V2 แข็งแกร่ง; สำหรับภาพ “วัตถุเด่น” ทั่วไป, U2-Net เป็นพื้นฐานที่มั่นคง; สำหรับความโปร่งใสที่ยาก, FBA อาจสะอาดกว่า.
รูปแบบภาพ RGB ย่อมาจาก Red, Green และ Blue เป็นรากฐานของการถ่ายภาพดิจิทัล จับภาพและแสดงภาพในแบบที่ใกล้เคียงกับการรับรู้ภาพของมนุษย์มากที่สุด โดยการรวมสีหลักทั้งสามนี้ในความเข้มข้นต่างๆ จึงสามารถสร้างสีสันได้หลากหลาย ความสำคัญของรูปแบบนี้คือการนำไปใช้กันอย่างแพร่หลายในอุปกรณ์และแพลตฟอร์มต่างๆ ตั้งแต่กล้องและจอภาพไปจนถึงสมาร์ทโฟนและโทรทัศน์ ซึ่งเป็นเสมือนกระดูกสันหลังของการถ่ายภาพสีดิจิทัล
โดยหลักแล้ว รูปแบบ RGB สร้างขึ้นบนพื้นฐานของโมเดลสีแบบเติมแสง โมเดลนี้ทำงานบนหลักการที่ว่าสามารถผสมสีอ่อนเข้าด้วยกันเพื่อสร้างสีอื่นๆ ได้อีกมากมาย โดยใช้สีแดง เขียว และน้ำเงินเป็นสีหลัก เมื่อรวมกันที่ความเข้มข้นสูงสุด จะได้แสงสีขาว ในขณะที่การไม่มีแสงจะได้สีดำ โมเดลนี้ตรงกันข้ามกับโมเดลสีแบบลบ เช่น CMYK (ฟ้า ม่วง เหลือง และดำ) ที่ใช้ในการพิมพ์สี ซึ่งสีจะลบออกจากสีขาว (สีของกระดาษ)
ในทางปฏิบัติ ภาพ RGB สร้างขึ้นจากพิกเซลหลายล้านพิกเซล ซึ่งแต่ละพิกเซลทำหน้าที่เป็นองค์ประกอบที่เล็กที่สุดของภาพ แต่ละพิกเซลประกอบด้วยสามส่วน (ช่องสัญญาณ) ที่แสดงความเข้มข้นของแสงสีแดง เขียว และน้ำเงินตามลำดับ ความเข้มข้นของแต่ละสีมักจะวัดโดยใช้มาตราส่วน 8 บิต ตั้งแต่ 0 ถึง 255 โดย 0 หมายถึงไม่มีความเข้มข้น และ 255 หมายถึงความสว่างสูงสุด ดังนั้น มาตราส่วนนี้จึงรองรับการผสมสีได้มากกว่า 16 ล้านสี (256^3) ซึ่งทำให้สามารถสร้างสีได้หลากหลาย
การสร้างและการจัดการภาพ RGB เกี่ยวข้องกับการพิจารณาทางเทคนิคและกระบวนการต่างๆ ตัวอย่างเช่น กล้องดิจิทัลจะแปลงแสงที่จับภาพเป็นค่า RGB โดยใช้ชุดตัวกรองบนเซ็นเซอร์ ชุดตัวกรองนี้ ซึ่งมักจะเป็นตัวกรอง Bayer จะอนุญาตให้แสงสีแดง เขียว หรือน้ำเงินผ่านไปยังพิกเซลเซ็นเซอร์แต่ละพิกเซล จากนั้นซอฟต์แวร์ของกล้องจะประมวลผลข้อมูลดิบนี้ โดยการแทรกค่าเพื่อสร้างภาพสีเต็มรูปแบบ ในทำนองเดียวกัน เมื่อแสดงภาพ RGB บนหน้าจอ สีของแต่ละพิกเซลจะถูกสร้างขึ้นโดยการปรับความเข้มข้นของส่วนประกอบสีแดง เขียว และน้ำเงินของแสงไฟด้านหลังหรือไดโอดเปล่งแสง (LED) แต่ละตัวในจอแสดงผลสมัยใหม่
การเข้ารหัสและการจัดเก็บภาพ RGB เป็นอีกแง่มุมทางเทคนิคที่สำคัญ แม้ว่าหลักการพื้นฐานจะเกี่ยวข้องกับการจัดเก็บค่าสีทั้งสามสำหรับแต่ละพิกเซล แต่การใช้งานจริงอาจแตกต่างกันอย่างมาก รูปแบบไฟล์ต่างๆ เช่น JPEG, PNG และ GIF แต่ละรูปแบบมีลักษณะเฉพาะในการจัดการข้อมูล RGB โดยเฉพาะอย่างยิ่งในส่วนที่เกี่ยวกับการบีบอัด ตัวอย่างเช่น JPEG ใช้เทคนิคการบีบอัดแบบสูญเสียข้อมูลซึ่งจะลดขนาดไฟล์โดยการลบข้อมูลภาพบางส่วน ซึ่งอาจส่งผลต่อคุณภาพของภาพ PNG มีการบีบอัดแบบไม่สูญเสียข้อมูล ซึ่งรักษาคุณภาพของภาพไว้ได้โดยแลกกับขนาดไฟล์ที่ใหญ่กว่า GIF แม้ว่าจะใช้การบีบอัดแบบไม่สูญเสียข้อมูล แต่ก็จำกัดไว้ที่ 256 สี ทำให้ไม่เหมาะสำหรับภาพถ่ายสีเต็มรูปแบบ แต่เหมาะสำหรับกราฟิกที่ง่ายกว่า
นอกเหนือจากพื้นฐานของการจับภาพและการแสดงสีแล้ว รูปแบบ RGB ยังมีบทบาทสำคัญในแ ง่มุมที่ซับซ้อนยิ่งขึ้นของการถ่ายภาพดิจิทัล เช่น การจัดการสีและการแก้ไขแกมมา การจัดการสีช่วยให้มั่นใจได้ว่าสีจะสอดคล้องกันในอุปกรณ์และสภาพการรับชมที่แตกต่างกัน ซึ่งเกี่ยวข้องกับโปรไฟล์สี ซึ่งอธิบายว่าควรตีความสีอย่างไร การแก้ไขแกมมาจะปรับความสว่างของภาพ โดยชดเชยกับวิธีที่ดวงตาของเรารับรู้แสงที่ไม่เป็นเชิงเส้นและการตอบสนองที่ไม่เป็นเชิงเส้นของอุปกรณ์แสดงผล ทั้งสองอย่างนี้มีความจำเป็นสำหรับการสร้างภาพสีที่แม่นยำและสอดคล้องกัน
แม้จะมีการใช้กันอย่างแพร่หลายและมีประสิทธิภาพ แต่รูปแบบ RGB ก็มีข้อจำกัดอยู่ หนึ่งในความท้าทายที่สำคัญคือความแตกต่างในวิธีที่อุปกรณ์ต่างๆ ตีความและแสดงค่า RGB ซึ่งนำไปสู่ความแตกต่างในการสร้างสี ปัญหานี้เกิดจากความแตกต่างในพื้นที่สี หรือช่วงของสีที่อุปกรณ์สามารถสร้างได ้ พื้นที่สี sRGB เป็นมาตรฐานที่พบมากที่สุดสำหรับอุปกรณ์เว็บและอุปกรณ์สำหรับผู้บริโภค ซึ่งออกแบบมาเพื่อให้มั่นใจในระดับความสอดคล้องกัน อย่างไรก็ตาม อุปกรณ์ระดับมืออาชีพอาจใช้ Adobe RGB หรือ ProPhoto RGB ซึ่งให้ช่วงสีที่กว้างกว่าโดยแลกกับความเข้ากันได้
สำหรับการประมวลผลภาพขั้นสูงและการใช้งานทางวิทยาศาสตร์ที่ความแม่นยำเป็นสิ่งสำคัญ รูปแบบต่างๆ ของ RGB เช่น scRGB มีช่วงสีที่กว้างขึ้นและความแม่นยำที่สูงขึ้นโดยใช้ความลึกของบิตที่กว้างขึ้นและรวมค่าลบ รูปแบบเหล่านี้ได้รับการออกแบบมาเพื่อเอาชนะข้อจำกัดบางประการของ RGB โดยให้การแสดงสีที่กว้างขึ้นและแม่นยำยิ่งขึ้น แต่ต้องใช้การสนับสนุนซอฟต์แวร์และความสามารถของฮาร์ดแวร์ที่ซับซ้อนยิ่งขึ้น
อีกแง่มุมหนึ่งที่ต้องพิจารณาในการใช้รูปแบบ RGB คือบทบาทในการพัฒนาอัลกอริทึมสำหรับการจด จำภาพและคอมพิวเตอร์วิชัน ความสามารถในการวิเคราะห์และจัดการภาพในระดับพิกเซล แยกแยะสีและรูปร่าง เป็นพื้นฐานของแอปพลิเคชันมากมาย ตั้งแต่ยานพาหนะไร้คนขับไปจนถึงเทคโนโลยีการจดจำใบหน้า ความเรียบง่ายและความเป็นสากลของรูปแบบ RGB ช่วยให้สามารถพัฒนาเทคโนโลยีเหล่านี้ได้ โดยให้กรอบการทำงานที่สอดคล้องกันสำหรับข้อมูลภาพ
รูปแบบ RGB ยังเชื่อมโยงกับเทคโนโลยีใหม่ๆ เช่น การถ่ายภาพ High Dynamic Range (HDR) ซึ่งมีจุดมุ่งหมายเพื่อเพิ่มช่วงความสว่างในภาพ ซึ่งส่งผลให้ได้ภาพที่เลียนแบบช่วงความเข้มของแสงที่กว้างซึ่งดวงตาของมนุษย์สามารถรับรู้ได้อย่างใกล้ชิดยิ่งขึ้น เทคนิค HDR มักเกี่ยวข้องกับการทำงานกับค่า RGB ในลักษณะที่ขยายออกไปนอกเหนือจากข้อจำกัดแบบเดิม 8 บิตต่อช่องสัญญาณ โดยใช้บิตต่อช่องสัญญาณมากขึ้นเพื่อจับรายละเอียดที่มากขึ้นในทั้งเ งาและไฮไลต์
ยิ่งไปกว่านั้น หลักการพื้นฐานของรูปแบบ RGB ไม่ได้จำกัดอยู่แค่ภาพนิ่ง แต่ยังขยายไปถึงเทคโนโลยีวิดีโอด้วย การแสดงภาพยนตร์ในรูปแบบดิจิทัลอาศัยแนวคิดที่คล้ายคลึงกัน โดยตัวแปลงสัญญาณวิดีโอจะเข้ารหัสและถอดรหัสข้อมูล RGB (หรือข้อมูลในรูปแบบที่ได้มาจาก RGB เช่น YUV) เมื่อเวลาผ่านไป สิ่งนี้มีความหมายอย่างมากต่อสื่อสตรีมมิง การออกอากาศแบบดิจิทัล และการสร้างเนื้อหา ซึ่งการจัดการข้อมูล RGB อย่างมีประสิทธิภาพสามารถส่งผลต่อคุณภาพและความต้องการแบนด์วิดท์ได้อย่างมาก
เมื่อพิจารณาถึงผลกระทบต่อสิ่งแวดล้อม การใช้เครื่องใช้ที่ใช้ RGB อย่างแพร่หลายก่อให้เกิดความกังวลเกี่ยวกับการใช้พลังงาน โดยเฉพาะอย่างยิ่งจอแสดงผลเป็นหนึ่งในส่วนประกอบที่ใช้พลังงานมากที่สุดของอุปกรณ์อิเล็กทรอนิกส์ แรงผลักดันในการเพิ่มความละเอี ยดและคุณภาพของภาพนำไปสู่ความต้องการในการคำนวณและการใช้พลังงานที่เพิ่มขึ้น สิ่งนี้ได้กระตุ้นให้มีการวิจัยเกี่ยวกับวิธีการสร้างและแสดงภาพ RGB ที่ประหยัดพลังงานมากขึ้น รวมถึงความก้าวหน้าในเทคโนโลยี LED และวิธีการลดปริมาณข้อมูลที่ประมวลผลและส่ง
ตัวแปลงนี้ทำงานอย่างสมบูรณ์ในเบราว์เซอร์ของคุณ เมื่อคุณเลือกไฟล์ ไฟล์จะถูกอ่านเข้าไปในหน่วยความจำและแปลงเป็นรูปแบบที่เลือก จากนั้นคุณสามารถดาวน์โหลดไฟล์ที่แปลงแล้วได้
การแปลงจะเริ่มขึ้นทันที และไฟล์ส่วนใหญ่จะถูกแปลงภายในเวลาไม่ถึงหนึ่งวินาที ไฟล์ขนาดใหญ่อาจใช้เวลานานกว่านั้น
ไฟล์ของคุณจะไม่ถูกอัปโหลดไปยังเซิร์ฟเวอร์ของเรา ไฟล์เหล่านั้นจะถูกแปลงในเบราว์เซอร์ของคุณ จากนั้นไฟล์ที่แปลงแล้วจะถูกดาวน์โหลด เราไม่เคยเห็นไฟล์ของคุณ
เรารองรับการแปลงระหว่างรูปแบบภาพทั้งหมด รวมถึง JPEG, PNG, GIF, WebP, SVG, BMP, TIFF และอื่นๆ
ตัวแปลงนี้ฟรีโดยสมบูรณ์ และจะฟรีตลอดไป เนื่องจากทำงานในเบราว์เซอร์ของคุณ เราจึงไม่ต้องจ่ายค่าเซิร์ฟเวอร์ ดังนั้นเราจึงไม่เรียกเก็บเงินจากคุณ
ใช่! คุณสามารถแปลงไฟล์ได้มากเท่าที่คุณต้องการในคราวเดียว เพียงเลือกหลายไฟล์เมื่อคุณเพิ่ม