การลบพื้นหลัง แยกวัตถุออกจากสภาพแวดล้อมเพื่อให้คุณสามารถวางไว้บน ความโปร่งใส, สลับฉาก, หรือประกอบเข้ากับการออกแบบใหม่. ภายใต้กระโปรงคุณกำลังประเมิน อัลฟ่าแมท—ความทึบต่อพิกเซลจาก 0 ถึง 1—แล้ว การประกอบอัลฟ่า โฟร์กราวด์ поверх สิ่งอื่น. นี่คือคณิตศาสตร์จาก Porter–Duff และสาเหตุของข้อผิดพลาดที่คุ้นเคยเช่น “ขอบ” และ อัลฟ่าตรงกับอัลฟ่าที่คูณไว้ล่วงหน้า. สำหรับคำแนะนำเชิงปฏิบัติเกี่ยวกับการคูณล่วงหน้าและสีเชิงเส้น, ดู บันทึก Win2D ของ Microsoft, Søren Sandmann, และ บทความของ Lomont เกี่ยวกับการผสมเชิงเส้น.
หากคุณสามารถควบคุมการจับภาพได้, ทาสีพื้นหลังเป็นสีทึบ (ส่วนใหญ่มักเป็นสีเขียว) และ คีย์ สีนั้นออกไป. มันรวดเร็ว, ผ่านการทดสอบการต่อสู้ในภาพยนตร์และการออกอากาศ, และเหมาะสำหรับวิดีโอ. ข้อแลกเปลี่ยนคือแสงและตู้เสื้อผ้า: แสงสีจะรั่วไหลไปยังขอบ (โดยเฉพาะเส้นผม), ดังนั้นคุณจะใช้เครื่องมือ despill เพื่อทำให้การปนเปื้อนเป็นกลาง. ไพรเมอร์ที่ดี ได้แก่ เอกสารของ Nuke, Mixing Light, และการสาธิต Fusion แบบลงมือปฏิบัติ.
สำหรับภาพเดี่ยวที่มีพื้นหลังรก, อัลกอริทึม แบบโต้ตอบ ต้องการคำใบ้จากผู้ใช้เล็กน้อย—เช่น, สี่เหลี่ยมผืนผ้าหลวมๆ หรือลายเส้นขยุกขยิก—และมาบรรจบกันเป็นหน้ากากที่คมชัด. วิธีการที่เป็นที่ยอมรับคือ GrabCut (บทในหนังสือ), ซึ่งเรียนรู้แบบจำลองสีสำหรับโฟร์กราวด์/พื้นหลัง และใช้การตัดกราฟซ้ำๆ เพื่อแยกพวกมัน. คุณจะเห็นแนวคิดที่คล้ายกันใน การเลือกโฟร์กราวด์ของ GIMP โดยใช้ SIOX (ปลั๊กอิน ImageJ).
การทำแมท แก้ปัญหาความโปร่งใสแบบเศษส่วนที่ขอบเขตที่บอบบาง (ผม, ขน, ควัน, แก้ว). การทำแมทแบบปิดคลาสสิก ใช้ trimap (แน่นอน- หน้า/แน่นอน-หลัง/ไม่ทราบ) และแก้ปัญหาระบบเชิงเส้นสำหรับอัลฟ่าที่มีความเที่ยงตรงของขอบสูง. การทำแมทภาพแบบลึกสมัยใหม่ ฝึกอบรมโครงข่ายประสาทเทียมบนชุดข้อมูล Adobe Composition-1K (เอกสาร MMEditing), และได้รับการประเมินด้วยเมตริกเช่น SAD, MSE, Gradient, และ Connectivity (คำอธิบายเกณฑ์มาตรฐาน).
งานแบ่งส่วนที่เกี่ยวข้องก็มีประโยชน์เช่นกัน: DeepLabv3+ ปรับปรุงขอบเขตด้วยตัวเข้ารหัส-ตัวถอดรหัสและคอนโวลูชัน atrous (PDF); Mask R-CNN ให้หน้ากากต่ออินสแตนซ์ (PDF); และ SAM (Segment Anything) เป็น โมเดลพื้นฐาน ที่สามารถแจ้งได้ ที่สร้างหน้ากากแบบ zero-shot บนภาพที่ไม่คุ้นเคย.
งานวิชาการรายงานข้อผิดพลาด SAD, MSE, Gradient, และ Connectivity บน Composition-1K. หากคุณกำลังเลือกโมเดล, ให้มองหาเมตริกเหล่านั้น (คำจำกัดความของเมตริก; ส่วนเมตริกของ Background Matting). สำหรับภาพบุคคล/วิดีโอ, MODNet และ Background Matting V2 แข็งแกร่ง; สำหรับภาพ “วัตถุเด่น” ทั่วไป, U2-Net เป็นพื้นฐานที่มั่นคง; สำหรับความโปร่งใสที่ยาก, FBA อาจสะอาดกว่า.
รูปแบบภาพ JPS ซึ่งย่อมาจาก JPEG Stereo เป็นรูปแบบไฟล์ที่ใช้ในการจัดเก็บภาพถ่ายแบบสเตอริโอที่ถ่ายโดยกล้องดิจิทัลหรือสร้างโดยซอฟต์แวร์เรนเดอร์ 3 มิติ โดยหลักแล้วเป็นการจัดเรียงภาพ JPEG สองภาพแบบเคียงข้างกันภายในไฟล์เดียว ซึ่งเมื่อดูผ่านซอฟต์แวร์หรือฮาร์ดแวร์ที่เหมาะสม จะให้เอฟเฟกต์ 3 มิติ รูปแบบนี้มีประโยชน์อย่างยิ่งสำหรับการสร้างภาพลวงต าของความลึกในภาพ ซึ่งช่วยเพิ่มประสบการณ์การรับชมสำหรับผู้ใช้ที่มีระบบแสดงผลที่เข้ากันได้หรือแว่นตา 3 มิติ
รูปแบบ JPS ใช้ประโยชน์จากเทคนิคการบีบอัด JPEG (Joint Photographic Experts Group) ที่ได้รับการยอมรับอย่างดีในการจัดเก็บภาพทั้งสองภาพ JPEG เป็นวิธีการบีบอัดแบบสูญเสีย ซึ่งหมายความว่าจะลดขนาดไฟล์โดยการละทิ้งข้อมูลที่ไม่สำคัญออกไปอย่างมีการเลือกสรร โดยมักจะไม่ทำให้คุณภาพของภาพลดลงอย่างเห็นได้ชัดต่อสายตาของมนุษย์ สิ่งนี้ทำให้ไฟล์ JPS มีขนาดค่อนข้างเล็กและจัดการได้ง่าย แม้ว่าจะมีภาพสองภาพแทนที่จะเป็นภาพเดียว
ไฟล์ JPS เป็นไฟล์ JPEG ที่มีโครงสร้างเฉพาะ โดยมีภาพ JPEG ที่บีบอัดสองภาพเคียงข้างกันภายในเฟรมเดียว ภาพเหล่านี้เรียกว่าภาพตาซ้ายและภาพตาขวา และแสดงมุมมองที่แตกต่างกันเล็กน้อยของฉากเดียวกัน โดยเลียนแบบความแตกต่างเล็กน้อยระหว่าง สิ่งที่ตาแต่ละข้างของเราเห็น ความแตกต่างนี้คือสิ่งที่ช่วยให้รับรู้ความลึกเมื่อดูภาพอย่างถูกต้อง
ความละเอียดมาตรฐานสำหรับภาพ JPS โดยทั่วไปจะกว้างกว่าภาพ JPEG มาตรฐานสองเท่าเพื่อรองรับทั้งภาพด้านซ้ายและด้านขวา ตัวอย่างเช่น หากภาพ JPEG มาตรฐานมีความละเอียด 1920x1080 พิกเซล ภาพ JPS จะมีความละเอียด 3840x1080 พิกเซล โดยแต่ละภาพเคียงข้างกันจะใช้ความกว้างครึ่งหนึ่งของความกว้างทั้งหมด อย่างไรก็ตาม ความละเอียดอาจแตกต่างกันไปขึ้นอยู่กับแหล่งที่มาของภาพและการใช้งานที่ต้องการ
ในการดูภาพ JPS แบบ 3 มิติ ผู้ดูจะต้องใช้เครื่องแสดงผลหรือซอฟต์แวร์ที่เข้ากันได้ซึ่งสามารถตีความภาพเคียงข้างกันและนำเสนอให้กับแต่ละตาแยกกัน สิ่งนี้สามารถทำได้ผ่านวิธีต่างๆ เช่น 3D แบบแอนากลิฟ ซึ่งภาพจะถูกกรองตามสีและดูด้วยแว่นตาสี 3D แบบโพลาไรซ์ ซึ่งภาพจะถูกฉายผ่านตัวกรองโพลาไรซ์และดูด้วยแว่นตาโพลาไรซ์ หรือ 3D แบบชัตเตอร์แอคทีฟ ซึ่งภาพจะแสดงสลับกันและซิงโครไนซ์กับแว่นตาชัตเตอร์ที่เปิดและปิดอย่างรวดเร็วเพื่อแสดงภาพที่ถูกต้องให้กับแต่ละตา
โครงสร้างไฟล์ของภาพ JPS นั้นคล้ายกับไฟล์ JPEG มาตรฐาน โดยมีส่วนหัว ซึ่งรวมถึงเครื่องหมาย SOI (Start of Image) ตามด้วยชุดของเซ็กเมนต์ที่มีข้อมูลเมตาต่างๆ และข้อมูลภาพเอง เซ็กเมนต์ต่างๆ รวมถึงเครื่องหมาย APP (Application) ซึ่งอาจมีข้อมูลต่างๆ เช่น ข้อมูลเมตา Exif และเซ็กเมนต์ DQT (Define Quantization Table) ซึ่งกำหนดตารางการหาปริมาณที่ใช้ในการบีบอัดข้อมูลภาพ
หนึ่งในเซ็กเมนต์หลักในไฟล์ JPS คือเซ็กเมนต์ JFIF (JPEG File Interchange Format) ซึ่งระบุว่าไฟล์เป็นไปตามมาตรฐาน JFIF เซ็กเมนต์นี้มีความสำคัญเพื่อให้แน่ใจว่าเข้ากันได้กับซอฟต์แวร์และฮาร์ดแวร์ที่หลากหลาย นอกจากนี้ยังมีข้อมูลต่างๆ เช่น อัตราส่วนภา พและความละเอียดของภาพขนาดย่อ ซึ่งสามารถใช้สำหรับการแสดงตัวอย่างอย่างรวดเร็ว
ข้อมูลภาพจริงในไฟล์ JPS จะถูกเก็บไว้ในเซ็กเมนต์ SOS (Start of Scan) ซึ่งตามหลังส่วนหัวและส่วนข้อมูลเมตา เซ็กเมนต์นี้มีข้อมูลภาพที่บีบอัดสำหรับทั้งภาพด้านซ้ายและด้านขวา ข้อมูลจะถูกเข้ารหัสโดยใช้อัลกอริธึมการบีบอัด JPEG ซึ่งเกี่ยวข้องกับขั้นตอนต่างๆ รวมถึงการแปลงพื้นที่สี การสุ่มตัวอย่าง การแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) การหาปริมาณ และการเข้ารหัสเอนโทรปี
การแปลงพื้นที่สีคือกระบวนการแปลงข้อมูลภาพจากพื้นที่สี RGB ซึ่งใช้กันทั่วไปในกล้องดิจิทัลและจอคอมพิวเตอร์ ไปเป็นพื้นที่สี YCbCr ซึ่งใช้ในการบีบอัด JPEG การแปลงนี้จะแยกภาพออกเป็นส่วนประกอบความสว่าง (Y) ซึ่งแสดงระดับความสว่าง และส่วนประกอบความอิ่มตัวของสีสองส่วน (Cb และ Cr) ซึ่งแสดงข้อมูลสี สิ่งนี้มีประ โยชน์สำหรับการบีบอัดเนื่องจากดวงตาของมนุษย์มีความไวต่อการเปลี่ยนแปลงความสว่างมากกว่าสี ซึ่งช่วยให้สามารถบีบอัดส่วนประกอบความอิ่มตัวของสีได้มากขึ้นโดยไม่ส่งผลกระทบต่อคุณภาพของภาพที่รับรู้ได้อย่างมีนัยสำคัญ
การสุ่มตัวอย่างคือกระบวนการที่ใช้ประโยชน์จากความไวที่ต่ำกว่าของดวงตาของมนุษย์ต่อรายละเอียดสีโดยลดความละเอียดของส่วนประกอบความอิ่มตัวของสีเมื่อเทียบกับส่วนประกอบความสว่าง อัตราส่วนการสุ่มตัวอย่างทั่วไป ได้แก่ 4:4:4 (ไม่สุ่มตัวอย่าง) 4:2:2 (ลดความละเอียดแนวนอนของความอิ่มตัวของสีลงครึ่งหนึ่ง) และ 4:2:0 (ลดความละเอียดทั้งแนวนอนและแนวตั้งของความอิ่มตัวของสีลงครึ่งหนึ่ง) การเลือกอัตราส่วนการสุ่มตัวอย่างสามารถส่งผลต่อความสมดุลระหว่างคุณภาพของภาพและขนาดไฟล์
การแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) จะถูกนำไปใช้กับบล็อกเล็กๆ ของภาพ (โดยทั่วไปคือ 8x8 พิกเซล) เพื่อแปลงข้อมูลโดเมนเชิงพื้นที่เป็นโดเมนความถี่ ขั้นตอนนี้มีความสำคัญสำหรับการบีบอัด JPEG เนื่องจากช่วยให้สามารถแยกแยะรายละเอียดของภาพออกเป็นส่วนประกอบที่มีความสำคัญต่างกัน โดยส่วนประกอบความถี่ที่สูงกว่ามักจะรับรู้ได้น้อยกว่าสำหรับดวงตาของมนุษย์ จากนั้นส่วนประกอบเหล่านี้สามารถหาปริมาณหรือลดความแม่นยำเพื่อให้ได้การบีบอัด
การหาปริมาณคือกระบวนการแมปช่วงของค่าไปยังค่าควอนตัมเดียว ซึ่งจะลดความแม่นยำของค่าสัมประสิทธิ์ DCT อย่างมีประสิทธิภาพ นี่คือจุดที่ลักษณะการสูญเสียของการบีบอัด JPEG เข้ามาเกี่ยวข้อง เนื่องจากข้อมูลภาพบางส่วนจะถูกละทิ้ง ระดับการหาปริมาณจะถูกกำหนดโดยตารางการหาปริมาณที่ระบุในเซ็กเมนต์ DQT และสามารถปรับเพื่อให้สมดุลระหว่างคุณภาพของภาพกับขนาดไ ฟล์
ขั้นตอนสุดท้ายในกระบวนการบีบอัด JPEG คือการเข้ารหัสเอนโทรปี ซึ่งเป็นรูปแบบหนึ่งของการบีบอัดแบบไม่สูญเสีย วิธีที่ใช้กันทั่วไปที่สุดใน JPEG คือการเข้ารหัส Huffman ซึ่งกำหนดรหัสที่สั้นกว่าให้กับค่าที่พบได้บ่อยกว่าและรหัสที่ยาวกว่าให้กับค่าที่พบได้น้อยกว่า สิ่งนี้จะลดขนาดโดยรวมของข้อมูลภาพโดยไม่สูญเสียข้อมูลเพิ่มเติม
นอกเหนือจากเทคนิคการบีบอัด JPEG มาตรฐานแล้ว รูปแบบ JPS อาจมีข้อมูลเมตาเฉพาะที่เกี่ยวข้องกับลักษณะสเตอริโอของภาพ ข้อมูลเมตานี้อาจรวมถึงข้อมูลเกี่ยวกับการตั้งค่าพารัลแลกซ์ จุดบรรจบ และข้อมูลอื่นๆ ที่อาจจำเป็นสำหรับการแสดงเอฟเฟกต์ 3 มิติอย่างถูกต้อง ข้อมูลเมตานี้โดยทั่วไปจะถูกเก็บไว้ในเซ็กเมนต์ APP ของไฟล์
รูปแบบ JPS ได้รับการสนับสนุนจากแอปพลิเคชันซอฟต์แวร์และอุปกรณ์ต่างๆ รวมถึงโทรทัศน์ 3 มิติ ชุดหูฟัง VR และเครื่องดูภาพถ่ายเฉพาะ อย่างไรก็ตาม ไม่ได้รับการสนับสนุนอย่างกว้างขวางเท่ากับรูปแบบ JPEG มาตรฐาน ดังนั้นผู้ใช้จึงอาจต้องใช้ซอฟต์แวร์เฉพาะหรือแปลงไฟล์ JPS เป็นรูปแบบอื่นเพื่อให้เข้ากัน
ตัวแปลงนี้ทำงานอย ่างสมบูรณ์ในเบราว์เซอร์ของคุณ เมื่อคุณเลือกไฟล์ ไฟล์จะถูกอ่านเข้าไปในหน่วยความจำและแปลงเป็นรูปแบบที่เลือก จากนั้นคุณสามารถดาวน์โหลดไฟล์ที่แปลงแล้วได้
การแปลงจะเริ่มขึ้นทันที และไฟล์ส่วนใหญ่จะถูกแปลงภายในเวลาไม่ถึงหนึ่งวินาที ไฟล์ขนาดใหญ่อาจใช้เวลานานกว่านั้น
ไฟล์ของคุณจะไม่ถูกอัปโหลดไปยังเซิร์ฟเวอร์ของเรา ไฟล์เหล่านั้นจะถูกแปลงในเบราว์เซอร์ของคุณ จากนั้นไฟล์ที่แปลงแล้วจะถูกดาวน์โหลด เราไม่เคยเห็นไฟล์ของคุณ
เรารองรับการแปลงระหว่างรูปแบบภาพทั้งหมด รวมถึง JPEG, PNG, GIF, WebP, SVG, BMP, TIFF และอื่นๆ
ตัวแปลงนี้ฟรีโดยสมบูรณ์ และจะฟรีตลอดไป เนื่องจากทำงานในเบราว์เซอร์ของคุณ เราจึงไม่ต้องจ่ายค่าเซิร์ฟเวอร์ ดังนั้นเราจึงไม่เรียกเก็บเงินจากคุณ
ใช่! คุณสามารถแปลงไฟล์ได้มากเท่าที่คุณต้องการในคราวเดียว เพียงเลือกหลายไฟล์เมื่อคุณเพิ่ม