การลบพื้นหลัง แยกวัตถุออกจากสภาพแวดล้อมเพื่อให้คุณสามารถวางไว้บน ความโปร่งใส, สลับฉาก, หรือประกอบเข้ากับการออกแบบใหม่. ภายใต้กระโปรงคุณกำลังประเมิน อัลฟ่าแมท—ความทึบต่อพิกเซลจาก 0 ถึง 1—แล้ว การประกอบอัลฟ่า โฟร์กราวด์ поверх สิ่งอื่น. นี่คือคณิตศาสตร์จาก Porter–Duff และสาเหตุของข้อผิดพลาดที่คุ้นเคยเช่น “ขอบ” และ อัลฟ่าตรงกับอัลฟ่าที่คูณไว้ล่วงหน้า. สำหรับคำแนะนำเชิงปฏิบัติเกี่ยวกับการคูณล่วงหน้าและสีเชิงเส้น, ดู บันทึก Win2D ของ Microsoft, Søren Sandmann, และ บทความของ Lomont เกี่ยวกับการผสมเชิงเส้น.
หากคุณสามารถควบคุมการจับภาพได้, ทาสีพื้นหลังเป็นสีทึบ (ส่วนใหญ่มักเป็นสีเขียว) และ คีย์ สีนั้นออกไป. มันรวดเร็ว, ผ่านการทดสอบการต่อสู้ในภาพยนตร์และการออกอากาศ, และเหมาะสำหรับวิดีโอ. ข้อแลกเปลี่ยนคือแสงและตู้เสื้อผ้า: แสงสีจะรั่วไหลไปยังขอบ (โดยเฉพาะเส้นผม), ดังนั้นคุณจะใช้เครื่องมือ despill เพื่อทำให้การปนเปื้อนเป็นกลาง. ไพรเมอร์ที่ดี ได้แก่ เอกสารของ Nuke, Mixing Light, และการสาธิต Fusion แบบลงมือปฏิบัติ.
สำหรับภาพเดี่ยวที่มีพื้นหลังรก, อัลกอริทึม แบบโต้ตอบ ต้องการคำใบ้จากผู้ใช้เล็กน้อย—เช่น, สี่เหลี่ยมผืนผ้าหลวมๆ หรือลายเส้นขยุกขยิก—และมาบรรจบกันเป็นหน้ากากที่คมชัด. วิธีการที่เป็นที่ยอมรับคือ GrabCut (บทในหนังสือ), ซึ่งเรียนรู้แบบจำลองสีสำหรับโฟร์กราวด์/พื้นหลัง และใช้การตัดกราฟซ้ำๆ เพื่อแยกพวกมัน. คุณจะเห็นแนวคิดที่คล้ายกันใน การเลือกโฟร์กราวด์ของ GIMP โดยใช้ SIOX (ปลั๊กอิน ImageJ).
การทำแมท แก้ปัญหาความโปร่งใสแบบเศษส่วนที่ขอบเขตที่บอบบาง (ผม, ขน, ควัน, แก้ว). การทำแมทแบบปิดคลาสสิก ใช้ trimap (แน่นอน- หน้า/แน่นอน-หลัง/ไม่ทราบ) และแก้ปัญหาระบบเชิงเส้นสำหรับอัลฟ่าที่มีความเที่ยงตรงของขอบสูง. การทำแมทภาพแบบลึกสมัยใหม่ ฝึกอบรมโครงข่ายประสาทเทียมบนชุดข้อมูล Adobe Composition-1K (เอกสาร MMEditing), และได้รับการประเมินด้วยเมตริกเช่น SAD, MSE, Gradient, และ Connectivity (คำอธิบายเกณฑ์มาตรฐาน).
งานแบ่งส่วนที่เกี่ยวข้องก็มีประโยชน์เช่นกัน: DeepLabv3+ ปรับปรุงขอบเขตด้วยตัวเข้ารหัส-ตัวถอดรหัสและคอนโวลูชัน atrous (PDF); Mask R-CNN ให้หน้ากากต่ออินสแตนซ์ (PDF); และ SAM (Segment Anything) เป็น โมเดลพื้นฐาน ที่สามารถแจ้งได้ ที่สร้างหน้ากากแบบ zero-shot บนภาพที่ไม่คุ้นเคย.
งานวิชาการรายงานข้อผิดพลาด SAD, MSE, Gradient, และ Connectivity บน Composition-1K. หากคุณกำลังเลือกโมเดล, ให้มองหาเมตริกเหล่านั้น (คำจำกัดความของเมตริก; ส่วนเมตริกของ Background Matting). สำหรับภาพบุคคล/วิดีโอ, MODNet และ Background Matting V2 แข็งแกร่ง; สำหรับภาพ “วัตถุเด่น” ทั่วไป, U2-Net เป็นพื้นฐานที่มั่นคง; สำหรับความโปร่งใสที่ยาก, FBA อาจสะอาดกว่า.
รูปแบบไฟล์ภาพ MAC หรือที่รู้จักในชื่อไฟล์ภาพ Monkey's Audio เป็นรูปแบบไฟล์ที่ใช้เป็นหลักสำหรับการจัดเก็บข้อมูลเสียงที่บีบอัด ไม่ควรสับสนกับคำทั่วไปว่า 'รูปแบบไฟล์ภาพ Mac' ซึ่งอาจหมายถึงไฟล์ภาพประเภทใดก็ได้ที่ใช้ในคอมพิวเตอร์ Macintosh เช่น PICT, PNG หรือ JPEG รูปแบบไฟล์ภาพ MAC นั้นเกี่ยวข้องโดยเฉพาะกับ Monkey's Audio ซึ่งเป็นตัวแปลงสัญญาณเสียงแบบไม่สูญเสียที่พัฒนาโดย Matthew T. Ashland การบีบอัดแบบไม่สูญเสียเป็นอัลกอริทึมการบีบอัดข้อมูลประเภทหนึ่งที่ช่วยให้สามารถสร้างข้อมูลต้นฉบับขึ้นใหม่ได้อย่างสมบูรณ์แบบจากข้อมูลที่บีบอัดได้ ซึ่งตรงกันข้ามกับรูปแบบการบีบอัดแบบสูญเสีย เช่น MP3 หรือ AAC ซึ่งจะละทิ้งข้อมูลเสียงบางส่วนเพื่อลดขนาดไฟล์ ซึ่งอาจส่งผลต่อคุณภาพเสียง
Monkey's Audio ใช้ขั้นตอนวิธีการเป็นกรรมสิทธิ์เพื่อบีบอัดเสียงโดยไม่สูญเสียคุณภาพใดๆ ซึ่งหมายความว่าเมื่อมีการคลายการบีบอัดเสียงแล้ว เสียงนั้นจะเหมือนกับต้นฉบับเดิมทุกประการ ซึ่งมีความสำคัญอย่างยิ่งสำหรับนักเล่นเครื่องเสียงและมืออาชีพที่ต้องการการสร้างเสียงที่มีความเที่ยงตรงสูง รูปแบบ MAC รองรับระดับการบีบอัดต่างๆ ตั้งแต่เร็ว (แต่บีบอัดน้อยกว่า) ไปจนถึงสูง (บีบอัดมากขึ้น) ซึ่งช่วยให้ผู้ใช้สามารถปรับสมดุลระหว่างขนาดไฟล์และเวลาในการเข้ารหัสตามความต้องการของตนเอง
รูปแบบไฟล์ MAC ถูกห่อหุ้มไว้ในคอนเทนเนอร์ที่เก็บข้อมูลเสียงที่บีบอัดไว้ รวมถึงข้อมูลเมตาเกี่ยวกับสตรีมเสียง ข้อมูลเมตานี้อาจรวมถึงข้อมูลต่างๆ เช่น ชื่อศิลปิน ชื่ออัลบั้ม หมายเลขแทร็ก และรายละเอียดอื่นๆ ที่มีประโยชน์สำหรับการจัดระเบียบและระบุเนื้อหาเสียง รูปแบบนี้ยังสามารถจัดการเสียงความละเอียดสูงได้สูงสุด 24 บิตและ 96 kHz ซึ่งสูงกว่าคุณภาพเสียงของ Compact Disc Digital Audio (CDDA) มาตรฐานที่ 16 บิต/44.1 kHz
หนึ่งในคุณสมบัติหลักของรูปแบบ MAC คือความสามารถในการตรวจหาและแก้ไขข้อผิดพลาด เฟรมข้อมูลเสียงแต่ละเฟรมจะมีผลรวมตรวจสอบหรือแฮชที่สามารถใช้เพื่อตรวจสอบความสมบูรณ์ของข้อมูลระหว่างการคลายการบีบอัด หากตรวจพบข้อผิดพลาด ซอฟต์แวร์จะพยายามแก้ไขข้อผิดพลาดนั้น เพื่อให้แน่ใจว่าเอาต์พุตเสียงจะไม่มีการเสียหาย ซึ่งมีประโยชน์อย่างยิ่งสำหรับวัตถุประสงค์ในการเก็บถาวร ซึ่งความสมบูรณ์ของไฟล์เสียงมีความสำคัญสูงสุด
แม้จะมีข้อดีในแง่ของคุณภาพเสียง แต่รูปแบบ MAC ก็มีข้อจำกัดบางประการ ข้อจำกัดที่สำคัญที่สุดประการหนึ่งคือการขาดการรองรับอย่างกว้างขวางในซอฟต์แวร์และเครื่องเล่นฮาร์ดแวร์ ซ ึ่งแตกต่างจากรูปแบบที่ได้รับความนิยมมากกว่า เช่น MP3 หรือ FLAC ไฟล์ Monkey's Audio ไม่สามารถเล่นได้อย่างสากลบนอุปกรณ์ต่างๆ ซึ่งอาจเป็นข้อเสียเปรียบที่สำคัญสำหรับผู้ใช้ที่ต้องการฟังเพลงของตนบนแพลตฟอร์มต่างๆ โดยไม่ต้องแปลงไฟล์เป็นรูปแบบอื่น
ข้อจำกัดอีกประการหนึ่งคือขนาดไฟล์ แม้ว่า Monkey's Audio จะให้การบีบอัดแบบไม่สูญเสีย แต่ไฟล์ที่ได้ก็ยังมีขนาดใหญ่กว่าไฟล์แบบสูญเสียอย่างมาก ซึ่งอาจเป็นปัญหาสำหรับผู้ใช้ที่มีพื้นที่จัดเก็บจำกัดหรือผู้ที่ต้องการสตรีมเสียงผ่านอินเทอร์เน็ต ซึ่งแบนด์วิดท์อาจเป็นข้อจำกัด ด้วยเหตุนี้ รูปแบบ MAC จึงเหมาะสำหรับอุปกรณ์พกพาและแอปพลิเคชันสตรีมมิงน้อยกว่า ซึ่งขนาดไฟล์ที่เล็กลงและความเข้ากันได้ที่กว้างกว่ามีความสำคัญมากกว่า
รูปแบบ MAC ยังรองรับการแท็ก ซึ่งเป็นการรวมข้อมูลเมตาไว้ในไฟล์เสียงเ อง ระบบการแท็กนี้ช่วยให้สามารถจัดเก็บข้อมูลโดยละเอียดเกี่ยวกับแทร็ก เช่น ชื่อเรื่อง ศิลปิน อัลบั้ม ปี ประเภท และความคิดเห็น แท็กเหล่านี้มีความจำเป็นสำหรับเครื่องเล่นสื่อเพื่อจัดระเบียบและแสดงไลบรารีเสียงในลักษณะที่ใช้งานง่าย รูปแบบนี้รองรับทั้งแท็ก APE ซึ่งเป็นแท็กดั้งเดิมของ Monkey's Audio และแท็ก ID3 ซึ่งมักเกี่ยวข้องกับไฟล์ MP3 มากกว่า
ในแง่ของข้อกำหนดทางเทคนิค รูปแบบ MAC ใช้เทคนิคต่างๆ เพื่อให้ได้การบีบอัดแบบไม่สูญเสีย เทคนิคเหล่านี้รวมถึงการทำนายเชิงเส้น ซึ่งประมาณค่าตัวอย่างในอนาคตจากตัวอย่างในอดีต และการเข้ารหัสเอนโทรปี ซึ่งลดความซ้ำซ้อนโดยการเข้ารหัสองค์ประกอบที่พบได้ทั่วไปด้วยบิตที่น้อยลง รูปแบบนี้ยังใช้ตัวกรองต่างๆ เพื่อประมวลผลข้อมูลเสียงก่อนการบีบอัด ซึ่งสามารถช่วยปรับปรุงประสิทธิภาพของอัลกอริทึ มการบีบอัด
อัลกอริทึมการบีบอัดของรูปแบบ MAC ไม่สมมาตร ซึ่งหมายความว่ากระบวนการเข้ารหัส (บีบอัด) เสียงนั้นใช้ CPU มากกว่าการถอดรหัส (คลายการบีบอัด) ซึ่งเป็นลักษณะทั่วไปของอัลกอริทึมการบีบอัดแบบไม่สูญเสียหลายๆ แบบ เนื่องจากกระบวนการเข้ารหัส มักเกี่ยวข้องกับการคำนวณที่ซับซ้อนเพื่อหาหนทางที่มีประสิทธิภาพที่สุดในการแสดงข้อมูลเสียง อย่างไรก็ตาม เมื่อข้อมูลถูกบีบอัดแล้ว การถอดรหัสข้อมูลนั้นค่อนข้างตรงไปตรงมาและใช้พลังในการประมวลผลน้อยกว่า
Monkey's Audio ยังรองรับการสร้างไฟล์แก้ไขข้อผิดพลาด ซึ่งสามารถใช้เพื่อซ่อมแซมไฟล์ MAC ที่เสียหายหรือมีข้อผิดพลาด ไฟล์แก้ไขข้อผิดพลาดเหล่านี้ ซึ่งเรียกว่าไฟล์ APEv2 มีข้อมูลเพิ่มเติมที่สามารถใช้เพื่อกู้คืนเสียงให้กลับสู่สถานะเดิมในกรณีที่ข้อมูลสูญหาย คุณสมบัตินี้เพิ่มระดับความปลอ ดภัยให้กับไฟล์เสียง ทำให้รูปแบบ MAC เป็นตัวเลือกที่น่าสนใจสำหรับการจัดเก็บไฟล์เสียงในระยะยาว
รูปแบบ MAC ไม่ได้รับการรองรับโดยระบบปฏิบัติการจำนวนมากโดยตรง ซึ่งอาจเป็นอุปสรรคต่อการใช้งาน อย่างไรก็ตาม มีเครื่องมือซอฟต์แวร์ของบุคคลที่สามที่ช่วยให้สามารถเล่น แปลง และแก้ไขไฟล์ MAC บนแพลตฟอร์มต่างๆ ได้ ตัวอย่างเช่น ผู้ใช้สามารถค้นหาปลั๊กอินสำหรับเครื่องเล่นสื่อยอดนิยม เช่น Foobar2000 หรือ Winamp ซึ่งช่วยให้สามารถเล่นไฟล์ Monkey's Audio ได้โดยตรง นอกจากนี้ยังมีเครื่องมือแปลงที่สามารถแปลงไฟล์ MAC เป็นรูปแบบที่รองรับอย่างกว้างขวางกว่า เช่น FLAC หรือ WAV เพื่อให้เข้ากันได้กับอุปกรณ์ที่หลากหลายยิ่งขึ้น
สาเหตุประการหนึ่งที่ทำให้รูปแบบ MAC ได้รับการยอมรับอย่างจำกัดคือการมีตัวแปลงสัญญาณเสียงแบบไม่สูญเสียที่แข่งขันกัน เช่น FLAC, ALAC (Apple Lossless Audio Codec) และ WAV (Waveform Audio File Format) โดยเฉพาะอย่างยิ่ง FLAC ได้รับการยอมรับอย่างกว้างขวางเนื่องจากเป็นโอเพนซอร์สและรองรับอุปกรณ์และแอปพลิเคชันซอฟต์แวร์จำนวนมาก ALAC แม้ว่าจะเป็นกรรมสิทธิ์ของ Apple แต่ก็ได้รับการรองรับอย่างกว้างขวางบนอุปกรณ์และซอฟต์แวร์ของ Apple เช่นกัน WAV แม้ว่าจะไม่ถูกบีบอัด แต่ก็เป็นรูปแบบมาตรฐานสำหรับเสียงที่ไม่ถูกบีบอัดในอุตสาหกรรมเสียงระดับมืออาชีพและได้รับการรองรับเกือบทุกที่
แม้จะมีการแข่งขัน แต่รูปแบบ MAC ก็มีฐานผู้ใช้ที่ภักดี โดยเฉพาะในกลุ่มผู้ที่ให้ความสำคัญกับคุณภาพเสียงเหนือสิ่งอื่นใดและยินดีที่จะรับมือกับขนาดไฟล์ที่ใหญ่กว่าและความเข้ากันได้ที่จำกัด สำหรับผู้ใช้เหล่านี้ การแก้ไขข้อผิดพลาดที่แข็งแกร่ง การรองรับเสียงความละเอียดสูง และการบีบอัดแบบไม่สูญเสียที่มีประสิทธิภาพของรูปแบบ MAC ทำให้เป็นตัวเลือกที ่ต้องการสำหรับการเก็บถาวรและการฟังไฟล์เสียงคุณภาพสูง
สรุปแล้ว รูปแบบไฟล์ภาพ MAC เป็นรูปแบบไฟ
ตัวแปลงนี้ทำงานอย่างสมบูรณ์ในเบราว์เซอร์ของคุณ เมื่อคุณเลือกไฟล์ ไฟล์จะถูกอ่านเข้าไปในหน่วยความจำและแปลงเป็นรูปแบบที่เลือก จากนั้นคุณสามารถดาวน์โหลดไฟล์ที่แปลงแล้วได้
การแปลงจะเริ่มขึ้นทันที และไฟล์ส่วนใหญ่จะถูกแปลงภายในเวลาไม่ถึงหนึ่งวินาที ไฟล์ขนาดใหญ่อาจใช้เวลานานกว่านั้น
ไฟล์ของคุณจะไม่ถูกอัปโหลดไปยังเซิร์ฟเวอร์ของเรา ไฟล์เหล่านั้นจะถูกแปลงในเบราว์เซอร์ของคุณ จากนั้นไฟล์ที่แปลงแล้วจะถูกดาวน์โหลด เราไม่เคยเห็นไฟล์ของคุณ
เรารองรับการแปลงระหว่างรูปแบบภาพทั้งหมด รวมถึง JPEG, PNG, GIF, WebP, SVG, BMP, TIFF และอื่นๆ
ตัวแปลงนี้ฟรีโดยสมบูรณ์ และจะฟรีตลอดไป เนื่องจากทำงานในเบราว์เซอร์ของคุณ เราจึงไม่ต้องจ ่ายค่าเซิร์ฟเวอร์ ดังนั้นเราจึงไม่เรียกเก็บเงินจากคุณ
ใช่! คุณสามารถแปลงไฟล์ได้มากเท่าที่คุณต้องการในคราวเดียว เพียงเลือกหลายไฟล์เมื่อคุณเพิ่ม