Xóa nền tách một đối tượng khỏi môi trường xung quanh để bạn có thể đặt nó trên nền trong suốt, hoán đổi cảnh hoặc ghép nó vào một thiết kế mới. Về cơ bản, bạn đang ước tính một mặt n ạ alpha—độ mờ mỗi pixel từ 0 đến 1—và sau đó ghép alpha tiền cảnh lên một thứ khác. Đây là toán học từ Porter–Duff và là nguyên nhân của các cạm bẫy quen thuộc như “viền” và alpha thẳng và alpha nhân trước. Để có hướng dẫn thực tế về nhân trước và màu tuyến tính, hãy xem ghi chú Win2D của Microsoft, Søren Sandmann, và bài viết của Lomont về trộn tuyến tính.
Nếu bạn có thể kiểm soát việc chụp, hãy sơn phông nền bằng một màu đồng nhất (thường là màu xanh lá cây) và loại bỏ màu đó. Nó nhanh, đã được thử nghiệm trong phim và phát sóng, và lý tưởng cho video. Sự đánh đổi là ánh sáng và trang phục: ánh sáng màu tràn ra các cạnh (đặc biệt là tóc), vì vậy bạn sẽ sử dụng các công cụ khử tràn để trung hòa ô nhiễm. Các tài liệu tham khảo tốt bao gồm tài liệu của Nuke, Mixing Light, và một bản demo thực hành Fusion.
Đối với các hình ảnh đơn lẻ có nền lộn xộn, các thuật toán tương tác cần một vài gợi ý của người dùng—ví dụ: một hình chữ nhật lỏng lẻo hoặc các nét vẽ nguệch ngoạc—và hội tụ thành một mặt nạ sắc nét. Phương pháp kinh điển là GrabCut (chương sách), học các mô hình màu cho tiền cảnh/nền và sử dụng các đường cắt đồ thị lặp đi lặp lại để tách chúng. Bạn sẽ thấy những ý tưởng tương tự trong Lựa chọn tiền cảnh của GIMP dựa trên SIOX (plugin ImageJ).
Matting giải quyết độ trong suốt phân đoạn ở các ranh giới mỏng manh (tóc, lông, khói, kính). Matting dạng đóng cổ điển lấy một bản đồ ba vùng (chắc chắn-tiền cảnh/chắc chắn-nền/không xác định) và giải một hệ thống tuyến tính cho alpha với độ trung thực cạnh mạnh. Matting hình ảnh sâu hiện đại đào tạo các mạng nơ-ron trên bộ dữ liệu Adobe Composition-1K (tài liệu MMEditing), và được đánh giá bằng các số liệu như SAD, MSE, Gradient và Connectivity (giải thích điểm chuẩn).
Công việc phân đoạn liên quan cũng hữu ích: DeepLabv3+ tinh chỉnh các ranh giới bằng một bộ mã hóa-giải mã và các tích chập atrous (PDF); Mask R-CNN cung cấp các mặt nạ cho mỗi phiên bản (PDF); và SAM (Segment Anything) là một mô hình nền tảng có thể nhắc tạo ra các mặt nạ không cần học trên các hình ảnh không quen thuộc.
Công trình học thuật báo cáo các lỗi SAD, MSE, Gradient, và Connectivity trên Composition-1K. Nếu bạn đang chọn một mô hình, hãy tìm những số liệu đó (định nghĩa số liệu; phần số liệu của Background Matting). Đối với chân dung/video, MODNet và Background Matting V2 rất mạnh; đối với các hình ảnh “đối tượng nổi bật” chung, U2-Net là một đường cơ sở vững chắc; đối với độ trong suốt khó, FBA có thể sạch hơn.
PAM (Portable Arbitrary Map) là định dạng hình ảnh ít được biết đến trong họ định dạng tệp hình ảnh được thiết kế trong dự án Netpbm. Đây là định dạng linh hoạt cao có thể biểu diễn nhiều loại hình ảnh với độ sâu và loại dữ liệu điểm ảnh khác nhau. Về cơ bản, PAM là phần mở rộng của các định dạng PBM (Portable Bitmap), PGM (Portable Graymap) và PPM (Portable Pixmap) trước đó, được gọi chung là các định dạng PNM (Portable Any Map), được thiết kế để đơn giản và dễ sử dụng nhưng phải đánh đổi bằng các tính năng và khả năng nén. PAM được giới thiệu để khắc phục những hạn chế của các định dạng này nhưng vẫn giữ được sự đơn giản và dễ sử dụng.
Định dạng PAM được thiết kế để không phụ thuộc vào thiết bị và nền tảng, nghĩa là hình ảnh được lưu ở định dạng này có thể được mở và chỉnh sửa trên bất kỳ hệ thống nào mà không cần quan tâm đến các vấn đề về khả năng tương thích. Điều này đạt được bằng cách lưu trữ dữ liệu hình ảnh ở định dạng văn bản thuần túy hoặc nhị phân có thể dễ dàng đọc và ghi bởi nhiều phần mềm khác nhau. Định dạng này cũng có thể mở rộng, cho phép đưa vào các tính năng và khả năng mới mà không làm mất khả năng tương thích với các phiên bản cũ h ơn.
Tệp PAM bao gồm một phần đầu theo sau là dữ liệu hình ảnh. Phần đầu là văn bản ASCII chỉ định chiều rộng, chiều cao, độ sâu và giá trị tối đa của hình ảnh, cũng như loại bộ ba xác định không gian màu. Phần đầu bắt đầu bằng số hiệu 'P7', theo sau là một loạt các thẻ phân tách bằng dòng mới cung cấp siêu dữ liệu cần thiết. Dữ liệu hình ảnh theo ngay sau phần đầu và có thể được lưu ở định dạng nhị phân hoặc ASCII, trong đó nhị phân là lựa chọn phổ biến hơn vì kích thước tệp nhỏ hơn và thời gian xử lý nhanh hơn.
Độ sâu được chỉ định trong phần đầu PAM cho biết số kênh hoặc thành phần trên mỗi điểm ảnh. Ví dụ: độ sâu là 3 thường biểu thị các kênh đỏ, lục và lam của hình ảnh màu, trong khi độ sâu là 4 có thể bao gồm thêm kênh alpha để tạo độ trong suốt. Giá trị tối đa, cũng được chỉ định trong phần đầu, cho biết giá trị tối đa cho bất kỳ kênh nào, từ đó xác định độ sâu bit của hình ảnh. Ví dụ: giá trị tối đa là 255 tương ứng với 8 bit trên mỗi kênh.
Loại bộ ba là một tính năng chính của định dạng PAM vì nó xác định cách diễn giải dữ liệu điểm ảnh. Các loại bộ ba phổ biến bao gồm 'BLACKANDWHITE', 'GRAYSCALE', 'RGB' và 'RGB_ALPHA', cùng nhiều loại khác. Sự linh hoạt này cho phép các tệp PAM biểu diễn nhiều loại hình ảnh, từ hình ảnh đen trắng đơn giản đến hình ảnh đủ màu có độ trong suốt. Ngoài ra, có thể xác định các loại bộ ba tùy chỉnh, giúp định dạng này có thể mở rộng và thích ứng với các yêu cầu hình ảnh chuyên biệt.
Các tệp PAM cũng có thể bao gồm các d òng chú thích tùy chọn trong phần đầu, bắt đầu bằng ký tự '#'. Các chú thích này bị trình đọc hình ảnh bỏ qua và dành cho người đọc. Chúng có thể được sử dụng để lưu trữ siêu dữ liệu như ngày tạo hình ảnh, phần mềm được sử dụng để tạo hình ảnh hoặc bất kỳ thông tin có liên quan nào khác không phù hợp với các trường tiêu đề chuẩn.
Dữ liệu hình ảnh trong tệp PAM được lưu trữ theo trình tự các bộ ba, với mỗi bộ ba biểu diễn một điểm ảnh. Các bộ ba được sắp xếp từ trái sang phải và từ trên xuống dưới, bắt đầu từ điểm ảnh trên cùng bên trái của hình ảnh. Ở định dạng nhị phân, dữ liệu cho mỗi kênh của một bộ ba được lưu trữ dưới dạng số nguyên nhị phân, với số byte trên mỗi kênh được xác định bởi giá trị tối đa được chỉ định trong phần đầu. Ở định dạng ASCII, các giá trị kênh được biểu diễn dưới dạng số thập phân ASCII được phân tách bằng khoảng trắng.
Một trong những ưu điểm của định dạng PAM là sự đơn giản, giúp dễ dàng phân tích cú pháp và tạo. Sự đơn giản này phải đánh đổi bằng kích thước tệp, vì PAM không bao gồm bất kỳ cơ chế nén tích hợp nào. Tuy nhiên, các tệp PAM có thể được nén bên ngoài bằng các thuật toán nén mục đích chung như gzip hoặc bzip2, có thể giảm đáng kể kích thước tệp để lưu trữ hoặc truyền.
Mặc dù có những ưu điểm, định dạng PAM không được sử dụng rộng rãi trong dòng chính do sự thống trị của các định dạng hình ảnh khác như JPEG, PNG và GIF, vốn cung cấp khả năng nén tích hợp và được nhiều phần mềm và phần cứng hỗ trợ hơn. Tuy nhiên, PAM vẫn là một định dạng có giá trị cho một số ứng dụng nhất định, đặc biệt là những ứng dụng yêu cầu mức độ linh hoạt cao hoặc liên quan đến các tác vụ xử lý hoặc phân tích hình ảnh mà sự đơn giản và độ chính xác của định dạng này có lợi.
Trong bối cảnh phát triển phần mềm, định dạng PAM thường được sử dụng làm định dạng trung gian trong các quy trình xử lý hình ảnh. Cấu trúc đơn giản của nó giúp dễ dàng thao tác bằng các tập lệnh hoặc chương trình tùy chỉnh và sự linh hoạt của nó cho phép định dạng này chứa đầu ra của nhiều bước xử lý khác nhau mà không làm mất thông tin. Ví dụ: hình ảnh có thể được chuyển đổi sang định dạng PAM, được xử lý để áp dụng bộ lọc hoặc phép biến đổi, sau đó được chuyển đổi sang định dạng phổ biến hơn để hiển thị hoặc phân phối.
Thư viện Netpbm là gói phần mềm chính để làm việc với PAM và các định dạng Netpbm khác. Thư viện này cung cấp một bộ sưu tập các công cụ dòng lệnh để chuyển đổi giữa các định dạng, cũng như để thực hiện các thao tác hình ảnh cơ bản như thay đổi kích thước, cắt xén và điều chỉnh màu sắc. Thư viện này cũng bao gồm các giao diện lập trình cho C và các ngôn ngữ khác, cho phép các nhà phát triển đọc và ghi các tệp PAM trực tiếp trong các ứng dụng của họ.
Đối với người dùng và nhà phát triển quan tâm đến việc làm việc với định dạng PAM, có một số lưu ý cần ghi nhớ. Đầu tiên, vì định dạng này ít phổ biến hơn nên không phải tất cả phần mềm xem và chỉnh sửa hình ảnh nào cũng hỗ trợ định dạng này theo mặc định. Có thể cần sử dụng các công c ụ chuyên dụng hoặc chuyển đổi sang định dạng khác cho một số tác vụ nhất định. Thứ hai, việc thiếu khả năng nén có nghĩa là các tệp PAM có thể khá lớn, đặc biệt đối với hình ảnh có độ phân giải cao, vì vậy cần tính đến dung lượng lưu trữ và băng thông khi làm việc với định dạng này.
Mặc dù có những lưu ý này, nhưng những điểm mạnh của định dạng PAM khiến định dạng này trở thành một công cụ có giá trị trong một số bối cảnh nhất định. Sự đơn giản và linh hoạt của định dạng này giúp phát triển và thử nghiệm nhanh chóng, và khả năng mở rộng của định dạng này đảm bảo rằng định dạng này có thể thích ứng với các nhu cầu trong tương lai. Đối với nghiên cứu, hình ảnh khoa học hoặc bất kỳ ứng dụng nào mà tính toàn vẹn và độ chính xác của dữ liệu hình ảnh là tối quan trọng, PAM cung cấp một giải pháp mạnh mẽ.
Tóm lại, định dạng hình ảnh PAM là một định dạng tệp linh hoạt và đơn giản, là một phần của họ định dạng hình ảnh Netpbm. Định dạng này được thiết kế để đơn giản, linh hoạt và không phụ thuộc vào nền tảng, giúp định dạng này phù hợp với nhiều loại hình ảnh và ứng dụng. Mặc dù định dạng này có thể không phải là lựa chọn tốt nhất cho mọi tình huống, đặc biệt là khi kích thước tệp hoặc khả năng tương thích rộng rãi là mối quan tâm, nhưng những điểm mạnh của định dạng này khiến định dạng này trở thành lựa chọn tuyệt vời cho các ứng dụng chuyên biệt yêu cầu biểu diễn và thao tác chính xác dữ liệu hình ảnh. Do đó, định dạng này vẫn là một định dạng có liên quan và hữu ích trong các lĩnh vực xử lý và phân tích hình ảnh.
Bộ chuyển đổi này chạy hoàn toàn trong trình duyệt của bạn. Khi bạn chọn một tệp, nó sẽ được đọc vào bộ nhớ và chuyển đổi sang định dạng đã chọn. Sau đó, bạn có thể tải xuống tệp đã chuyển đổi.
Việc chuyển đổi bắt đầu ngay lập tức và hầu hết các tệp được chuyển đổi trong vòng chưa đầy một giây. Các tệp lớn hơn có thể mất nhiều thời gian hơn.
Các tệp của bạn không bao giờ được tải lên máy chủ của chúng tôi. Chúng được chuyển đổi trong trình duyệt của bạn và sau đó tệp đã chuyển đổi sẽ được tải xuống. Chúng tôi không bao giờ thấy các tệp của bạn.
Chúng tôi hỗ trợ chuyển đổi giữa tất cả các định dạng hình ảnh, bao gồm JPEG, PNG, GIF, WebP, SVG, BMP, TIFF, v.v.
Bộ chuyển đổi này hoàn toàn miễn phí và sẽ luôn miễn phí. Bởi vì nó chạy trong trình duyệt của bạn, chúng tôi không phải trả tiền cho máy chủ, vì vậy chúng tôi không cần tính phí bạn.
Đúng! Bạn có thể chuyển đổi bao nhiêu tệp tùy thích cùng một lúc. Chỉ cần chọn nhiều tệp khi bạn thêm chúng.