배경 제거는 피사체를 주변 환경과 분리하여 투명 배경에 배치하거나, 장면을 바꾸거나, 새로운 디자인에 합성할 수 있게 해줍니다. 내부적으로는 0에서 1까지의 픽셀당 불투명도인 알파 매트를 추정하고, 전경을 알파 합성하여 다른 것 위에 배치하는 것입니다. 이것은 포터–더프의 수학이며, “프린지”와 스트레이트 알파 대 미리 곱해진 알파와 같은 흔히 발생하는 문제의 원인입니다. 미리 곱하기와 선형 색상에 대한 실용적인 지침은 마이크로소프트의 Win2D 노트, 쇠렌 산만, 그리고 로몬트의 선형 블렌딩에 대한 글을 참조하십시오.
촬 영을 제어할 수 있다면 배경을 단색(주로 녹색)으로 칠하고 해당 색조를 키로 빼냅니다. 이 방법은 빠르고, 영화 및 방송에서 검증되었으며, 비디오에 이상적입니다. 단점은 조명과 의상입니다: 색깔 있는 빛이 가장자리(특히 머리카락)에 번지므로, 오염을 중화하기 위해 디스필 도구를 사용해야 합니다. 좋은 입문 자료로는 누크의 문서, 믹싱 라이트, 그리고 직접 해보는 퓨전 데모가 있습니다.
배경이 지저분한 단일 이미지의 경우, 대화형 알고리즘은 사용자의 몇 가지 힌트(예: 느슨한 사각형이나 낙서)를 필요로 하며, 선명한 마스크를 생성합니다. 표준적인 방법은 그랩컷 (책의 장)으로, 전경/배경의 색상 모델을 학습하고 그래프 컷을 반복적으로 사용하여 분리합니다.GIMP의 전경 선택에서도 비슷한 아이디어를 볼 수 있으며, 이는 SIOX (ImageJ 플러그인)에 기반합니다.
매팅은 가느다란 경계(머리카락, 털, 연기, 유리)에서 부분적인 투명도를 해결합니다. 고전적인 폐쇄형 매팅은 트라이맵(확실한 전경/확실한 배경/알 수 없음)을 사용하여 강력한 가장자리 정확도로 알파에 대한 선형 시스템을 풉니다. 현대적인 딥 이미지 매팅은 어도비 컴포지션-1K 데이터셋(MMEditing 문서)에서 신경망을 훈련시키며, SAD, MSE, 그래디언트, 연결성과 같은 메트릭으로 평가됩니다(벤치마크 설명).
관련된 분할 작업도 유용합니다: DeepLabv3+는 인코더-디코더와 아트러스 컨볼루션으로 경계를 다듬습니다 (PDF); 마스크 R-CNN은 인스턴스별 마스크를 제공합니다 (PDF); 그리고 SAM(Segment Anything)은 새로운 이미지에 대해 제로샷으로 마스크를 생성하는 프롬프트 기반 기본 모델입니다.
학술 연구에서는 컴포지션-1K에 대한 SAD, MSE, 그래디언트, 연결성 오류를 보고합니다. 모델을 선택하는 경우 해당 메트릭을 찾아보세요 (메트릭 정의; 배경 매팅 메트릭 섹션). 인물/비디오의 경우, MODNet과 배경 매팅 V2가 강력합니다; 일반적인 “두드러진 객체” 이미지의 경우, U2-Net이 견고한 기준선입니다; 어려운 투명도의 경우, FBA가 더 나은 결과를 제공할 수 있습니다.
PlayStation 2(PS2)는 고유한 하드웨어 아키텍처에 최적화된 독점 이미지 포맷을 사용합니다. 이 포맷은 PS2의 그래픽 신디사이저와 벡터 유닛을 활용하여 2D 그래픽의 효율적인 저장 및 렌더링을 가능하게 합니다. 이미지는 시각적 품질과 메모리 사용량의 균형을 맞추기 위해 다양한 색상 모드, 압축 기법, 데이터 레이아웃을 사용하여 저장됩니다.
PS2 이미지에 사용되는 주요 색상 모드는 32비트 RGBA, 24비트 RGB, 16비트 RGB(565 또는 5551), CLUT(색상 조회표)를 사용한 4비트 또는 8비트 색인 색상입니다. 32비트 RGBA는 투명도를 위한 알파 채널을 사용하여 가장 높은 품질을 제공하는 반면, 4비트 색인은 더 작은 파일 크기로 품질을 희생합니다. 16비트 RGB 모드는 중간 지점을 차지합니다. 선택한 색상 모드는 메모리 사용량과 그래픽의 최대 가능한 디테일과 색상 깊이에 영향을 미칩니다.
PS2 그래픽은 색인 색상 모드에 팔레트를 선택적으로 사용할 수 있습니다. 팔레트 또는 CLUT는 4비트 또는 8비트 색인 값을 16비트 또는 24비트 RGB 색상에 매핑하는 테이블입니다. 팔레트를 사용하면 직접 색상 모드에 비해 더욱 시각적으로 풍부한 그래픽을 더 작은 메모리 공간으로 구현할 수 있지만, 이미지당 16개 또는 256개의 고유한 색상으로 제한된다는 단점이 있습니다. 팔레트는 2D 스프라이트, 텍스트, UI 요 소와 같은 간단한 그래픽에 가장 적합합니다.
제한된 메모리를 절약하기 위해 PS2 이미지 데이터를 압축하는 데 여러 가지 기법이 사용됩니다. 가장 간단한 것은 동일한 값의 반복 시퀀스를 카운트와 값 자체로 대체하는 런 길이 인코딩(RLE)입니다. 예를 들어, "AAAAAAABBCCCCCC"는 "7A2B6C"로 압축됩니다. 이 무손실 알고리즘은 동일한 색상의 많은 연속적인 런이 있는 이미지를 압축하는 데 빠르고 효과적입니다.
더욱 발전된 PS2 이미지 압축 방법은 인간 시각 시스템의 특성을 활용하여 인식할 수 없는 정보를 버립니다. 이러한 손실 알고리즘은 이미지 블록을 분석하고 눈에 덜 민감한 고주파 데이터와 색상 정밀도를 선택적으로 버립니다. PS2 하드웨어는 벡터 유닛에 맞게 조정된 벡터 양자화와 블록 절단 코딩의 한 형태를 기본적으로 지원합니다. 압축된 이미지 데이터를 CLUT 팔레트와 페어링하면 디테일한 그래픽을 효율적으로 저장하고 렌더링할 수 있습니다.
PS2 그래픽 파이프라인은 텍스처 처리된 삼각형을 그리는 데 기반합니다. 3D 표면에 매핑되도록 의도된 이미지는 2D 텍스처로 저장됩니다. PS2 텍스처는 텍스처가 표면에 샘플링, 필터링, 적용되는 방식을 제어하기 위해 미프맵을 포함합니다. 이러한 미프맵은 텍스처 처리된 표면이 비스듬한 각도나 멀리서 보일 때 아티팩트를 줄이는 전체 크기 텍스처의 사전 계산된 축소 버전입니다. 단일 PS2 텍스처는 전체 크기 이미지에 이어 일련의 연속적으로 축소된 미프맵으로 구성됩니다.
PS2 그래픽 데이터는 하드웨어가 이미지 픽셀에 효율적으로 액세스할 수 있도록 고유한 방식으로 메모리에 배치됩니다. 색상 데이터는 별도의 비트 평면으로 분할되거나 VRAM에 스위즐 패턴으로 저장될 수 있습니다. 렌더링 성능을 극대화하려면 데이터가 배열되는 방식을 신중하게 고려해야 합니다. 그래픽 신디사이저는 이러한 특수 데이터 레이아웃 규칙을 따르는 이미지와 텍스처를 렌더링하도록 최적화되어 있습니다.
이미지 데이터 자체를 넘어 PS2 그래픽은 종종 수반되는 메타데이터에 의존합니다. 스프라이트의 경우 여기에는 위치, 크기, 회전, 알파 블렌딩 모드와 같은 속성이 포함됩니다. 3D 텍스처의 경우 메타데이터는 차원, 색상 모드, 압축, 미프맵 레벨 수, 텍스처 래핑 및 클램핑 규칙, 텍스처 필터링 모드와 같은 세부 정보를 지정합니다. 이 메타데이터는 PS2에 이미지를 처리하고 적용하는 방법을 지시합니다.
이 변환기는 완전히 브라우저에서 작동합니다. 파일을 선택하면 메모리에 읽혀 선택한 형식으로 변환됩니다. 그 후 변환된 파일을 다운로드할 수 있습니다.
변환은 즉시 시작되며 대부분의 파일은 1초 이내에 변환됩니다. 큰 파일은 더 오래 걸릴 수 있습니다.
파일은 우리 서버에 업로드되지 않습니다. 브라우저에서 변환되고 변환된 파일이 다운로드됩니다. 우리는 파일을 볼 수 없습니다.
JPEG, PNG, GIF, WebP, SVG, BMP, TIFF 등 모든 이미지 형식을 변환할 수 있습니다.
이 변환기는 완전히 무료이며 항상 무료입니다. 브라우저에서 작동하기 때문에 서버 비용이 들지 않아서 고객님께 비용을 청구할 필요가 없습니다.
네! 원하는 만큼 많은 파일을 동시에 변환할 수 있습니다. 파일을 추가할 때 여러 파일을 선택하세요.