PDB(Protein Data Bank) 이미지 포맷은 JPEG나 PNG와 같은 전통적인 '이미지' 포맷이 아니라 단백질, 핵산, 복잡한 조립체에 대한 3차원 구조 정보를 저장하는 데이터 포맷입니다. PDB 포맷은 과학자들이 생물학적 거대 분자의 분자 구조를 시각화, 공유, 분석할 수 있기 때문에 생물정보학과 구조 생물학의 초 석입니다. PDB 아카이브는 전 세계 단백질 데이터 뱅크(wwPDB)에서 관리하며, PDB 데이터를 전 세계 커뮤니티에서 자유롭고 공개적으로 사용할 수 있도록 합니다.
PDB 포맷은 분자 구조를 표현하는 표준화된 방법에 대한 필요성이 커지면서 1970년대 초에 처음 개발되었습니다. 그 이후로 다양한 분자 데이터를 수용하도록 진화했습니다. 이 포맷은 텍스트 기반이며 사람이 읽을 수도 있고 컴퓨터에서 처리할 수도 있습니다. 각각은 해당 레코드에 포함된 정보 유형을 지정하는 6자리 라인 식별자로 시작하는 일련의 레코드로 구성됩니다. 이러한 레코드는 원자 좌표, 연결성, 실험 데이터를 포함하여 구조에 대한 자세한 설명을 제공합니다.
일반적인 PDB 파일은 단백질이나 핵산 구조에 대한 메타데이터를 포함하는 헤더 섹션으로 시작합니다. 이 섹션에는 구조에 대한 간략한 설명을 제공하는 TITLE, 화학 성분을 나열하는 COMPND, 생물학적 분자의 기원을 설명하는 SOURCE와 같은 레코드가 포함됩니다. 헤더에는 또한 구조를 결정한 사람들의 이름을 나열하는 AUTHOR 레코드와 구조가 처음 설명된 문헌에 대한 인용을 제공하는 JOURNAL 레코드가 포함됩니다.
헤더에 이어 PDB 파일에는 SEQRES 레코드에 거대 분자의 주요 서열 정보가 포함됩니다. 이러한 레코드는 체인에 나타나는 대로 잔기(단백질의 아미노산, 핵산의 뉴클레오티드)의 서열을 나열합니다. 이 정보는 분자의 서열과 3차원 구조 간의 관계를 이해하는 데 중요합니다.
ATOM 레코드는 분자의 각 원자에 대한 좌표가 포함되어 있으므로 PDB 파일에서 가장 중요한 부분입니다. 각 ATOM 레코드에는 원자 순번, 원자 이름, 잔기 이름, 체인 식별자, 잔기 서열 번호, 옹스트롬 단위의 원자의 x, y, z 직교 좌표가 포함됩니다. ATOM 레코드를 통해 PyMOL, Chimera, VMD와 같은 특수 소프트웨어를 사용하여 시각화할 수 있는 분자의 3차원 구조를 재구성할 수 있습니다.
ATOM 레코드 외에도 금속 이온, 물 분자, 단백질이나 핵산에 결합된 다른 소분자와 같은 비표준 잔기나 리간드의 일부인 원자에 대한 HETATM 레코드가 있습니다. 이러한 레코드는 ATOM 레코드와 유사하게 포맷되지만 구조 내에서 거대 분자적이지 않은 성분을 식별하기 쉽도록 구별됩니다.
연결성 정보는 원자 간의 결합을 나열하는 CONECT 레코드에 제공됩니다. 이러한 레코드는 필수 사항이 아니며, 대부분의 분자 시각화 및 분석 소프트웨어는 원자 간 거리에 따라 연결성을 유추할 수 있습니다. 그러나 이러한 레코드는 특이한 결합이나 금속 배위 복합체가 있는 구조를 정의하는 데 중요하며, 이 경우 결합이 원자 좌표만으로는 명확하지 않을 수 있습니다.
PDB 포맷에는 또한 알파 나선과 베타 시트와 같은 이차 구조 요소를 지정하는 레코드가 포함됩니다. HELIX 및 SHEET 레코드는 이러한 구조를 식별하고 서열 내에서의 위치에 대한 정보를 제공합니다. 이 정보는 거대 분자의 폴딩 패턴을 이해하는 데 도움이 되며 비교 연구와 모델링에 필수적입니다.
구조를 결정하는 데 사용된 실험 데이터와 방법도 PDB 파일에 기록됩니다. EXPDTA와 같은 레코드는 실험 기법(예: X선 결정학, NMR 분광법)을 설명하는 반면, REMARK 레코드는 데이터 수집, 분해능, 정제 통계에 대한 세부 정보를 포함하여 구조에 대한 다양한 주석과 설명을 포함할 수 있습니다.
END 레코드는 PDB 파일의 끝을 나타냅니다. PDB 포맷이 널리 사용되지만 오래되었고 고정된 열 너비 포맷으로 인해 한계가 있다 는 점에 유의하는 것이 중요합니다. 이로 인해 원자가 많거나 더 높은 정밀도가 필요한 최신 구조에 문제가 발생할 수 있습니다. 이러한 한계를 해결하기 위해 거대 분자 구조를 표현하기 위한 더욱 유연하고 확장 가능한 프레임워크를 제공하는 mmCIF(거대 분자 결정학 정보 파일)라는 업데이트된 포맷이 개발되었습니다.
mmCIF 포맷이 개발되었음에도 불구하고 PDB 포맷은 단순성과 이를 지원하는 수많은 소프트웨어 도구로 인해 여전히 인기가 있습니다. 연구자들은 종종 필요와 사용하는 도구에 따라 PDB와 mmCIF 포맷을 변환합니다. PDB 포맷의 수명은 구조 생물학 분야에서의 근본적인 역할과 복잡한 구조 정보를 비교적 간단한 방식으로 전달하는 효율성을 증명합니다.
PDB 파일을 사용하려면 과학자들은 다양한 계산 도구를 사용합니다. 분자 시각화 소프트웨어를 사용하면 사용자가 PDB 파일을 로드하고 3차원으로 구조를 보고, 회전하고, 확대 및 축소하고, 원자의 공간적 배열을 더 잘 이해하기 위해 다양한 렌더링 스타일을 적용할 수 있습니다. 이러한 도구는 종종 거리, 각도, 이면각 측정, 분자 동역학 시뮬레이션, 구조 내 또는 잠재적 리간드와의 상호 작용 분석과 같은 추가 기능을 제공합니다.
PDB 포맷은 또한 계산 생물학과 약물 발견에서 중요한 역할을 합니다. PDB 파일의 구조 정보는 동족 모델링에 사용되며, 여기서 관련 단백질의 알려진 구조를 사용하여 관심 단백질의 구조를 예측합니다. 구조 기반 약물 설계에서 표적 단백질의 PDB 파일은 잠재적 약물 화합물을 선별하고 최적화하는 데 사용되며, 이는 실험실에서 합성 및 테스트할 수 있습니다.
PDB 포맷의 영향은 개별 연구 프로젝트를 넘어섭니다. 단백질 데이 터 뱅크 자체는 현재 150,000개 이상의 구조를 포함하는 저장소이며, 새로운 구조가 결정되고 저장됨에 따라 계속해서 성장합니다. 이 데이터베이스는 학생들이 생물학적 거대 분자의 구조를 탐구하고 배우는 데 도움이 되는 교육에 귀중한 자료입니다. 또한 지난 수십 년간 구조 생물학의 진전에 대한 역사적 기록으로도 사용됩니다.
결론적으로 PDB 이미지 포맷은 생물학적 거대 분자의 3차원 구조를 저장, 공유, 분석하는 수단을 제공하는 구조 생물학 분야의 중요한 도구입니다. 몇 가지 한계가 있지만 널리 채택되고 사용을 위한 풍부한 도구 생태계가 개발되어 가까운 미래에도 핵심 포맷으로 남을 것입니다. 구조 생물학 분야가 계속해서 진화함에 따라 PDB 포맷은 mmCIF와 같은 더욱 고급 포맷으로 보완될 가능성이 높지만, 현대 구조 생물학의 기반이 되는 유산은 지속될 것입니다.
이 변환기는 완전히 브라우저에서 작동합니다. 파일을 선택하면 메모리에 읽혀 선택한 형식으로 변환됩니다. 그 후 변환된 파일을 다운로드할 수 있습니다.
변환은 즉시 시작되며 대부분의 파일은 1초 이내에 변환됩니다. 큰 파일은 더 오래 걸릴 수 있습니다.
파일은 우리 서버에 업로드되지 않습니다. 브라우저에서 변환되고 변환된 파일이 다운로드됩니다. 우리는 파일을 볼 수 없습니다.
JPEG, PNG, GIF, WebP, SVG, BMP, TIFF 등 모든 이미지 형식을 변환할 수 있습니다.
이 변환기는 완전히 무료이며 항상 무료입니다. 브라우저에서 작동하기 때문에 서버 비용이 들지 않아서 고객님께 비용을 청구할 필요가 없습니다.
네! 원하는 만큼 많은 파일을 동시에 변환할 수 있습니다. 파일을 추가할 때 여러 파일을 선택하세요.