蛋白质数据库(PDB)图像格式不是像 JPEG 或 PNG 这样的传统“图像”格式,而是一种数据格式,用于存储有关蛋白质、核酸和复杂组件的三维结构信息。PDB 格式是生物信息学和结构生物学的基础,因为它允许科学家可视化、共享和分析生物大分子分子结构。PDB 档案由全球蛋白质数据库(wwPDB)管理,它确保 PDB 数据对全球社区免费且公开。
PDB 格式最初开 发于 20 世纪 70 年代初,以满足对表示分子结构的标准化方法日益增长的需求。从那时起,它已发展到可容纳各种分子数据。该格式基于文本,人类可以阅读,计算机也可以处理。它由一系列记录组成,每个记录都以一个六个字符的行标识符开头,该标识符指定该记录中包含的信息类型。这些记录提供了结构的详细描述,包括原子坐标、连通性和实验数据。
典型的 PDB 文件以头部分节开头,其中包括有关蛋白质或核酸结构的元数据。此部分包含诸如 TITLE(提供结构的简要说明)、COMPND(列出化学成分)和 SOURCE(描述生物分子的来源)之类的记录。标题还包括 AUTHOR 记录,其中列出了确定结构的人员姓名,以及 JOURNAL 记录,其中提供了首次描述结构的文献引用。
在标题之后,PDB 文件包含 SEQRES 记录中大分子的一级序列信息。这些记录列出了残基序列(蛋白质的氨基酸,核酸的核苷酸),因为它们出现在链中。此信息对于理解分子的序列与其三维结构之间的关系至关重要。
ATOM 记录可以说是 PDB 文件中最重要的部分,因为它们包含分子中每个原子的坐标。每个 ATOM 记录包括原子序列号、原子名称、残基名称、链标识符、残基序列号以及原子在埃中的 x、y 和 z 笛卡尔坐标。ATOM 记录允许重建分子的三维结构,可以使用专门的软件(例如 PyMOL、Chimera 或 VMD)对其进行可视化。
除了 ATOM 记录之外,还有用于非标准残基或配体(例如金属离子、水分子或与蛋白质或核酸结合的其他小分子)中原子的 HETATM 记录。这些记录的格式与 ATOM 记录类似,但有所区别,以便于识别结构中非大分子成分。
连通性信息在 CONECT 记录中提供,其中列出了原子之间的键。这些记录不是必需的,因为大多数分子可视化和分析软件可以根据原子之间的距离推断连通性。但是,它们对于定义不寻常的键或具有金属配位配合物的结构至关重要,其中仅从原子坐标可能无法明显看出键合。
PDB 格式还包括用于指定二级结构元素(例如 α 螺旋和 β 折叠)的记录。HELIX 和 SHEET 记录识别这些结构并提供有关它们在序列中位置的信息。此信息有助于理解大分子折叠模式,对于比较研究和建模至关重要。
确定结构的实验数据和方法也记录在 PDB 文件中。诸如 EXPDTA 之类的记录描述了实验技术(例如 X 射线晶体学、核磁共振光谱),而 REMARK 记录可以包含有关结构的各种注释和注释,包括有关数据收集、分辨率和细化统计的信息。
END 记录表示 PDB 文件的结尾。需要注意的是,虽然 PDB 格式被广泛使用,但由于其年代久远和固定列宽格式,它存在一些限制,这可能导致具有大量原子或需要更高精度的现代结构出现问题。为了解决这些限制,已经开发了一种称为 mmCIF(大分子晶体学信息文件)的更新格式,它为表示大分子结构提供了一个更灵活且可扩展的框架。
尽管开发了 mmCIF 格式,但 PDB 格式仍然很流行,因为它简单易用,并且有大量软件工具支持它。研究人员经常根据他们的需要和他们使用的工具在 PDB 和 mmCIF 格式之间进行转换。PDB 格式的寿命证明了它在结构生物学领域中的基本作用,以及它以相对简单的方式传达复杂结构信息方面的有效性。
为了处理 PDB 文件,科学家们使用各种计算工具。分子可视化软件允许用户加载 PDB 文件并以三维方式查看结构,旋转它们,放大和缩小,并应用不同的渲染样式以更好地理解原子的空间排列。这些工具通常提供其他功能,例如测量距离、角度和二面角、模拟分子动力学以及分析结构内或与潜在配体的相互作用。
PDB 格式在计算生物学和药物发现中也发挥着至关重要的作用。PDB 文件中的结构信息用于同源建模,其中已知相关蛋白质的结构用于预测目标蛋白质的结构。在基于结构的药物设计中,靶蛋白的 PDB 文件用于筛选和优化潜在的药物化合物,然后可以在实验室中合成和测试这些化合物。
PDB 格式的影响超出了个别研究项目。蛋白质数据库本身是一个存储库,目前包含超过 150,000 个结构,并且随着新结构的确定和沉积,它还在不断增长。该数据库是教育的宝贵资源,允许学生探索和了解生物大分子结构。它还作为过去几十年来结构生物学进展的历史记录。
总之,PDB 图像格式是结构生物学领域的关键工具,它提供了一种存储、共享和分析生物大分子三维结构的方法。虽然它有一些限制,但它的广泛采用和为其使用开发的丰富的工具生态系统确保了它在可预见的未来仍将保持关键格式。随着结构生物学领域不断发展,PDB 格式可能会被更高级的格式(如 mmCIF)所补充,但它的遗产将作为现代结构生物学建立的基础而继续存在。
这个转换器完全在您的浏览器中运行。当您选择一个文件时,它将被读入内存并转换为所选格式。 然后,您可以下载转换后的文件。
转换立即开始,大多数文件在一秒钟内完成转换。较大的文件可能需要更长时间。
您的文件永远不会上传到我们的服务器。它们在您的浏览器中转换,然后下载转换后的文件。我们永远看不到您的文件。
我们支持在所有图像格式之间进行转换,包括 JPEG、PNG、GIF、WebP、SVG、BMP、TIFF 等等。
这个转换器完全免费,并将永远免费。因为它在您的浏览器中运行,所以我们不需要为服务器付费,因此我们不需要向您收费。
是的!您可以同时转换尽可能多的文件。只需在添加时选择多个文件即可。