EXIF(可交换图像文件格式)是相机和手机嵌入到图像文件中的捕获元数据的区块,如曝光、镜头、时间戳,甚至GPS。它使用打包在JPEG和TIFF等格式中的TIFF风格标签系统。它对于照片库中的可搜索性、排序和自动化至关重要,但如果粗心共享,也可能成为无意的泄漏路径(ExifTool和Exiv2使其易于检查)。
在底层,EXIF重用TIFF的图像文件目录(IFD)结构,在JPEG中,它位于APP1标记(0xFFE1)内,有效地将一个小的TIFF文件嵌套在JPEG容器中(JFIF概述;CIPA规范门户)。官方规范——CIPA DC-008(EXIF),目前为3.x版——记录了IFD布局、标签类型和约束(CIPA DC-008;规范摘要)。EXIF定义了一个专用的GPS子IFD(标签0x8825)和一个互操作性IFD(0xA005)(Exif标签表)。
实现细节很重要。典型的JPEG以JFIF APP0段开始,后跟APP1中的EXIF。旧的阅读器首先期望JFIF,而现代库则可以毫无问题地解析两者(APP段说明)。在实践中,解析器有时会假设规范不要求的APP顺序或大小限制,因此,工具的开发者会记录下一些特殊的行为和边缘情况(Exiv2元数据指南;ExifTool文档)。
EXIF不限于JPEG/TIFF。PNG生态系统标准化了eXIf块以在PNG文件中携带EXIF数据(支持正在增长,并且块相对于IDAT的排序在某些实现中可能很重要)。WebP是一种基于RIFF的格式,可在专用块中容纳EXIF、XMP和ICC(WebP RIFF容器;libwebp)。在Apple平台上,Image I/O在转换为HEIC/HEIF时会保留EXIF数据,以及XMP数据和制造商信息(kCGImagePropertyExifDictionary)。
如果您想知道应用程序如何推断相机设置,EXIF的标签映射就是答案:Make、Model、FNumber、ExposureTime、ISOSpeedRatings、FocalLength、MeteringMode、等都存在于主IFD和EXIF子IFD中(Exif标签;Exiv2标签)。Apple通过Image I/O常量(如 ExifFNumber 和 GPSDictionary)公开这些。 在Android上, AndroidX ExifInterface 可以跨JPEG、PNG、WebP和HEIF读取和写入EXIF数据。
方向值得特别一提。大多数设备将像素存储为“拍摄时”的状态,并记录一个标签,告诉查看器如何在显示时旋转。 这就是标签274(Orientation),其值如1(正常)、6(顺时针90°)、3(180°)、8(270°)。不遵守或错误地更新此标签会导致照片旋转、缩略图不匹配以及后续处理阶段的机器学习错误 (方向标签;实用指南). 在处理流程中,通常会通过物理旋转像素并将Orientation设置为1来进行规范化 (ExifTool).
计时比看起来要复杂。像DateTimeOriginal这样的历史标签缺少时区,这使得跨界拍摄变得模棱两可。 较新的标签添加了时区信息,例如OffsetTimeOriginal,因此软件可以记录DateTimeOriginal加上UTC偏移量(例如-07:00),以便进行准确的排序和地理关联 (OffsetTime*标签;标签概述).
EXIF与IPTC照片元数据(标题、创作者、权利、主题)和XMP(Adobe的基于RDF的框架,已标准化为ISO 16684-1)共存,有时甚至重叠。 在实践中,正确实现的软件会协调相机创作的EXIF数据和用户创作的IPTC/XMP数据,而不会丢弃任何一个 (IPTC指南;LoC关于XMP;LoC关于EXIF).
隐私问题使EXIF成为一个有争议的话题。地理标签和设备序列号不止一次地暴露了敏感位置;一个著名的例子是2012年Vice杂志上John McAfee的照片,据报道,其中的EXIF GPS坐标暴露了他的行踪 (Wired;The Guardian). 许多社交平台在上传时会删除大部分EXIF数据,但实现方式各不相同,并且会随着时间的推移而变化。建议通过下载您自己的帖子并使用 适当的工具进行检查来验证 (Twitter媒体帮助;Facebook帮助;Instagram帮助).
安全研究人员也密切关注EXIF解析器。广泛使用的库(例如libexif)中的漏洞包括由格式错误的标签触发的缓冲区溢出和越界读取。因为EXIF是 可预测位置的结构化二进制文件,所以很容易制作这些标签 (公告;NVD搜索). 如果从不受信任的来源接收文件,保持元数 据相关库的更新并在隔离环境(沙盒)中处理图像是非常重要的。
如果使用得当,EXIF是连接照片目录、权利工作流程和计算机视觉管道的关键元素。如果使用不当,它就成了您可能不想分享的数字足迹。好消息是:生态系统——规范、操作系统API和工具——为您提供了所需的控制 (CIPA EXIF;ExifTool;Exiv2;IPTC;XMP).
EXIF(可交换图像文件格式)数据是关于照片的一系列元数据,例如相机设置、拍摄日期和时间,以及在GPS启用时的位置信息。
大多数图像查看器和编辑器(例如Adobe Photoshop、Windows照片查看器)都允许查看EXIF数据。通常只需打开文件的属性或信息面板即可。
是的,可以使用Adobe Photoshop、Lightroom等专用软件或易于使用的在线工具来编辑EXIF数据,从而修改或删除特定的元数据字段。
是的。如果GPS已启用,存储在EXIF元数据中的位置数据可能会 泄露敏感的地理信息。因此,建议在分享照片前删除或匿名化这些数据。
许多软件都提供了删除EXIF数据的功能。这个过程通常被称为“元数据移除”。也有提供此功能的在线工具。
大多数社交媒体平台,如Facebook、Instagram和Twitter,为了保护用户隐私,会自动从图像中删除EXIF数据。
EXIF数据可以包括相机型号、拍摄日期和时间、焦距、曝光时间、光圈、ISO设置、白平衡和GPS位置等信息。
对于摄影师来说,EXIF数据是了解照片具体拍摄设置的宝贵指南。这些信息有助于改进技术并在未来重现相似的拍摄条件。
不,只有使用支持EXIF元数据的设备(如数码相机和智能手机)拍摄的图像才会包含这些数据。
是的,EXIF数据遵循日本电子工业发展协会(JEIDA)制定的标准。但是,一些制造商可能会添加额外的专有信息。
蛋白质数据库(PDB)图像 格式不是像 JPEG 或 PNG 这样的传统“图像”格式,而是一种数据格式,用于存储有关蛋白质、核酸和复杂组件的三维结构信息。PDB 格式是生物信息学和结构生物学的基础,因为它允许科学家可视化、共享和分析生物大分子分子结构。PDB 档案由全球蛋白质数据库(wwPDB)管理,它确保 PDB 数据对全球社区免费且公开。
PDB 格式最初开发于 20 世纪 70 年代初,以满足对表示分子结构的标准化方法日益增长的需求。从那时起,它已发展到可容纳各种分子数据。该格式基于文本,人类可以阅读,计算机也可以处理。它由一系列记录组成,每个记录都以一个六个字符的行标识符开头,该标识符指定该记录中包含的信息类型。这些记录提供了结构的详细描述,包括原子坐标、连通性和实验数据。
典型的 PDB 文件以头部分节开头,其中包括有关蛋白质或核酸结构的元数据。此部分包含诸如 TITLE(提供结构的简要说明)、COMPND(列出化学成分)和 SOURCE(描述生物分子的来源)之类的记录。标题还包括 AUTHOR 记录,其中列出了确定结构的人员姓名,以及 JOURNAL 记录,其中提供了首次描述结构的文献引用。
在标题之后,PDB 文件包含 SEQRES 记录中大分子的一级序列信息。这些记录列出了残基序列(蛋白质的氨基酸,核酸的核苷酸),因为它们出现在链中。此信息对于理解分子的序列与其三维结构之间的关系至关重要。
ATOM 记录可以说是 PDB 文件中最重要的部分,因为它们包含分子中每个原子的坐标。每个 ATOM 记录包括原子序列号、原子名称、残基名称、链标识符、残基序列号以及原子在埃中的 x、y 和 z 笛卡尔坐标。ATOM 记录允许重建分子的三维结构,可以使用专门的软件(例如 PyMOL、Chimera 或 VMD)对其进行可视化。
除了 ATOM 记 录之外,还有用于非标准残基或配体(例如金属离子、水分子或与蛋白质或核酸结合的其他小分子)中原子的 HETATM 记录。这些记录的格式与 ATOM 记录类似,但有所区别,以便于识别结构中非大分子成分。
连通性信息在 CONECT 记录中提供,其中列出了原子之间的键。这些记录不是必需的,因为大多数分子可视化和分析软件可以根据原子之间的距离推断连通性。但是,它们对于定义不寻常的键或具有金属配位配合物的结构至关重要,其中仅从原子坐标可能无法明显看出键合。
PDB 格式还包括用于指定二级结构元素(例如 α 螺旋和 β 折叠)的记录。HELIX 和 SHEET 记录识别这些结构并提供有关它们在序列中位置的信息。此信息有助于理解大分子折叠模式,对于比较研究和建模至关重要。
确定结构的实验数据和方法也记录在 PDB 文件中。诸如 EXPDTA 之类的记录描述了实验技术(例如 X 射线晶体学、核磁共振光谱),而 REMARK 记录可以包含有关结构的各种注释和注释,包括有关数据收集、分辨率和细化统计的信息。
END 记录表示 PDB 文件的结尾。需要注意的是,虽然 PDB 格式被广泛使用,但由于其年代久远和固定列宽格式,它存在一些限制,这可能导致具有大量原子或需要更高精度的现代结构出现问题。为了解决这些限制,已经开发了一种称为 mmCIF(大分子晶体学信息文件)的更新格式,它为表示大分子结构提供了一个更灵活且可扩展的框架。
尽管开发了 mmCIF 格式,但 PDB 格式仍然很流行,因为它简单易用,并且有大量软件工具支持它。研究人员经常根据他们的需要和他们使用的工具在 PDB 和 mmCIF 格式之间进行转换。PDB 格式的寿命证明了它在结构生物学领域中的基本作用,以及它以相对简单的方式传达复杂结构信息 方面的有效性。
为了处理 PDB 文件,科学家们使用各种计算工具。分子可视化软件允许用户加载 PDB 文件并以三维方式查看结构,旋转它们,放大和缩小,并应用不同的渲染样式以更好地理解原子的空间排列。这些工具通常提供其他功能,例如测量距离、角度和二面角、模拟分子动力学以及分析结构内或与潜在配体的相互作用。
PDB 格式在计算生物学和药物发现中也发挥着至关重要的作用。PDB 文件中的结构信息用于同源建模,其中已知相关蛋白质的结构用于预测目标蛋白质的结构。在基于结构的药物设计中,靶蛋白的 PDB 文件用于筛选和优化潜在的药物化合物,然后可以在实验室中合成和测试这些化合物。
PDB 格式的影响超出了个别研究项目。蛋白质数据库本身是一个存储库,目前包含超过 150,000 个结构,并且随着新结构的确定和沉积,它还在不断增长。该数据库是教育的宝贵资源,允许学生探索和了解生物大分子结构。它还作为过去几十年来结构生物学进展的历史记录。
总之,PDB 图像格式是结构生物学领域的关键工具,它提供了一种存储、共享和分析生物大分子三维结构的方法。虽然它有一些限制,但它的广泛采用和为其使用开发的丰富的工具生态系统确保了它在可预见的未来仍将保持关键格式。随着结构生物学领域不断发展,PDB 格式可能会被更高级的格式(如 mmCIF)所补充,但它的遗产将作为现代结构生物学建立的基础而继续存在。
这个转换器完全在您的浏览器中运行。当您选择一个文件时,它将被读入内存并转换为所选格式。 然后,您可以下载转换后的文件。
转换立即开始,大多数文件在一秒钟内完成转换。较大的文件可能需要更长时间。
您的文件永远不会上传到我们的服务器。它们在您的浏览器 中转换,然后下载转换后的文件。我们永远看不到您的文件。
我们支持在所有图像格式之间进行转换,包括 JPEG、PNG、GIF、WebP、SVG、BMP、TIFF 等等。
这个转换器完全免费,并将永远免费。因为它在您的浏览器中运行,所以我们不需要为服务器付费,因此我们不需要向您收费。
是的!您可以同时转换尽可能多的文件。只需在添加时选择多个文件即可。