Das PDB-Bildformat (Protein Data Bank) ist kein herkömmliches „Bild“-Format wie JPEG oder PNG, sondern ein Datenformat, das dreidimensionale Strukturinformationen über Proteine, Nukleinsäuren und komplexe Anordnungen speichert. Das PDB-Format ist ein Eckpfeiler der Bioinformatik und Strukturbiologie, da es Wissenschaftlern ermöglicht, die molekularen Strukturen biologischer Makromoleküle zu visualisieren, zu teilen und zu analysieren. Das PDB-Archiv wird von der Worldwide Protein Data Bank (wwPDB) verwaltet, die sicherstellt, dass die PDB-Daten der globalen Gemeinschaft frei und öffentlich zugänglich sind.
Das PDB-Format wurde erstmals in den frühen 1970er Jahren entwickelt, um dem wachsenden Bedarf an einer standardisierten Methode zur Darstellung molekularer Strukturen gerecht zu werden. Seitdem hat es sich weiterentwickelt, um eine Vielzahl molekularer Daten aufzunehmen. Das Format ist textbasiert und kann sowohl von Menschen gelesen als auch von Computern verarbeitet werden. Es besteht aus einer Reihe von Datensätzen, von denen jeder mit einer sechsstelligen Zeilenkennung beginnt, die den in diesem Datensatz enthaltenen Informationstyp angibt. Die Datensätze liefern eine detaillierte Beschreibung der Struktur, einschließlich Atomkoordinaten, Konnektivität und experimenteller Daten.
Eine typische PDB-Datei beginnt mit einem Header-Abschnitt, der Metadaten über die Protein- oder Nukleinsäurestruktur enthält. Dieser Abschnitt enthält Datensätze wie TITLE, der eine kurze Beschreibung der Struktur liefert; COMPND, der die chemischen Komponenten auflistet; und SOURCE, der die Herkunft des biologischen Moleküls beschreibt. Der Header enthält außerdem den AUTHOR-Datensatz, der die Namen der Personen auflistet, die die Struktur bestimmt haben, und den JOURNAL-Datensatz, der einen Verweis auf die Literatur liefert, in der die Struktur erstmals beschrieben wurde.
Nach dem Header enthält die PDB-Datei die primäre Sequenzinformation des Makromoleküls in den SEQRES-Datensätzen. Diese Datensätze listen die Sequenz der Reste (Aminosäuren für Proteine, Nukleotide für Nukleinsäuren) auf, wie sie in der Kette erscheinen. Diese Informationen sind entscheidend, um die Beziehung zwischen der Sequenz eines Moleküls und seiner dreidimensionalen Struktur zu verstehen.
Die ATOM-Datensätze sind wohl der wichtigste Teil einer PDB-Datei, da sie die Koordinaten für jedes Atom im Molekül enthalten. Jeder ATOM-Datensatz enthält die Atom-Seriennummer, den Atomnamen, den Restnamen, die Kettenkennung, die Restsequenznummer und die kartesischen x-, y- und z-Koordinaten des Atoms in Angström. Die ATOM-Datensätze ermöglichen die Rekonstruktion der dreidimensionalen Struktur des Moleküls, die mit spezieller Software wie PyMOL, Chimera oder VMD visualisiert werden kann.
Zusätzlich zu den ATOM-Datensätzen gibt es HETATM-Datensätze für Atome, die Teil von Nicht-Standard-Resten oder Liganden sind, wie z. B. Metallionen, Wassermoleküle oder andere kleine Moleküle, die an das Protein oder die Nukleinsäure gebunden sind. Diese Datensätze sind ähnlich wie ATOM-Datensätze formatiert, werden jedoch unterschieden, um die Identifizierung nicht-makromolekularer Komponenten innerhalb der Struktur zu erleichtern.
Konnektivitätsinformationen werden in den CONECT-Datensätzen bereitgestellt, die die Bindungen zwischen Atomen auflisten. Diese Datensätze sind nicht obligatorisch, da die meisten Software zur Molekülvisualisierung und -analyse die Konnektivität basierend auf den Abständen zwischen Atomen ableiten kann. Sie sind jedoch entscheidend für die Definition ungewöhnlicher Bindungen oder für Strukturen mit Metallkoordinationskomplexen, bei denen die Bindung allein aus den Atomkoordinaten möglicherweise nicht ersichtlich ist.
Das PDB-Format enthält auch Datensätze zur Angabe von Sekundärstrukturelementen wie Alpha-Helices und Beta-Sheets. Die HELIX- und SHEET-Datensätze identifizieren diese Strukturen und liefern Informationen über ihre Position innerhalb der Sequenz. Diese Informationen helfen beim Verständnis der Faltungsmuster des Makromoleküls und sind für vergleichende Studien und Modellierungen unerlässlich.
Experimentelle Daten und Methoden zur Bestimmung der Struktur werden ebenfalls in der PDB-Datei dokumentiert. Datensätze wie EXPDTA beschreiben die experimentelle Technik (z. B. Röntgenkristallographie, NMR-Spektroskopie), während die REMARK-Datensätze eine Vielzahl von Kommentaren und Anmerkungen zur Struktur enthalten können, einschließlich Details zur Datenerfassung, Auflösung und Verfeinerungsstatistik.
Der END-Datensatz kennzeichnet das Ende der PDB-Datei. Es ist wichtig zu beachten, dass das PDB-Format zwar weit verbreitet ist, aber aufgrund seines Alters und des festen Spaltenbreitenformats einige Einschränkungen aufweist, die zu Problemen mit modernen Strukturen führen können, die eine große Anzahl von Atomen aufweisen oder eine höhere Präzision erfordern. Um diese Einschränkungen zu beheben, wurde ein aktualisiertes Format namens mmCIF (makromolekulare kristallographische Informationsdatei) entwickelt, das ein flexibleres und erweiterbares Framework zur Darstellung makromolekularer Strukturen bietet.
Trotz der Entwicklung des mmCIF-Formats bleibt das PDB-Format aufgrund seiner Einfachheit und der Vielzahl von Softwaretools, die es unterstützen, beliebt. Forscher konvertieren je nach Bedarf und den von ihnen verwendeten Tools häufig zwischen PDB- und mmCIF-Formaten. Die Langlebigkeit des PDB-Formats ist ein Beweis für seine grundlegende Rolle im Bereich der Strukturbiologie und seine Wirksamkeit bei der Vermittlung komplexer Strukturinformationen auf relativ einfache Weise.
Um mit PDB-Dateien zu arbeiten, verwenden Wissenschaftler eine Vielzahl von Computertools. Mit Molekülvisualisierungssoftware können Benutzer PDB-Dateien laden und die Strukturen in drei Dimensionen anzeigen, sie drehen, hinein- und herauszoomen und verschiedene Rendering-Stile anwenden, um die räumliche Anordnung der Atome besser zu verstehen. Diese Tools bieten oft zusätzliche Funktionen wie das Messen von Abständen, Winkeln und Diederwinkeln, die Simulation von Moleküldynamik und die Analyse von Wechselwirkungen innerhalb der Struktur oder mit potenziellen Liganden.
Das PDB-Format spielt auch eine entscheidende Rolle in der Computerbiologie und Wirkstoffforschung. Strukturinformationen aus PDB-Dateien werden in der Homologiemodellierung verwendet, bei der die bekannte Struktur eines verwandten Proteins verwendet wird, um die Struktur eines interessierenden Proteins vorherzusagen. Beim strukturbasierten Wirkstoffdesign werden PDB-Dateien von Zielproteinen verwendet, um potenzielle Wirkstoffverbindungen zu screenen und zu optimieren, die dann im Labor synthetisiert und getestet werden können.
Die Auswirkungen des PDB-Formats gehen über einzelne Forschungsprojekte hinaus. Die Protein Data Bank selbst ist ein Archiv, das derzeit über 150.000 Strukturen enthält und ständig wächst, wenn neue Strukturen bestimmt und hinterlegt werden. Diese Datenbank ist eine unschätzbare Ressource für die Bildung, die es den Schülern ermöglicht, die Strukturen biologischer Makromoleküle zu erforschen und kennenzulernen. Es dient auch als historische Aufzeichnung des Fortschritts in der Strukturbiologie in den letzten Jahrzehnten.
Zusammenfassend lässt sich sagen, dass das PDB-Bildformat ein entscheidendes Werkzeug im Bereich der Strukturbiologie ist, das ein Mittel zur Speicherung, Weitergabe und Analyse der dreidimensionalen Strukturen biologischer Makromoleküle bietet. Obwohl es einige Einschränkungen aufweist, stellen seine weit verbreitete Akzeptanz und die Entwicklung eines umfangreichen Ökosystems von Tools für seine Verwendung sicher, dass es auf absehbare Zeit ein wichtiges Format bleiben wird. Da sich das Gebiet der Strukturbiologie weiterentwickelt, wird das PDB-Format wahrscheinlich durch fortschrittlichere Formate wie mmCIF ergänzt, aber sein Vermächtnis wird als Grundlage, auf der die moderne Strukturbiologie aufbaut, Bestand haben.
Dieser Konverter läuft vollständig in Ihrem Browser. Wenn Sie eine Datei auswählen, wird sie in den Speicher geladen und in das ausgewählte Format konvertiert. Sie können dann die konvertierte Datei herunterladen.
Konvertierungen starten sofort und die meisten Dateien werden in weniger als einer Sekunde konvertiert. Größere Dateien können länger dauern.
Ihre Dateien werden niemals auf unsere Server hochgeladen. Sie werden in Ihrem Browser konvertiert und die konvertierte Datei wird dann heruntergeladen. Wir sehen Ihre Dateien nie.
Wir unterstützen die Konvertierung zwischen allen Bildformaten, einschließlich JPEG, PNG, GIF, WebP, SVG, BMP, TIFF und mehr.
Dieser Konverter ist komplett kostenlos und wird immer kostenlos sein. Da er in Ihrem Browser läuft, müssen wir keine Server bezahlen, daher müssen wir Ihnen keine Gebühren berechnen.
Ja! Sie können so viele Dateien gleichzeitig konvertieren, wie Sie möchten. Wählen Sie einfach mehrere Dateien aus, wenn Sie sie hinzufügen.