Protein Data Bank

A Wikipédiából, a szabad enciklopédiából
Protein Data Bank
Vállalkozás típusakrisztallográfiai adatbázis
Oldal típusakrisztallográfiai adatbázis
Elérhető nyelv(ek)angol
Alapítva1971
URLwww.wwpdb.org
A Wikimédia Commons tartalmaz Protein Data Bank témájú médiaállományokat.

A Protein Data Bank (PDB)[1] nagy biomolekulák, például fehérjék és nukleinsavak háromdimenziós szerkezeti adatait tartalmazó adatbázis. A jellemzően röntgenkrisztallográfiával, NMR-spektroszkópiával vagy krioelektronmikroszkópiával szerzett, biológusok és biokémikusok által gyűjtött adat szabadon elérhető az interneten tagszervezetei, a PDBe,[2] a PDBj,[3] az RCSB[4] és a BMRB[5] útján. A PDB-t a Worldwide Protein Data Bank (wwPDB) felügyeli.

A PDB fontos a szerkezeti biológia területein, például a szerkezeti genomikában. A legtöbb nagy tudományos folyóirat és társaság a kutatóknak megköveteli a szerkezeti adatok elküldését a PDB-be. Számos adatbázis használ a PDB-ben lévő fehérjeszerkezeteket. Például a SCOP és a CATH fehérjeszerkezeteket csoportosítanak, a PDBsum a PDB-bejegyzések grafikus megjelenítését mutatja más forrásokból származó (például génontológiai) információ révén.[6][7]

Történet[szerkesztés]

Két oka volt a PDB létrehozásának: a röntgendiffrakcióval meghatározott kevés, de egyre növekvő mennyiségű fehérjeszerkezeti adat, valamint az 1968-ban megjelent molekuláris kijelző, a Brookhaven Raster Display (BRAD), mely képes volt e szerkezeteket 3D-ben megjeleníteni. 1969-ben Walter Hamilton segítségével a Brookhaven National Laboratorynél Edgar Meyer (Texas A&M University) szoftvert kezdett írni az atomi koordináták közös formátumban való tárolására geometriai és grafikai elemzéshez. 1971-től Meyer SEARCH-e lehetővé tette az adatbázisban lévő információ távoli hozzáférését a fehérjeszerkezetek hálózaton kívüli tanulmányozásához.[8] Ez a hálózatban fontos volt, így ekkor indult el ténylegesen a PDB.

A Protein Data Banket 1971 októberében jelentették be a Nature New Biologyban[9] a Cambridge Crystallographic Data Centre (Egyesült Királyság) és a Brookhaven National Laboratory együttműködésével.

Hamilton halálakor (1973) Tom Koeztle lett a PDB vezetője az ezt követő 20 évre. 1994 januárjában az izraeli Weizmann Kutatóintézetnél dolgozó Joel Sussman lett a PDB vezetője. 1998 októberében[10] a PDB a Research Collaboratory for Structural Bioinformaticshez (RCSB) került;[11] ez 1999 júniusában ért véget. Új vezetője az RCSB egyik vezető intézeténél, a Rutgers Egyetemnél (a másik a San Diegó-i Számítási Központ volt) dolgozó Helen M. Berman lett.[12] 2003-ban a wwPDB létrejöttével a PDB nemzetközi szervezetté vált. Alapító tagjai a PDBe (Európa),[2] az RCSB (Amerikai Egyesült Államok) és a PDBj (Japán) voltak.[3] A BMRB[5] 2006-ban csatlakozott. A wwPDB mind a 4 tagja gyűjthet, feldolgozhat és eloszthat PDB-adatokat. Az adatfeldolgozás arra utal, hogy a wwPDB dolgozói ellenőriznek és jelölnek minden beküldött adatot.[13] Az adatokat ezután automatikusan ellenőrzi egy nyílt forráskódú szoftver, hogy lehetségesek-e.[14]

Tartalom[szerkesztés]

PDB-ben lévő fehérjeszerkezetek példái (UCSF Chimerával készítve)
Fehérjeszerkezetek meghatározásának sebessége módszerenként és évenként. MX = makromolekuláris krisztallográfia, 3DEM = 3D-elektronmikroszkópia.[15]

A PDB szerdánként (UTC) frissül a listájával együtt.[16] 2023. január 10-én a PDB-ben az alábbiak voltak:

Kísérleti módszer Csak fehérjék Fehérjék oligoszacharidokkal Fehérje-nukleinsav komplexek Csak nukleinsavak Egyéb Csak oligoszacharidok Összesen
Röntgendiffrakció
152 277
8 969
8 027
2 566
163
11
172 013
NMR
12 104
32
281
1 433
31
6
13 887
Krioelektron-mikroszkópia
9 226
1 633
2 898
77
8
0
13 842
Hibrid
189
7
6
12
}
0
1
215
Neutron
72
1
0
2
0
0
75
Egyéb
32
0
0
1
0
4
309
Összesen
173 900
10 642
11 212
4 091
202
22
200 069

162 041 szerkezetnek van szerkezetifaktor-, 11 242-nek NMR-korlátozási, 5774-nek kémiaieltolódás-, 13 388-nak 3DEM-leképezési fájlja az EM Data Bankben.

A legtöbb szerkezetet röntgendiffrakcióval, mintegy 7%-ukat fehérje-NMR-rel határozták meg. A röntgendiffrakció a fehérje atomjainak koordinátáinak, az NMR az atompárok távolságainak közelítő értékét határozza meg. A fehérje konformációja NMR-ből kapható meg távolsággeometriai probléma megoldásával. 2013 után egyre több fehérje szerkezetét határozták meg krioelektron-mikroszkópiával.

A röntgendiffrakcióval meghatározott szerkezetek esetén elektronsűrűségi térképük is megtekinthető a három PDB-oldalon.

A PDB-ben lévő szerkezetek száma eleinte igen gyorsan nőtt: 1982-ben 100, 1993-ban 1000, 1999-ben 10 000, 2014-ben 100 000, 2023 januárjában 200 000 regisztrált szerkezet volt.[17][18]

Fájlformátum[szerkesztés]

A PDB által kezdetben használt fájlformátum a PDB fájlformátum volt. Ezt a soronként 80 karakteres lyukkártyaszélesség korlátozta. 1996-ban bevezették az mmCIF (macromolecular Crystallographic Information file) formátumot, mely a CIF kiterjesztése. Ez lett 2014-ben a PDB archívum szabványos formátuma.[19] In 2019, the wwPDB announced that depositions for crystallographic methods would only be accepted in mmCIF format.[20]

A PDB XML-változata, a PDBML 2005-ben jelent meg.[21] A szerkezeti fájlok az alábbi formátumok bármelyikében elérhetők, de egyre több szerkezet nem fér el az eredeti formátumba. Az egyes fájlok az könnyen letölthetők grafikus csomagokként:

  • PDB-formátumú fájlokhoz a címek formátuma például: https://www.pdb.org/pdb/files/4hhb.pdb.gz vagy https://pdbe.org/download/4hhb.
  • PDBML-fájlok címeinek formátuma például https://www.pdb.org/pdb/files/4hhb.xml.gz vagy https://pdbe.org/pdbml/4hhb.

A „4hhb” a PDB-azonosító. A PDB-ben közzétett szerkezetek 4 karakteres alfanumerikus PDB-azonosítót kapnak. Ez nem egyedi azonosító: egy molekula több eltérő környezetben vagy konformációban lévő szerkezete eltérő azonosítót kaphat.

Adatmegtekintés[szerkesztés]

A szerkezeti fájlok számos szabad szoftverrel, például Jmollal, Pymollal, VMD-vel, Molstarral és Rasmollal megtekinthetők. Nem szabad, shareware programok például az ICM-Browser,[22] a MDL Chime, a UCSF Chimera, a Swiss-PDB Viewer,[23] a StarBiochem[24] (Java-alapú interaktív molekulamegtekintő beépített PDB-keresővel), a Sirius, a VisProt3DS[25] (3D-sztereoszkóp nézetben való fehérjevizualizáció anaglif és más módokban) és a Discovery Studio. Az RCSB weblapja szabad és kereskedelmi molekulavizualizációs programokat és beépülőket tartalmazó listát is tartalmaz.

Jegyzetek[szerkesztés]

  1. (2019) „Protein Data Bank: the single global archive for 3D macromolecular structure data”. Nucleic Acids Res. 47 (D1), 520–528. o, Kiadó: wwPDB Consortium. DOI:10.1093/nar/gky949. PMID 30357364.  
  2. a b PDBe home < Node < EMBL-EBI. pdbe.org
  3. a b Protein Data Bank Japan – PDB Japan – PDBj. pdbj.org
  4. RCSB PDB: Homepage. rcsb.org . RCSB Protein Data Bank
  5. a b Biological Magnetic Resonance Bank. bmrb.wisc.edu
  6. Berman, H. M. (2008. január 1.). „The Protein Data Bank: a historical perspective”. Acta Crystallographica Section A A64 (1), 88–95. o. DOI:10.1107/S0108767307035623. PMID 18156675.  
  7. Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (1997. december 1.). „PDBsum: a Web-based database of summaries and analyses of all PDB structures”. Trends Biochem. Sci. 22 (12), 488–90. o. DOI:10.1016/S0968-0004(97)01140-7. PMID 9433130.  
  8. Meyer EF (1997). „The first years of the Protein Data Bank”. Protein Science 6 (7), 1591–1597. o, Kiadó: Cambridge University Press. DOI:10.1002/pro.5560060724. PMID 9232661.  
  9. (1971) „Protein Data Bank”. Nature New Biology 233. DOI:10.1038/newbio233223b0.  
  10. Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (2000. január 1.). „The Protein Data Bank”. Nucleic Acids Res. 28 (1), 235–242. o. DOI:10.1093/nar/28.1.235. PMID 10592235.  
  11. Research Collaboratory for Structural Bioinformatics. RCSB.org . Research Collaboratory for Structural Bioinformatics. [2007. február 5-i dátummal az eredetiből archiválva].
  12. RCSB PDB Newsletter Archive. RCSB Protein Data Bank
  13. Curry E, Freitas A, O'Riáin S.szerk.: D. Wood: The Role of Community-Driven Data Curation for Enterprises, Linking Enterprise Data. Boston: Springer US, 25–47. o. (2010). ISBN 978-1-441-97664-2 
  14. PDB Validation Suite. sw-tools.pdb.org . [2016. március 3-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. november 29.)
  15. Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD, etal (2019. január 1.). „Protein Data Bank: the single global archive for 3D macromolecular structure data”. Nucleic Acids Research 47 (D1), D520–D528. o. DOI:10.1093/nar/gky949. PMID 30357364.  
  16. PDB Current Holdings Breakdown. RCSB. [2007. július 4-i dátummal az eredetiből archiválva]. (Hozzáférés: 2007. július 2.)
  17. Ismeretlen szerző (2014). „Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures”. Nature 509 (7500), 260. o. DOI:10.1038/509260a. PMID 24834514.  
  18. PDB Statistics: Overall Growth of Released Structures Per Year. www.rcsb.org . (Hozzáférés: 2023. január 12.)
  19. wwPDB: File Formats and the PDB. wwpdb.org . (Hozzáférés: 2020. április 1.)
  20. wwPDB.org: wwPDB: 2019 News. wwpdb.org
  21. Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM (2005. április 1.). „PDBML: the representation of archival macromolecular structure data in XML”. Bioinformatics 21 (7), 988–992. o. DOI:10.1093/bioinformatics/bti082. PMID 15509603.  
  22. ICM-Browser. Molsoft L.L.C.. (Hozzáférés: 2013. április 6.)
  23. Swiss PDB Viewer. Swiss Institute of Bioinformatics. (Hozzáférés: 2013. április 6.)
  24. STAR: Biochem - Home. web.mit.edu
  25. VisProt3DS. Molecular Systems Ltd. (Hozzáférés: 2013. április 6.)

Fordítás[szerkesztés]

Ez a szócikk részben vagy egészben a Protein Data Bank című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

Kapcsolódó szócikkek[szerkesztés]

További információk[szerkesztés]