Rfam

A Wikipédiából, a szabad enciklopédiából
Rfam

Kategóriabiológiai adatbázis
LicencKözkincs
A Rfam weboldala

Az Rfam nem kódoló RNS- (ncRNS-) családokról és más strukturált RNS-ekről szóló információt tartalmazó adatbázis. Jelölt, nyílt hozzáférésű adatbázis, melyet a Wellcome Trust Sanger Institute fejlesztett a Janelia Farmmal együttműködve,[1][2][3][4] és jelenleg a European Bioinformatics Institute működteti.[5] Az Rfam a fehérjecsaládokat leíró Pfamhez hasonlóan működik.

A fehérjékkel szemben az ncRNS-ek másodlagos szerkezete hasonló lehet elsődleges szerkezetükben lévő jelentős hasonlóság nélkül. Az Rfam az ncRNS-eket közös ősük alapján sorolja be. E családok többszekvenciás rendezése (MSA) lehetővé teszi a szerkezetük és működésük megismerését, hasonlóan a fehérjecsaládokhoz. Ezen MSA-k hasznos lehet a másodlagos szerkezetről szóló információ hozzáadásával.[4][6]

Használata[szerkesztés]

Az Rfam számos célra használható. Minden ncRNS-család esetén lehetővé teszi a szekvenciahasonlóságok megtekintését és letöltését, a jelölések olvasását és a családtagok eloszlását fajokban. Ezenkívül irodalmi forrásokra és más RNS-adatbázisokra is vannak linkek. Az Rfam ezenkívül hivatkozásokat is biztosít a Wikipédia számára, lehetővé téve a bejegyzések felhasználók általi létrehozását vagy szerkesztését.

Az Rfam felülete lehetővé teszi ncRNS-ek kulcsszó, családnév, genom, ncRNS-szekvencia vagy EMBL-hozzáférésiszám szerinti keresését.[7] Az adatbázis-információ továbbá használható INFERNAL szoftvercsomaggal.[8][9][10] Az INFERNAL továbbá használható az Rfammel szekvenciák vagy teljes genomok ismert ncRNS-ekkel való homológjainak keresésére.

Módszerek[szerkesztés]

Elméleti ncRNS-egyeztetés 6 fajból. A másodlagosszerkezet-bázispárok blokkokban színezve, és a másodlagos szerkezet konszenzusszakaszában (alul) találhatók a < és > szimbólumok közt.

Az adatbázisban az elsődleges szekvencia és másodlagos szerkezet MSA által képviselt információi a profilok sztochasztikus kontextusmentes nyelvtanaival (SCFG), más néven kovarianciamodellekkel együtt van jelen. Ezek a Pfamben használt fehérjecsalád-jelölés rejtett Markov-modelljeinek analógjai.[1] Az adatbázis családjait két többszekvenciás egyezés képviseli Stockholm-formátumban és egy SCFG.

Az első MSA a „mag”. Ez kézzel ellenőrzött, az ncRNS-család képviselőit szerkezeti információval együtt tartalmazó MSA. Ezt használják fel SCFG létrehozására, melyet az INFERNAL a további családtagok azonosítására és hozzáadására használ. A hamis pozitívok elkerüléséhez családspecifikus küszöbérték használatos.

A 12. verzióig az Rfam BLAST szűrőlépést használt, mivel a profil-SCFG-k túl számításigényesek voltak. Azonban a későbbi INFERNAL-verziók elég gyorsak,[10] így a BLAST-lépés nem szükséges.[11]

A második MSA a „teljes” elrendezés, és a szekvencia-adatbázis kovarianciamodelles keresésével jön létre. Minden észlelt homológot a modellhez rendeznek az automatikusan előállított teljes elrendezést adva.

Története[szerkesztés]

Az Rfam 1.0 2003-ban jelent meg, és 25 ncRNS-csaláot és 50 000 ncRNS-gént tartalmazott. 2005-ben jelent meg a 379 családban több mint 280 000 gént tartalmazó Rfam 6.1. A 2012 augusztusában megjelent Rfam 11.0 2208, a 2022 novemberében megjelent 14.9 4108 családot tartalmaz.[7]

Fő kiadások és publikációk[szerkesztés]

  • 2003 - Rfam: an RNA family database.[1]
  • 2005 - Rfam: annotating non-coding RNAs in complete genomes.[2]
  • 2008 - The RNA WikiProject: community annotation of RNA families.[6]
  • 2008 - Rfam: updates to the RNA families database.[3]
  • 2011 - Rfam: Wikipedia, clans and the “decimal” release.[4]
  • 2012 - Rfam 11.0: 10 years of RNA families.[12]
  • 2014 - Rfam 12.0: updates to the RNA families database. [3]
  • 2017 - Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families.[13]
  • 2020 - Rfam 14: expanded coverage of metagenomic, viral and microRNA families.[14]

Rfamet használó szoftverek[szerkesztés]

A miRNS-leíró adatbázis 2004-ben jelent meg. Ez ViennaRNA-t használ a miRNS-ek bázispárosodásának előrejelzésére.[15]

A miRBase 2002-ben jelent meg, célja a miRNS és az NGS ismeretének alkalmazása a miRNS-ek stabil, konzisztens elnevezéséhez. A 21. kiadás (2014) 28 645 prekurzor miRNS-t és 35 828 termék miRNS-t tartalmaz 223 fajból.[16]

Az RNAiFold egyéni és Rfam-alapú RNS-ek tervezését teszi lehetővé.[17] Az RNAiFold 1.0 2013-ban, a 2.0 2015-ben jelent meg,[17] a 3.0 2016 januárjában, a 3.1 2016 márciusában.[18]

Problémák[szerkesztés]

  1. A magasabb szintű eukarióták számos ncRNS-ből származó pszeudogént és ismétlődést tartalmaznak. E nem működő anyagok megkülönböztetése a működő ncRNS-től nehéz.[2]
  2. A kovarianciamodellek nem modelleznek intronokat.

Jegyzetek[szerkesztés]

  1. a b c Griffiths-Jones S, Bateman A, Marshall M, Khanna A, Eddy SR (2003). „Rfam: an RNA family database”. Nucleic Acids Res. 31 (1), 439–41. o. DOI:10.1093/nar/gkg006. PMID 12520045.  
  2. a b c Griffiths-Jones S, Moxon S, Marshall M, Khanna A, Eddy SR, Bateman A (2005). „Rfam: annotating non-coding RNAs in complete genomes”. Nucleic Acids Res. 33 (Database issue), D121–4. o. DOI:10.1093/nar/gki081. PMID 15608160.  
  3. a b c Gardner PP, Daub J, Tate JG et al. (2008. október 1.). „Rfam: updates to the RNA families database”. Nucleic Acids Research 37 (Database issue), D136–D140. o. DOI:10.1093/nar/gkn766. PMID 18953034.  
  4. a b c Gardner PP, Daub J, Tate J, Moore BL, Osuch IH, Griffiths-Jones S, Finn RD, Nawrocki EP, Kolbe DL, Eddy SR, Bateman A (2011). „Rfam: Wikipedia, clans and the "decimal" release.”. Nucleic Acids Res 39 (Database issue), D141–5. o. DOI:10.1093/nar/gkq1129. PMID 21062808.  
  5. Moving to xfam.org. Xfam Blog. (Hozzáférés: 2014. május 3.)
  6. a b Daub J, Gardner PP, Tate J, Ramsköld D, Manske M, Scott WG, Weinberg Z, Griffiths-Jones S, Bateman A (2008. december 1.). „The RNA WikiProject: community annotation of RNA families”. RNA 14 (12), 2462–4. o. DOI:10.1261/rna.1200508. PMID 18945806.  
  7. a b Rfam families. rfam.xfam.org
  8. Eddy SR, Durbin R (1994. június 1.). „RNA sequence analysis using covariance models”. Nucleic Acids Research 22 (11), 2079–88. o. DOI:10.1093/nar/22.11.2079. PMID 8029015.  
  9. Eddy SR (2002). „A memory-efficient dynamic programming algorithm for optimal alignment of a sequence to an RNA secondary structure”. BMC Bioinformatics 3, 18. o. DOI:10.1186/1471-2105-3-18. PMID 12095421.  
  10. a b Nawrocki EP, Eddy SR (2013). „Infernal 1.1: 100-fold faster RNA homology searches”. Bioinformatics 29 (22), 2933–5. o. DOI:10.1093/bioinformatics/btt509. PMID 24008419.  
  11. Nawrocki EP, Burge SW, Bateman A, Daub J, Eberhardt RY, Eddy SR, Floden EW, Gardner PP, Jones TA, Tate J, Finn RD (2015. január 1.). „Rfam 12.0: updates to the RNA families database”. Nucleic Acids Res 43 (Database issue), D130–7. o. DOI:10.1093/nar/gku1063. PMID 25392425.  
  12. Burge SW, Daub J, Eberhardt R, Tate J, Barquist L, Nawrocki EP, Eddy SR, Gardner PP, Bateman A (2013. január 1.). „Rfam 11.0: 10 years of RNA families”. Nucleic Acids Res 41 (Database issue), D226–32. o. DOI:10.1093/nar/gks1005. PMID 23125362.  
  13. Kalvari I, Argasinska J, Quinones-Olvera N, Nawrocki EP, Rivas E, Eddy SR, Bateman A, Finn RD, Petrov AI (2018. január 1.). „Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families”. Nucleic Acids Res 46 (D1), D335–D342. o. DOI:10.1093/nar/gkx1038. PMID 29112718.  
  14. Kalvari I, Nawrocki EP, Ontiveros-Palacios N, Argasinska J, Lamkiewicz K, Marz M, Griffiths-Jones S, Toffano-Nioche C, Gautheret D, Weinberg Z, Rivas E, Eddy SR, Finn RD, Bateman A, Petrov AI (2021. január 1.). „Rfam 14: expanded coverage of metagenomic, viral and microRNA families”. Nucleic Acids Res 49 (D1), D192–D200. o. DOI:10.1093/nar/gkaa1047. PMID 33211869.  
  15. Sam Griffiths-Jones (2004. január 1.). „The microRNA Registry”. Nucleic Acids Res 32 (Database issue), D109–D111. o. DOI:10.1093/nar/gkh023. PMID 14681370. (Hozzáférés: 2023. november 24.)  
  16. Alyssa C. Moore, Jonathan S. Winkjer, Tsai Tien Tseng (2015). „Bioinformatics Resources for MicroRNA Discovery”. Biomark Insights 10 (Suppl 4), 53–58. o. PMID 26819547. (Hozzáférés: 2023. november 24.)  
  17. a b Juan Antonio Garcia-Martin, Ivan Dotu, Peter Clote (2015. július 1.). „RNAiFold 2.0: a web server and software to design custom and Rfam-based RNA molecules”. Nucleic Acids Res 43 (Web Server issue), W513–W521. o. DOI:10.1093/nar/gkv460. PMID 26019176. (Hozzáférés: 2023. november 24.)  
  18. Juan Antonio Garcia-Martin: Github - clotelab/RNAiFold: A constraint programming algorithm for RNA inverse folding and molecular design

Fordítás[szerkesztés]

Ez a szócikk részben vagy egészben a Rfam című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

További információk[szerkesztés]