Ugrás a tartalomhoz

Shotgun szekvenálás

A Wikipédiából, a szabad enciklopédiából

A genetikában a shotgun szekvenálás[1] véletlenszerű DNS-szálak szekvenálására használt módszer.

A Sanger-szekvenálás láncvégi módszere csak rövid, 100–1000 bp-os DNS-szálakra használható. Emiatt a hosszabb szekvenciákat önállóan szekvenálható kisebbekre osztják, majd összeállítják a teljes szekvenáláshoz.

A shotgun-szekvenálásban[2][3] a DNS számos kis részre van osztva véletlenszerűen, ezek láncvégi módszerrel való szekvenálása hozza létre a leolvasásokat. A több átfedő leolvasás több törés-szekvenálás ciklussal oldható meg. A számítógépes programok ezután az átfedő részeket folytonos szekvenciává állítják össze.[2]

A teljes genomszekvenálást lehetővé technológiák egyike volt.

Példa[szerkesztés]

Az alábbi két véletlenszerű leolvasási ciklus igen egyszerű példa:

Szál Szekvencia
Eredeti AGCATGCTGCAGTCATGCTTAGGCTA
Első szekvencia AGCATGCTGCAGTCATGCT-------

-------------------TAGGCTA

Második szekvencia AGCATG--------------------

------CTGCAGTCATGCTTAGGCTA

Rekonstrukció AGCATGCTGCAGTCATGCTTAGGCTA

Ezen egyszerűsített példában az eredeti szekvencia egészét egyik leolvasás se fedi, de a négy leolvasásból megadható az eredeti szekvencia végeik átfedésének felhasználásával. A gyakorlatban a folyamat hatalmas mennyiségű információt használ számos kétértelműséggel és szekvenálási hibával. Az összetett genomok összeillesztését nehezítik továbbá az ismétlődő szakaszok, vagyis a hasonló rövid leolvasások a szekvencia teljesen eltérő részéről is származhatnak.

Számos átfedő leolvasás szükséges ezek meghatározásához és a megfelelő összeillesztéshez. Például a humángenom-projektben a humán genom nagy része legalább 12-szeres lefedettségben volt szekvenálva, minden bázis átlagosan 12 különböző leolvasásban volt megtalálható. Még így is a humán genom eukromatinrészének mintegy 1%-át nem izolálták vagy illesztették össze 2004-ben.[4]

Teljes genomos shotgun-szekvenálás[szerkesztés]

Történet[szerkesztés]

A kis (4000–7000 bp) genomok teljes genomos shotgun-szekvenálását 1979-ben javasolták először.[2] Az első így szekvenált genom a karfiolmozaik-vírus 1981-ben kiadott genomja volt.[5][6]

Párosított végű szekvenálás[szerkesztés]

Szélesebb körű alkalmazása a végpáronkénti szekvenálással jelent meg. Ahogy a szekvenálási projektek hosszabb és komplexebb DNS-szekvenciákat kezdtek el szekvenálni, több csoport hasznosnak látta a DNS-töredék mindkét fvégének szekvenálását. Bár mindkét vég szekvenálása és az adatok kezelés két eltérő töredék egy végének szekvenálásánál nehezebb, az ismeret, hogy a két szekvencia ellenkező irányú, és nagyjából egy töredék hosszára vannak egymástól, értékes volt az eredeti töredék szekvenciájának rekonstrukciójában.

Története[szerkesztés]

A párosított végű szekvenálás használatát először 1990-ben közölték[7] a humán hipoxantin-guanin foszforiboziltranszferáz (HGPRT) lokuszának szekvenálásakor, de ekkor használata a hagyományos szekvenálás utáni lyukak lezárására korlátozódott. A tisztán páronkénti szekvenálás első leírása állandó hosszú töredékek feltételezése mellett 1991-ben történt.[8] Ekkor közösségi konszenzus volt, hogy az optimális töredékhossz a szekvencialeolvasás hosszának 3-szorosa. 1995-ben Jared Roach és társai változó méretű töredékek használatát mutatták be, és kimutatták, hogy nagy célpontok szekvenálhatók tisztán páronként.[9] Ezt alkalmazta a Genomkutatási Intézet (TIGR) a Haemophilus influenzae genomjának 1995-ös,[10] majd a Celera Genomics a Drosophila melanogaster genomjának 2000-es,[11] végül a humán genom szekvenálásához.

Módszer[szerkesztés]

A stratégiához egy nagy tömegű DNS-szálat méret szerint (általában 2, 10, 50, 150 kbp) kiválasztott véletlenszerű töredékekre vágnak, és megfelelő vektorba klónoznak. A klónokat mindkét végről szekvenálják láncvégi Sanger-szekvenálással, E szekvenciák a végleolvasások vagy 1-es és 2-es leolvasás, az azonos klónról származó olvasások a „társpárok”. Mivel a láncvégi módszer általában csak 500–1000 bázisból álló leolvasásokat készíthet, a társpárok ritkán fednek át a legrövidebb klónok kivételével.

Összeállítás[szerkesztés]

Az eredeti szekvencia rekonstrukciója szekvencia-összeállítóval történik. Először az átfedő leolvasások hosszabb összetett szekvenciákba (contig) kerülnek, melyek „scaffoldokba” kapcsolhatók a társpárok kapcsolatai követésével. A contigtávolság meghatározható a társpárhelyzetekből, ha az átlagos töredékhossz ismert, és kicsi a szórása. A távolság függvényében különböző módszerek használhatók a lyukakban lévő szekvenciák megadásához: ha kicsi a lyuk (5–20 kb, polimeráz-láncreakcióval sokszorosítható, majd szekvenálható a rész, ha nagyobb (>20 kb), a nagy töredék speciális vektorokban (például mesterséges baktérium-kromoszóma) klónozható, majd a vektor szekvenálható.[12]

Előnyök és hátrányok[szerkesztés]

Előnye, hogy az egész genom egyszerre szekvenálható több szekvenálóeszközzel, ami a hagyományos módszereknél hatékonyabb. Hátránya viszont, hogy noha gyorsan szekvenál nagy DNS-részeket, a megfelelő összeillesztésükre való képesség kétes, különösen ismétlődő részkekel rendelkező eukarióta genomokkal. A szekvenciaillesztők javulása és a számítógépek árának csökkenése e korlátot áthidalhatta.[12]

Lefedettség[szerkesztés]

A lefedettség a rekonstruált szekvencia egy nukleotidjához tartozó átlagos leolvasásszám. Képlete , ahol a lefedettség, az olvasásszám, az átlagos olvasáshossz, a genomhossz. Például egy 2000 bp hosszú, 8, átlagosan 500 nt hosszú leolvasásból rekonstruált genom redundanciája 2-szeres. E paraméter lehetővé teszi más mennyiségek, például a leolvasások által lefedett genomarány becslését. A magas lefedettség ajánlott, mivel a bázishívás és az összeillesztés hibáit csökkenti. A DNS-szekvenálás-elmélet e mennyiségek kapcsolatait vizsgálja.

Néha különbséget tesznek a szekvencia- és a fizikai lefedettség közt. Előbbi az egy bázisra jutó átlagos leolvasásszám, utóbbi az egy bázisra jutó átlagos társpárosleolvasás-szám.[13]

Hierarchikus shotgun-szekvenálás[szerkesztés]

A teljes genomos shotgun-szekvenálásban (fent) a genomot véletlenszerűen a szekvenáláshoz megfelelő méretű töredékekre osztják, majd újra összeállítják. A hierarchikusban (lent) a genomot először nagyobb részekre osztják, ezek sorrendje meghatározása után a részeket szekvenáláshoz megfelelő méretű részekre bontják.

Bár a shotgun-szekvenálás elvileg bármekkora genomra alkalmazható, közvetlen használata nagy genomok, például a humán genom szekvenálásában az 1990-es évek végéig korlátozott volt, mikor a technológiai haladás lehetővé tette a folyamatban érintett sok adat kezelését.[14] Eredetileg a teljes genomos szekvenálást a nagy genomok nagysága és a nagyobb ismétlődő-DNS-arány (a humán genomban például >50%) is korlátozta.[15] Nem volt elfogadott, hogy egy nagy genom teljes genomos shotgun szekvenálása megbízható adatokat szolgáltat, ezért más, a szekvencia-összeállításhoz szükséges teljesítményt csökkentő eljárások kellettek a shotgun szekvenálás előtt.[15] A hierarchikus (más néven felülről lefelé jövő) szekvenálásban alacsony felbontású fizikai leképezés készül a genomról a tényleges szekvenálás előtt. Erről kevés, az egész kromoszómát kiválasztó töredéket kiválasztanak szekvenáláshoz.[16] Így kevés magas átvitelű szekvenálás és összeillesztés kell.

A sokszorosított genomot először nagyobb, 50–200 kb-os részekre bontják és baktériumokba klónozzák BAC vagy P1-derivált mesterséges kromoszóma (PAC) révén. Mivel több genommásolatot bontottak véletlenszerűen, az egyes klónokban lévő töredékek végei valószínűleg eltérnek, és elég lefedettséggel megtalálható a BAC-contigokból álló legkisebb scaffold. Ez a minimális lefedő sorozat.

A teljes genomot lefedő BAC-contig alkotja a lefedő sorozatot.

A lefedési út megtalálása után az utat alkotó BAC-ok véletlenszerűen kisebb töredékekre bomlanak, és shotgun szekvenálással szekvenálhatók kisebb méretben.[17]

Bár a teljes BAC-contig-szekvenciák nem ismertek, az egymáshoz viszonyított helyzetek igen. E sorrendek levezetésére és a lefedési utat alkotó BAC-ok kiválasztására több út van. Általában a klónok egymáshoz viszonyított helyzetének azonosítása és az egész érintett részt alkotó, a lehető legkevesebb klón által alkotott folytonos scaffold kiválasztása fontos. A klónsorrend az átfedés módjának meghatározásával vezethető le.[18] Az átfedő klónok számos módon azonosíthatók. Radioaktívan vagy kémiailag megjelölt anyag szekvenciajelölt hellyel (STS) hibridizálható mikrocsoportra, erre kerülnek a klónok.[18] Így az adott szekvenciát genomjukban tartalmazó klónok azonosíthatók. A klónok vége szekvenálhatók, új megjelölt anyagot adva, és a folyamat ismételhető, ez a kromoszómaséta.[19]

Egy alternatív módszer a BAC-könyvtár restrikciós emésztése. Két közös töredékkel rendelkező klón átfed, mivel több hasonló távolságra lévő restrikciós helye közös.[18] E genomikai leképezési módszer a restrikció vagy BAC-ujjlenyomat-készítés, mivel a klónok restrikciós helyeit azonosítja. A klónok átfedésének megtalálása és genombeli helyének megismerése után e contigok egész genomot fedő minimális részhalmazának scaffoldját szekvenálják.[16]

Mivel először alacsony felbontású leképezést készít a genomról, a hierarchikus shotgun szekvenálás lassabb az egész genomosnál, de kevésbé függ a számítógépes algoritmusoktól. A jelentős BAC-könyvtár-készítés és lefedősorozat-kiválasztás teszik ezt azonban lassúvá és munkaigényessé. Mivel a technológia elérhető, az adatok megbízhatók,[15] a teljes genomos shotgun szekvenálás sebessége és hatékonysága miatt a genomszekvenálás elsődleges módjává vált.

Újabb szekvenálási technológiák[szerkesztés]

A hagyományos shotgun szekvenálás a Sanger-szekvenáláson alapult, amely 1995–2005 között a legjobb módszer volt a szekvenálásra. A shotgun szekvenálást ma is használják más szekvenáló technológiákkal, például rövid (más néven új generációs szekvenálás) és hosszú leolvasású szekvenálással együtt.

A rövid leolvasású vagy „új generációs” szekvenálás rövidebb, 25–500 bp körüli leolvasásokat ad, de ezekből akár több milliót is viszonylag rövid idő, akár napok alatt is.[20] Ez magas lefedettséget ad, de az összeillesztés sokkal erőforrás-igényesebb. E technológiák a sok adat és a viszonylag rövid szekvenálási idő miatt jobbak a Sanger-szekvenálásnál.[21]

A metagenomikában[szerkesztés]

A 400–500 bp-os leolvasások elegendők a DNS forrásának faját vagy törzsét, amennyiben a genom ismert, például k tagú polimereken alapuló taxonómiai besoroló szoftverrel. Az új generációs szekvenálásból származó több millió leolvasással bármely komplex, akár több ezer fajú mikrobiom, például a bélmikrobiom is teljesen áttekinthető. Előnye a 16S rRNS-amplikonszekvenálással szemben, hogy nem korlátozódik baktériumokra, képes a fajnál kisebb taxonokat is meghatározni, ahol az amplikonszekvenálás csak a génuszt adja meg, és képes teljes géneket kivonni és funkciójukat meghatározni a metagenom részeként.[22] A metagenomikai szekvenálás szenzitivitása hasznossá teszi a klinikumban.[23] Azonban a minta vagy a szekvenáló rendszer szennyeződése fontos probléma.[24]

Jegyzetek[szerkesztés]

  1. Maár K, Varga GI, Kovács B, Schütz O, Tihanyi B, Nyerki E, Raskó I, Pálfi Gy, Maróti Z, Neparáczki E, Török T. A 10–11. századi Kárpát-medencei köznép anyai vonalainak jellemzése archeogenetikai módszerekkel, Magyar őstörténeti műhelybeszélgetés. Budapest: Magyarságkutató Intézet, 67–78. o.. ISBN 9786156117663 
  2. a b c Staden, R. (1979). „A strategy of DNA sequencing employing computer programs”. Nucleic Acids Research 6 (7), 2601–2610. o. DOI:10.1093/nar/6.7.2601. PMID 461197.  
  3. Anderson, Stephen (1981. július 11.). „Shotgun DNA sequencing using cloned DNase I-generated fragments”. Nucleic Acids Research 9 (13), 3015–3027. o. DOI:10.1093/nar/9.13.3015. PMID 6269069.  
  4. International Human Genome Sequencing Consortium (2004. október 21.). „Finishing the euchromatic sequence of the human genome”. Nature 431 (7011), 931–945. o. DOI:10.1038/nature03001. PMID 15496913.  
  5. Gardner, Richard C. (1981. június 25.). „The complete nucleotide sequence of an infectious clone of cauliflower mosaic virus by M13mp7 shotgun sequencing” (angol nyelven). Nucleic Acids Research 9 (12), 2871–2888. o. DOI:10.1093/nar/9.12.2871. ISSN 0305-1048. PMID 6269062.  
  6. Doctrow, Brian (2016. július 19.). „Profile of Joachim Messing” (angol nyelven). Proceedings of the National Academy of Sciences 113 (29), 7935–7937. o. DOI:10.1073/pnas.1608857113. ISSN 0027-8424. PMID 27382176.  
  7. Edwards, Al (1991. augusztus 1.). „Closure strategies for random DNA sequencing”. Methods 3 (1), 41–47. o. DOI:10.1016/S1046-2023(05)80162-8.  
  8. Edwards, Al (1990. április 1.). „Automated DNA sequencing of the human HPRT locus”. Genomics 6 (4), 593–608. o. DOI:10.1016/0888-7543(90)90493-E. PMID 2341149.  
  9. Roach, Jared C. (1995. március 1.). „Pairwise end sequencing: a unified approach to genomic mapping and sequencing”. Genomics 26 (2), 345–353. o. DOI:10.1016/0888-7543(95)80219-C. PMID 7601461.  
  10. Fleischmann, RD (1995). „Whole-genome random sequencing and assembly of Haemophilus influenzae Rd”. Science 269 (5223), 496–512. o. DOI:10.1126/science.7542800. PMID 7542800.  
  11. Adams, MD (2000. július 11.). „The genome sequence of Drosophila melanogaster”. Science 287 (5461), 2185–95. o. [2018. július 22-i dátummal az eredetiből archiválva]. DOI:10.1126/science.287.5461.2185. PMID 10731132. (Hozzáférés: 2017. október 25.)  
  12. a b Weber JL, Myers EW (1997. május). „Human Whole-Genome Shotgun Sequencing”. Genome Res 7 (5), 401–409. o. DOI:10.1101/gr.7.5.401. (Hozzáférés: 2024. július 11.)  
  13. (2010) „Advances in understanding cancer genomes through second-generation sequencing”. Nature Reviews Genetics 11 (10), 685–696. o. DOI:10.1038/nrg2841. PMID 20847746.  
  14. (2005. szeptember 9.) „Genome Sequencing”. Encyclopedia of Life Sciences. DOI:10.1038/npg.els.0005378.  
  15. a b c (2005. szeptember 9.) „Shotgunning the Human Genome: A Personal View”. Encyclopedia of Life Sciences. DOI:10.1038/npg.els.0005850.  
  16. a b Gibson G, Muse SV. A Primer of Genome Science, 3rd, 84. o. 
  17. Bozdag, Serdar (2013. március 1.). „A Graph-Theoretical Approach to the Selection of the Minimum Tiling Path from a Physical Map”. IEEE/ACM Transactions on Computational Biology and Bioinformatics 10 (2), 352–360. o. DOI:10.1109/tcbb.2013.26. ISSN 1545-5963.  
  18. a b c Dear, Paul H (2005. szeptember 9.). „Genome Mapping”. Encyclopedia of Life Sciences. DOI:10.1038/npg.els.0005353.  
  19. Horváth B, Az IPD3 gén genetikai térképezése és szerepének vizsgálata a szimbiotikus kapcsolatok kialakításában Medicago truncatula-ban, Eötvös Loránd Tudományegyetem, Természettudományi Kar, <http://teo.elte.hu/minosites/ertekezes2013/horvath_beatrix.pdf>. Hozzáférés ideje: 2024-07-13
  20. Voelkerding, Karl V (2009. április 1.). „Next-Generation Sequencing: From Basic Research to Diagnostics”. Clinical Chemistry 55 (4), 641–658. o. DOI:10.1373/clinchem.2008.112789. PMID 19246620.  
  21. Metzker, Michael L. (2010. január 1.). „Sequencing technologies — the next generation”. Nature Reviews Genetics 11 (1), 31–46. o. DOI:10.1038/nrg2626. PMID 19997069.  
  22. Roumpeka, Despoina D. (2017. március 6.). „A Review of Bioinformatics Tools for Bio-Prospecting from Metagenomic Sequence Data”. Frontiers in Genetics 8, 23. o. DOI:10.3389/fgene.2017.00023. PMID 28321234.  
  23. Gu, Wei (2019. január 24.). „Clinical Metagenomic Next-Generation Sequencing for Pathogen Detection”. Annual Review of Pathology: Mechanisms of Disease 14 (1), 319–338. o. DOI:10.1146/annurev-pathmechdis-012418-012751. PMID 30355154.  
  24. Thoendel, Matthew (2017. június 1.). „Impact of Contaminating DNA in Whole-Genome Amplification Kits Used for Metagenomic Shotgun Sequencing for Infection Diagnosis”. Journal of Clinical Microbiology 55 (6), 1789–1801. o. DOI:10.1128/JCM.02402-16. PMID 28356418.  

Fordítás[szerkesztés]

Ez a szócikk részben vagy egészben a Shotgun sequencing című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

Források[szerkesztés]