Bioinformatika

A Wikipédiából, a szabad enciklopédiából
DNS mikroarray, amely alkalmas kromoszóma aberrációk detektálására. A génexpressziós mikroarray-k segítségével a rákterápia testre szabott alkalmazása többféleképpen megvalósulhat[1].
Őssejtekből készült protein extrakció aminosav-szekvenciája.
Lipáz enzim térbeli képe, Cn3D 4.1 köztulajdonban lévő szoftverrel készítve.

A bioinformatika biológiai problémák informatikai vizsgálatával foglalkozó interdiszciplináris tudomány, a biológia és az informatika határterülete, a biotechnológia részterülete. A bioinformatika az a tudományág, amely informatikai eszközöket és módszereket alkalmaz a biológiai folyamatok megismerésére, modellezésére és befolyásolására. Bioinformatika: biológia határozza meg a feladatot, az informatika az eszközöket[2]. Az arany biotechnológia a bioinformatika fogalmát foglalja magában[3][4].

A kifejezés eredete[szerkesztés | forrásszöveg szerkesztése]

A bioinformatika kifejezés Paulien Hogeweg (sz. 1943), holland biológustól származik az 1970-es évekből, amikor a biotikus rendszerek információs folyamatait tanulmányozta. 1970-ben, Ben Hesper és ő határozza meg a bioinformatika kifejezést "a tanulmány az informatikai folyamatok biotikus rendszerekben" című értekezésében [5][6].

A bioinformatika jelentősége[szerkesztés | forrásszöveg szerkesztése]

Óriási mennyiségben gyűlnek a kutatási adatok a genetikai laborokban. Az adatbányászat lehetővé teszi, hogy a tudósok korábban nem is sejtett összefüggésekre bukkanjanak. Becslések szerint ma már 2000 petabyte (kb. 2000 millió gigabyte) tudományos adat létezik, körülbelül a fele szervereken, a fele pedig PC-ken. És ez az irdatlan adatmennyiség gyorsuló ütemben bővül. A mai tudomány az adatgyűjtésről és adatelemzésről szól. Az óriási adatbázisokban való bányászat új tudományos megközelítést szült: például a genetikában már nem azokat a géneket vizsgálják évtizedeken át, amelyeket egy professzor valamiért gyanúsnak talált egy betegség hátterében, hanem azokat, amelyek egy egészséges és egy beteg sejt genetikai profiljában eltérést mutatnak.

Az adatrobbanás leginkább a részecskefizika, a csillagászat a genetika és az agykutatás területén érzékelhető leginkább. A bioinformatika szót az 1980−as évek közepén találták ki, legtágabb értelemben: minden, amit számítógéppel csinálnak, és köze van a biológiához. Szűkebb értelemben: a biológiai szekvenciaadatok kezelése és elemzése, ill. a 3D szerkezeti információ kezelése és elemzése[7].

Bioinformatika fogalma[szerkesztés | forrásszöveg szerkesztése]

Az élet mérleg-nyelvének képviselői (gén és a DNS-, a bioszféra, amely oxigén, és ózonréteg nélkül nem létezne.) A gének az életnek és a bioszféra piramisának kiindulási alapja.

A bioinformatika olyan interdiszciplináris tudomány, amely a számítástechnikát alkalmazza a molekuláris biológiában. A bioinformatika magában foglalja az adatbázisok, algoritmusok, számítógépes és statisztikus eljárások és elméletek létrehozását és fejlesztését a biológiai adatok analízisére és kezelésére. Az elmúlt évtizedekben a molekuláris biológiai technológiák és a számítástechnika fejlődésének eredményeként hatalmas mennyiségű molekuláris biológiai információ halmozódott fel. A bioinformatika azon matematikai és számítógépes módszerek összefoglaló neve, amely segítségével megérthetjük a biológiai folyamatokat[8].

A szűken vett bioinformatika a genomikai informatika, a proteomikai informatika, és a rendszer biológiai informatika. A biokémiai informatika számítógépes és informatikai megoldások alkalmazása biokémiai problémák megoldására. Ezek az in silico módszerek a gyógyszerkutatásban és a biológiai hatóanyagok kutatásában használatosak. Ilyenek az „in silico screening” és a „drug design”. Azok az informatikai alkalmazások, amelyek egy adott biológiai kísérlet vagy eszköz használatával kapcsolatos informatikai megoldásokat használják és nem sorolhatók be az előző kettő kategóriába.

A bioinformatika céljai[szerkesztés | forrásszöveg szerkesztése]

ABI 3100 16-kapillárisos DNS szekvenszer.
  • Adatbázisok létrehozása és karbantartása. Az adatok megszervezése, rendezése oly módon, hogy a kutatók könnyedén hozzáférhessenek a meglévőinformációhoz, és hozzátehessenek újat.
  • Eszközök, módszerek kifejlesztése az adatok elemzésére. Az adatok haszontalanok, amíg nem elemeztük őket.
  • Az eszközök és módszerek alkalmazása az adatok elemzésére, és az eredmények értelmezése a biológia szempontjából.

A biológiai információ típusai és elemzési módszerei[szerkesztés | forrásszöveg szerkesztése]

Nyers DNS−szekvenciák[szerkesztés | forrásszöveg szerkesztése]

DNS szekvencia

Az adathalmaz mérete 12 millió szekvencia, 13 milliárd bázis, ahol a kódoló és nem−kódoló régiók elkülönítése, az intronok és exonok azonosítása, a géntermékek predikciója és igazságügyi elemzések afeladat.

Fehérjeszekvenciák[szerkesztés | forrásszöveg szerkesztése]

L-peptid és D-peptid analógok.

Az adathalmaz mérete 400 000 szekvencia (egyenként kb. 300 aminosav), ahol szekvencia-összehasonlítási algoritmusok, többszörös szekvencia-illesztő algoritmusok alkalmazás és konzerválódott szekvenciamotívumok azonosítása a feladat

Makromolekuláris szerkezetek[szerkesztés | forrásszöveg szerkesztése]

Az adathalmaz mérete 15 000 szerkezet (egyenként kb. 1000 atom koordinátái), ahol másodlagos és harmadlagos szerkezet jóslása, 3D szerkezeteket illesztőalgoritmusok, fehérjegeometriai mérések, felszín, térfogat és alak számítása, intermolekuláris kölcsönhatások, molekulaszimulációk (energiafüggvény, molekuláris mozgások, dokkolás) a feladat

Genomok[szerkesztés | forrásszöveg szerkesztése]

Az adathalmaz mérete 300 teljes genom (egyenként 1,6 millió − 3 milliárd bázis), ahol az ismétlődések jellemzése, szerkezetek hozzárendelése génekhez, Filogenetikai analízis, Genomi méretű felmérések, (fehérjetartalom jellemzése, anyagcsere−útvonalak), kapcsoltság elemzése egyes betegségek és gének összefüggésének vizsgálata a feladat

Génexpressziós adatok[szerkesztés | forrásszöveg szerkesztése]

Az adathalmaz mérete legnagyobb: kb. 20 időpont az élesztő kb. 6000 génjénél, ahol az expressziós mintázatok korrelációjának vizsgálata, az expressziós adatok összekapcsolása a szekvencia−, szerkezeti és biokémiai adatokkal a feladat

Egyéb szakirodalom[szerkesztés | forrásszöveg szerkesztése]

Az adathalmaz mérete 11 millió szakcikk, ahol elektronikus könyvtárak az automatizált irodalomkutatáshoz, tudásadatbázisok irodalmi adatokból történő kutatás a feladat

Egyéb anyagcsere−útvonalak[szerkesztés | forrásszöveg szerkesztése]

A reakcióútvonal−szimulációk a feladat[9]

Az adatok csoportosítása hasonlóságok alapján[szerkesztés | forrásszöveg szerkesztése]

Az információk nagy része csoportokba rendezhetőek biológiai hasonlóságok alapjání amely számos bioinformatikai módszer alapja.

  • a genomban sok ismétlődő szekvenciarészlet van
  • a gének csoportosíthatóak funkciójuk (pl. enzimhatás) szerint vagy az anyagcsere−útvonalak szerint különböző fehérjéknek gyakran hasonló a szekvenciájuk
  • véges számú különböző alapvető fehérjeszerkezet létezik (becslések 1000 és 10 000 közé teszik)

Műveletek a bioinformatikában[szerkesztés | forrásszöveg szerkesztése]

Szekvenciaanalízis[szerkesztés | forrásszöveg szerkesztése]

Pramlintid szekvencia, sárga a diszulfid-kötés.
E2F család tagjai. cyc A - Cyclin A kötő domén, DNS - DNS- kötő domén, DP1,2 - domén for dimerizáció DP1, 2-vel, TA - transzkripciós aktivációs domén PB - pocket protein kötő domén.

Legfontosabb eljárás a bioinformatikában, amikor egy új (ismeretlen szerkezetű/funkciójú fehérjéhez tartozó) szekvenciához próbálunk hasonlót találni a már ismert szerkezetű/funkciójú fehérjék szekvenciái között. A szekvenciaanalízis során számos csapdát kell elkerülni: Az ortológia és a paralógia bonyolult viszonyai új szekvenciák vizsgálatánál megnehezítik annak eldöntését, hogy a funkcionális információ mennyire vihetőát az új fehérjére (a talált hasonló szekvencia lehet az ortológ paralógja egy másik organizmusban). Emiatt az automatikus funkcióhozzárendelés sok esetben hibás (és ezt adatbázisokban is megtalálni)! A szekvenciahasonlóság sokszor csak a szekvencia egy részére vonatkozik, pl. moduláris fehérjék esetében.

Szekvenciák összerendezése (vagy −illesztése) (alignment)[szerkesztés | forrásszöveg szerkesztése]

Szekvenciaazonosság: az összerendezésben az azonos aminosavpárok százalékos aránya. A szekvenciaazonosság csökkenésével a funkció/szerkezet átvihetősége csökken.

A szekvencia és a szerkezet szerepe a funkció meghatározásában[szerkesztés | forrásszöveg szerkesztése]

A szerkezet a váz, amelyre a szekvencia fel van fűzve. A funkció megállapításához szükséges a szekvencia részleteinek ismerete. Analógia: szoba és berendezése (csak a berendezés részleteiből tudhatjuk meg, mire való a szoba). A funkció megállapításához a biológiai kontextust is ismerni kell (milyen épületben van a szoba). A bioinformatikai programok, eljárások, algoritmusok nem végleges, biztos válaszokat adnak, csak segítenek leszűkíteni a lehetőségek körét és kísérleteket tervezni a kérdések eldöntésére. A valódi válaszokat a biológiai háttérismeretek fényében találhatjuk meg.

Mintázatfelismerés[szerkesztés | forrásszöveg szerkesztése]

  • A már ismert, hasonló funkciójú/szerkezetű fehérjéket megvizsgálva megkeresünk valamely, a funkcióra/szerkezetre jellemző, konzerválódott sajátosságot
  • Ezt használjuk fel új szekvenciák funkciójának/szerkezetének azonosítására.
  • Feltétel: az új szekvencia olyan fehérjéhez tartozzon, amihez hasonlót már "láttunk"

Predikció[szerkesztés | forrásszöveg szerkesztése]

  • A funkció vagy a térszerkezet megjóslása, hasonlóság alapján vagy másképpen
  • A bioinformatika "Szent Grálja": a szekvenciából megjósolni a térszerkezetet
  • A felgombolyodás problémája: az aminosavsorrend meghatározza a térszerkezetet (Anfinsen −kísérlet óta tudjuk), de még ma sem értjük, hogyan [chaperonok nem számítanak]; Csak másodlagos-szerkezet−jóslás megy, korlátozott megbízhatósággal. Várhatóan így marad még pár évtizedig.

Homológia[szerkesztés | forrásszöveg szerkesztése]

Homológia a közös evolúciós eredetet jelenti (szekvenciák esetében). Nincs mértéke (nem fejezhetőki %−ban!!!), két szekvencia vagy homológ, vagy nem. A homológia két típusa: ortológia és paralógia

Ortológia[szerkesztés | forrásszöveg szerkesztése]

Két gén ortológ, ha két különbözőfajban találhatóak, és egy közös ős−génből származnak, mely a két faj közös ősében volt jelen. Ugyanazt a funkciót szolgálják, a két fajban. Példa: laktát dehidrogenáz (ill. génje) az emberben és az egérben.

Paralógia[szerkesztés | forrásszöveg szerkesztése]

két gén paralóg, ha ugyanabban az organizmusban találhatóak, és egy közös ős−génből génduplikáció és azt követő-divergens evolúció útján alakultak ki. Többnyire különböző, de egymással összefüggésben lévőfunkciójuk van. Példa: a hisztidin−bioszintézis enzimei (ill. ezek génjei) emberben (nagyon hasonló szerkezetűek, de más−más reakciót katalizálnak).

Analógia[szerkesztés | forrásszöveg szerkesztése]

Hasonlóság, közös evolúciós eredet nélkül. Ilyenkor közös evolúciós eredetre nem lehet következtetni. Inkább konvergens evolúció állhat a háttérben.
Két fehérje analóg lehet, ha:

  • szerkezetük hasonló, de nincs közöttük szekvenciális hasonlóság, vagy
  • azonosak a katalitikus csoportjaik, de térszerkezetük különböző

A bioinformatikai "spektrum"[szerkesztés | forrásszöveg szerkesztése]

DNS szekvenálás nanoporózus grafénnel.

Bioinformatika feladata a szekvenciákban kódolt információ megfejtése: térszerkezetek, funkciók, evolúciós összefüggések, funkció és evolúciós összefüggések térszerkezetből is. Az ismert fehérjeszekvenciák és az ismert térszerkezetek száma folyamatosan növekszik az utóbbi években. A szekvenciák száma évente megduplázódnak. 1998-ban kb. 300 000 ismert szekvencia (sőt, az ún. EST adatbázisokat is figyelembe véve milliók), kb. 1500 egyedi térszerkezet ismert. A helyzet a genomprogramokkal csak rosszabbodik. Percenként egy új szekvencia. A későbbi nagy szerkezetmeghatározó projektek is max. napi 5 új szerkezetet szolgáltatnak majd. Nagy az információs deficit, itt van szerepe a bioinformatikának.

Mélysége[szerkesztés | forrásszöveg szerkesztése]

Egy fehérje szerkezetének minél mélyebb fizikai-kémiai tulajdonságainak megértése. Génszekvencia, DNS-szekvencia, fehérjeszekvencia, térszerkezet, geometriai−kötőhelyek, fehérje-felszín, fehérje ligandum-szerkezet, gyógyszertervezés

Szélessége[szerkesztés | forrásszöveg szerkesztése]

Informatikai elemzések. A gén összehasonlítása más génekkel. Páronkénti, majd többszörös szekvenciaillesztés, szekvenciamintázatok azonosítása, filogenetikai elemzés, teljes genom elemzése stb. Páronkénti összehasonlítás, szekvenciák, szerkezetek és illesztések párosítása. Többszörös illesztés, mintázatok, templátok, törzsfák. Adatbázisok, statisztikák.

Genomprojektek[szerkesztés | forrásszöveg szerkesztése]

Már megszekvenált genomok [10][szerkesztés | forrásszöveg szerkesztése]

Eukarioták: Élesztő. Caenorhabditis elegans (féreg), Drosophila melanogaster (muslica), Arabidopsis thaliana (lúdfű), az ember

Folyamatban lévő fontos genomszekvenálási projektek [11][szerkesztés | forrásszöveg szerkesztése]

az ember, egér, kutya, patkány stb. Egyéb: kb. 50 baktérium, 11 archeon, >100 organellum, több száz vírus és fág.

Szakterületei[szerkesztés | forrásszöveg szerkesztése]

Három különösen rohamosan fejlődő szakterülete ismert:

A bioinformatika gazdasági alkalmazásai[szerkesztés | forrásszöveg szerkesztése]

Szűken értelmezett bioinformatika[szerkesztés | forrásszöveg szerkesztése]

A bioinformatika egyik legfontosabb alkalmazási területe a genetikai információ, a DNS és fehérjeszekvenciák illesztéséhez, összehasonlításához és a szekvenciákban levő mintázatok felismeréséhez kapcsolódik. Jelenleg a robbanásszerűen növekvő genetikai információ korában a bioinformatika szekvencia feldolgozáshoz kapcsolódó alkalmazása messze a legnagyobb jelentőségű. Ugyanakkor a genetikai információ a fehérje szintjén meghatározza a másodlagos és harmadlagos térszerkezetet és ez által meghatározza a fehérjék működését. Gyakori feladatok között van DNS és fehérje szekvenciák egymáshoz való illesztése, összehasonlítása illetve homológia modellek építése egy ismert fehérje térszerkezet és hozzá hasonló ismert fehérje szekvencia alapján. A kutatás legfőbb területei:

  • Szekvenciaanalízis
  • Genom annotáció
  • Számítógépes evolúciós biológia
  • Irodalomelemzés
  • Génexpresszió elemzése
  • Szabályozás-elemzés
  • Fehérje-expresszió elemzés
  • Mutációk és rák elemzés
  • Összehasonlító genomika
  • Hálózat és rendszer-biológia
  • Nagyteljesítményű képelemzés
  • Strukturális bioinformatikai módszerek
fehérje szerkezet előrejelzés
  • Szekvencia illesztés
  • Génkeresés
  • Genom összerakás
  • Szerkezeti biokémia (homológia modellezés, ab initio fehérje szerkezet meghatározás, molekuláris dokkolás, dokkoló algoritmusok)
  • Fehérje-fehérje kölcsönhatások
  • Genom-szintű asszociációs vizsgálatok

Bioinformatikai piac[szerkesztés | forrásszöveg szerkesztése]

A bioinformatika piaca dinamikusan növekszik, amely 5 milliárd dolláros növekedésen fog keresztül menni a következő években. Ez elég nagy ahhoz, hogy Magyarországon a globális réspiaci lehetőségeket jól kihasználó, jelentős cégek jöjjenek létre. A piac növekedését meghatározó fő tényező a személyre szabott gyógyászat, amely felerősítette a farmakogenomikai és farmakoproteomikai kutatásokat. A genomikai és proteomikai biomarkerek kutatások hatékony és biztonságos gyógyszerek kifejlesztéséhez vezettek. A piaci elmozdulás a genomikából a proteomikába, majd onnan tovább a rendszer biológiába új lehetőségeket nyit meg a bioinformatikának. Az adat és rendszerintegráció kérdését a piaci szereplőknek meg kell oldani, egyébként ez lehet az egyik visszatartó tényező. Vannak eddig a bioinformatika számára kihasználatlan, de jövőben érdekes területek, mint például az antibiotikum-rezisztencia vagy a bűnügyi DNS-analízis. A magas keresetek a fejlett világban növelik a molekuláris medicina iránti keresletet, ami közvetve érinti a bioinformatikai piacot.

A globális bioinformatikai piac és alpiacai (2007-2014), millió USD:

Szegmens 2007 2008 2009 2014 Cagr (%)
Eszközök 659,1 850,3 1099,2 4071,9 29,9
Tartalom / Adatbázis 948,4 1133,7 1358,5 3439,2 20,4
Szolgáltatás 222,2 276,5 345,1 1093 25,9
Összesen 1829,7 2260,5 2802,8 8604,1 25,1

Fő piacszegmensek[szerkesztés | forrásszöveg szerkesztése]

  • A bioinformatikai eljárások piacán a szekvencia analízis módszerek dominálnak, különösen a DNS-szekvenálás és a microarray analízis nyit vonzó lehetőségeket. A szekvencia-illesztés és filogenetikus analízis szerepe egyre fontosabb.
  • A bioinformatikai adatbázisok piacán egyre nagyobb genomikai adatbázisokra van szükség a genomika elterjedésével. Az adatbázisokkal kapcsolatos elvárások egyre növekednek a rohamosan növekvő kísérleti adatmennyiség miatt. Az adatbiztonságnak egyre nagyobb jelentősége lesz és ezen a téren úttörő és innovatív megoldások jelentősége növekszik. A bioinformatikai adatbázis piacnak a biztonságos adattárolás új üzleti lehetőséget jelent.
  • A bioinformatikai a szolgáltatások piaca. A bioinformatikai tanácsadás piaca egyre fontosabb része a szolgáltatók piacának. A genomikai adat kiértékelési szolgáltatások, a többszörös szekvencia-illesztés, a nagyátvitelű szekvenálás a legvonzóbb lehetőségeket nyújtja a bioinformatikai szolgáltatások számára. A szekvenálás alapú diagnosztikai alkalmazások növekedése fontos szerepet játszik a bioinformatikai szolgáltatások piacának növekedésében. A szekvenálási szolgáltatások kiszervezése egyre nagyobb lehetőséget jelent a kiszervezett bioinformatikai szolgáltatás piacnak.

Biokémiai informatika[szerkesztés | forrásszöveg szerkesztése]

A biokémiai informatika a számítógépes és informatikai megoldások alkalmazása biokémiai problémák megoldására. Ezek az in silico módszerek a gyógyszerkutatásban és a biológiai hatóanyagok kutatásában használatosak. A kémiai informatika piaca, különös tekintettel a kémiai modellezés, fizikai-kémiai tulajdonságok számítása, kémiai vegyületek regisztráció piacára a 90-es években fejlődött rendkívül gyorsan. Ez egybe esik a kombinatorikus kémia és a nagy áteresztőképességű szűrés elterjedésével és az ebből adódó kémiai adatok mennyiségi ugrásával. Ezzel egy időben növekedett a rendelkezésre álló fehérje kristályszerkezetek száma is, amely megadta a lehetőséget a racionális tervezésre. A racionális tervezéssel és in silico szűrésekkel kapcsolatos (sokszor túlzó) elvárások viszont nem váltak valóra.

Ez a piac jelenleg egyre inkább szűkül. A legnagyobb versenytársak közül az egyik (Tripos) csődbe ment, a másik az Accelrys bevételei pedig most már szinte kizárólag adat-pipeline szoftverekből és nem kémiai informatikából adódik. Azok a cégek, amelyek kevésbé a tudományos tartalomra és inkább az informatikára helyezték a hangsúlyt, pl. a Symyx, ACDLabs továbbra is képesek fejlődésre. A tradicionális kémiai informatikai cégek magas értékű termékekre rendezkedtek be, de az informatika fejlődésének eredményeképpen innovatív kis cégek lényegesen költséghatékonyabban tudnak komplex rendszereket fejleszteni és ennek megfelelően versenyképesebb termékekkel tud előállni. Összefoglalásképpen, a kémiai informatika piaca egy-két réspiactól eltekintve szűkül, a verseny erősen ár centrikus.

Biológiai kísérletekhez kapcsolódó informatika[szerkesztés | forrásszöveg szerkesztése]

Azokat a megoldásokat soroljuk ebbe a kategóriába, amely egy adott biológiai kísérlet vagy eszköz használatával kapcsolatos informatikai megoldásokat tartalmazza és nem sorolható be a fenti kettő kategóriába.

A biológiai kísérleteknél újabb és újabb laboratóriumi módszerek terjednek el, amelyek mind az adott problémára szabott informatikai megoldásokat igényelnek. Ezen kísérletek közül egyre több automatizált, nagy-átvitelű kísérlet. Ilyen például a nagy-átvitelű sejtmikroszkópia, amely alkalmas biológiai szűrésekre (high-content screening). Az aktuálisan megjelenő új kísérleti eszközök lehetőséget jelentenek új szoftveres megoldások kidolgozására. Különösen fontos ezek közül a képalkotáson alapuló módszerek, ilyen például a 2- és 3-dimenziós sejtmikroszkópia, vagy kisállat-CT.

Magyarországon[szerkesztés | forrásszöveg szerkesztése]

Szignál szekvencia kötő protein, az FfhPDB 1hq1 EBI molekuláris szerkezete.

Hazánkban 2006. március 4-én alapították meg a Magyar Bioinformatikai Társaságot [1]. A társaság célja a magyarországi bioinformatika oktatásának fejlesztése, a magyarországi bioinformatikai kutatások elősegítése, a bioinformatikával foglalkozó biológusok, matematikusok és számítástechnikusok egymáshoz közelebb hozása.

A piaci elmozdulás a genomikából a proteomikába, majd onnan tovább a rendszer biológiába új lehetőségeket nyit meg a bioinformatikának. Mindezek a trendek és változások új lehetőségeket nyitnak meg Magyarország számára globális réspiaci lehetőségeket jól kihasználó, jelentős cégek és új magas hozzáadott értékű munkahelyek létrehozására. Fontos aspektusai ezeknek a lehetőségeknek, hogy:

  1. Alapvetően informatikai, orvosi és biológiai kompetenciára építenek, amelyek erősek Magyarországon
  2. Nincs szükség költséges infrastrukturális beruházásokra
  3. A folyamatosan megújuló megoldatlan kihívások az újonnan belépő versenytársaknak is jó esélyt adnak

Rövid távon vonzó lehetőségek látszanak a pusztán informatikai problémák, különös tekintettel az adatbázisok kezelése, statisztikai módszerek alkalmazása, adatbiztonság, és infrastrukturális hatékonyság fejlesztése területén jelentkező alkalmazott kutatási problémák megoldásának hasznosítására. Közép és hosszabb távon a betegség és genomika kapcsolatának kutatása jelenthet nagy jelentőségű áttöréseket. Ebből a szempontból rendkívül fontosnak tartjuk az interdiszciplináris kutatások és ezen belül az alapkutatások támogatását. Több, jövőben gazdaságilag rendkívüli jelentőségű bioinformatikai kérdés ma még csak alapkutatási szinten fogalmazható meg. Mindezek alapján célzott állami szerepvállalás a bioinformatikai kutatás-fejlesztés erősítésére egy gyorsan megtérülő és hosszú versenyképességet biztosító beruházás Magyarország számára.

A bioinformatika piac néhány nagy domináns szereplőből és nagyszámú KKV-ból áll. A legtöbb nagy gyógyszergyár részben kiszervezi a bioinformatikai tevékenységét, ami pozitívan befolyásolja a KKV-k fejlődését. A szereplők közötti együttműködés egyre elterjedtebb mind a technológiaintegrálás, mind a termék disztribúció területén. Magyarországon a szűken értelmezett bioinformatikai piacon levő cégek száma 5 és 10 közötti és bevételeik jelenleg leginkább szolgáltatásokból és jelentős mértékben a magyar piacról kerülnek ki. Ezen cégek számára a nemzetközi szekvenátor piac robbanásszerű növekedése, a biomarker kutatások, kitörési lehetőségeket jelentenek. A versenyképesség feltétele viszont a rendkívül gyors alkalmazkodási képesség az új igényekhez és informatikai megoldásokhoz.

Magyarországon több cég van, amely biológia kísérletekhez tartozó informatikai megoldások réspiacán talált magának szerepet. Ezek egy része egy adott készülék gyártóhoz kapcsolódik (pl. Soft Flow), vagy saját innovatív módszereket dolgoz ki egy adott probléma megoldására (3DHistech, a hisztológiai metszetek 3 dimenziós megjelenítése). Ez a piac az új eszközök megjelenésével együttesen növekszik. A képfeldolgozás jelentősége növekszik, amely egy olyan terület, ahol Magyarországon nagyon jó szakemberekkel rendelkezik.

A bioinformatika ígérete[szerkesztés | forrásszöveg szerkesztése]

Delphi(software)-Peptid szekvencia: RRRGGGD.

Napjaink egyik forradalmi technológiai változása a génszekvencia-meghatározás költségének rohamos csökkentése és a szekvencia-információ robbanásszerű növekedése. Néhány radikális innováció nagyságrendekkel megnövelte a genetikai szekvenálás hatékonyságát. Ezen innovációk eredményei az ún. következő generációs szekvenátorok (next generation sequencers) 2007-es piacra lépése és ezek folyamatos fejlődése. Egy teljes emberi genom meghatározása 2013-ra a rutin diagnosztikai eljárások költségszintjén elérhetők. A robbanásszerűen növekvő adatmennyiség feldolgozása jelenti a következő néhány év egyik legnagyobb tudományos-technikai kihívását. Az így nyert információ felhasználása a gyógyszerkutatást és az orvostudományt alapvetően fogja megváltoztatni a személyre szabott gyógyászat megjelenésével.

A fejlődés menetét jól jellemzi a teljes egyéni emberi genom szekvencia információ változása. 2006-ig kettő, 2009 már több száz teljes genom állt rendelkezésre. Ugyanakkor öt éven belül a Complete Genomics cég egymaga egymillió teljes emberi genom szekvenálását tervez. Mindezek alapján valószínű, hogy öt éven belül minden klinikai vizsgálatokban résztvevőknek rutinszerűen meghatározzák a teljes genomját, valamint tíz év múlva a fejlett országokban születő csecsemők genom szekvenciája születéskor rutinszerűen meghatározásra kerül. A teljes genom szekvenálás kiváltja a ma használatos genetika tesztek nagy részét, melyet apasági vizsgálattól kezdve, a diagnosztikai biomarker meghatározáson át a nyomozói munkáig rendkívül sok helyen alkalmaznak.

Ezekben a szolgáltatásokban a szekvencia meghatározás és a szekvencia informatikai feldolgozása két külön lépéssé válik és nagyon hamar az informatika lesz ezeknek a módszereknek a szűk keresztmetszete. Ezt az indokolja, hogy az informatika hatékonysága nem fejlődik olyan ütemben, mint a szekvenálásé. Míg az informatika hatékonysága másfél év alatt duplázódik Moore törvény alapján, addig a szekvencia meghatározás költsége az utóbbi években évente egy-egy nagyságrenddel csökkent és a meghatározott információ mennyisége is hasonló mértékben növekszik. Ezt a problémát jól szemlélteti, hogy a Complete Genomics, az első teljes genom szekvenciát nagy tömegben ajánló cég, 60.000 processzorból álló, Google-hoz hasonló informatikai parkot létesít csak a saját maguk által meghatározott genom információ feldolgozásához.

Míg a szekvenálás múltját és jelenét a szekvenálási technológiák fejlődése jellemezte, a szekvenálás jövőjét az informatika fogja meghatározni. A Human Genome Project orvos végzettségű vezetője Francis S. Collins azzal köszönt le posztjáról, hogy a genomika ettől a ponttól egy alapvetően informatikai probléma és innen az informatikának kell a vezető szerepet betölteni. Ahogy egyre több genom információ kerül meghatározásra, úgy egyre jobban beigazolódik Collins jóslata. Míg az egyszerű polimorfizmusok (single nucleotide polimorphism, SNP) szerepét alapvetően ismerjük, a strukturális variációk (inzeráció, delició, blokk-szubsztitúció, beszúrási variációk, másolat-szám variációk, transzlokációk) funkcionális megértése részben megoldatlan algoritmikus informatikai probléma. A genom-betegség összefüggések kutatása pedig az adatbázis-technológiák és a statisztika egyik legnagyobb jövőbeli kihívása. A piaci elmozdulás a genomikából a proteomikába, majd onnan tovább a rendszer biológiába új lehetőségeket nyit meg a bioinformatikának.

Ajánlott irodalom[szerkesztés | forrásszöveg szerkesztése]

  • Barnes, M.R. and Gray, I.C., eds., Bioinformatics for Geneticists, first edition. Wiley, 2003. ISBN 0-470-84394-2
  • Baxevanis, A.D. and Ouellette, B.F.F., eds., Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, third edition. Wiley, 2005. ISBN 0-471-47878-4
  • Claverie, J.M. and C. Notredame, Bioinformatics for Dummies. Wiley, 2003. ISBN 0-7645-1696-5
  • Durbin, R., S. Eddy, A. Krogh and G. Mitchison, Biological sequence analysis. Cambridge University Press, 1998. ISBN 0-521-62971-3
  • Kohane, et al. Microarrays for an Integrative Genomics. The MIT Press, 2002. ISBN 0-262-11271-X
  • Michael S. Waterman, Introduction to Computational Biology: Sequences, Maps and Genomes. CRC Press, 1995. ISBN 0-412-99391-0
  • Mount, David W. Bioinformatics: Sequence and Genome Analysis Spring Harbor Press, May 2002. ISBN 0-87969-608-7
  • Pevzner, Pavel A. Computational Molecular Biology: An Algorithmic Approach The MIT Press, 2000. ISBN 0-262-16197-4

Jegyzetek[szerkesztés | forrásszöveg szerkesztése]

  1. http://www.tankonyvtar.hu/hu/tartalom/tamop425/0011_1A_Molekularis_terapiak_hu_book/ch01s03.html#id511578
  2. http://innova.eszakalfold.hu/dumpfile.php?file...filename...%E2%80%8E
  3. A biotechnológia nem egy szűk, jól definiálható szakterület, hanem számos tudományágat átfogó diszciplína. Az alkalmazási területek szerinti csoportosítás esetén didaktikai céllal az egyes területeket színkódokkal látták el, a bioinformatika az arany színt kapta.
  4. E. J. DaSilva(2005): The Colours of Biotechnology: Science, Development and Humankind ELECTRONIC JOURNAL OF BIOTECHNOLOGY
  5. Hesper B., Hogeweg P. (1970). "Bioinformatica: een werkconcept" Kameleon , 1 (6): 28-29.
  6. Hogeweg, P. (2011). "The Roots of bioinformatika Elméleti Biológia". A Searls, David B. PLoS Computational Biology 7 (3): e1002021. Bibcode : 2011PLSCB ... 7E0020H . doi : 10.1371/journal.pcbi.1002021 . PMC 3068925 . PMID 21483479 . szerkesztés
  7. Bioinformatikai webhelyek EMBL, SRS NCBI (Medline, Genbank, stb.) Expasy, Swissprot, Amos CCP11 projekt Molekuláris biológiai szerverek és adatbázisok ENTREZ: http://www.ncbi.nlm.nih.gov/entrez GenBank: http://www.ncbi.nlm.nih.gov/Genbank Genomes: http://www.ncbi.nlm.nih.gov/genomes Protein Data Bank: http://www.rcsb.org/pdb/ EMBL: http://www.embl-heidelberg.de/ EXPASY: http://www.expasy.org/
  8. : Mount D: Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor Laboratory Press, 2001.
  9. http://www.enzim.hu/~szia/bioinformatika/ea01/ea01.htm
  10. http://www.ebi.ac.uk/genomes/
  11. http://www.xmarks.com/site/www.ebi.ac.uk/~sterk/genome-MOT/

További információk[szerkesztés | forrásszöveg szerkesztése]

Magyar vonatkozású linkek[szerkesztés | forrásszöveg szerkesztése]

Nemzetközi szervezetek és intézmények[szerkesztés | forrásszöveg szerkesztése]

Szoftverek, adatbázisok[szerkesztés | forrásszöveg szerkesztése]

Tanfolyamok, képzések[szerkesztés | forrásszöveg szerkesztése]

Folyóiratok[szerkesztés | forrásszöveg szerkesztése]

Egyéb külső hivatkozások[szerkesztés | forrásszöveg szerkesztése]