A Google egy olyan lépést tett, amely meghatározó lehet a mikrobiológiában, a genetikában és végső soron a gyógyításban is. Talán nem hoz lázba, ha azt mondjuk, hogy a DeepVariant nevű szoftver forráskódja nyílt lett, pedig lehet, hogy ez nagyban hozzájárul majd például egy rákbetegségre való hajlam kimutatásához.
Amikor a genetikusok egy emberi betegségre való hajlam kimutatását tűzik ki célul, akkor lényegében azt keresik, hogy a páciens génjeiben milyen eltérések, egyedi minták mutatkoznak. Nézzük az alapoktól (és erősen leegyszerűsítve), hogy mit kell megtalálniuk, és hogyan segítheti ezt a Google szoftvere.
A sejtjeinkben lévő 23 kromoszómapár mindegyike egy-egy nagyon hosszú makromolekula, amit DNS-nek nevezünk. Azért kapta a makro előtagot, mert rengeteg elemből áll, olyan hosszú láncként lehet elképzelni, amelyekben összesen mintegy 3 milliárd kisebb egység kapcsolódik egybe a saját 3 milliárd párjával. Ezek az úgynevezett bázispárok. Ebben a hosszú láncban vannak olyan rövidebb részek, amelyeknél a párok sorrendje egy bizonyos információnak feleltethető meg, ezek a gének.
Ilyen információ lehet például tipikusan az, amelynek alapján a szervezet aminosavakat hoz létre, amelyből aztán fehérjék, vagyis a testünk építőkövei és működtető molekulái keletkeznek. Ha valamiért nem stimmel az alapinformáció, mert például a bázispárok sorrendje nem teljesen megfelelő, akkor abból baj is lehet, ezért ezeket az elemeket érdemes felkutatni, és lehetőség szerint javítani.
Azt az eljárást, amellyel meghatározzák, hogy a bázispárok pontosan hol és milyen sorrendben helyezkednek el a DNS-láncon belül, szekvenálásnak nevezik. Sokfajta szekvenáló módszer létezik, és egy ember teljes DNS-láncát is fel lehet térképezni, ekkor beszélünk a teljes genomról. Ez azonban (egyelőre) drága és bonyolult feladat ahhoz, hogy például a mindennapi gyógyászatban el tudjon terjedni.
Erre egyfajta megoldásként a 2000-es évek eleje óta olyan szekvenálási módszereket fejlesztettek ki, amelyek nem határozzák meg a teljes genomot, csak rengeteg kisebb mintát vesznek belőle. Ez sokkal olcsóbb és egyszerűbb, de sajnos nagyobb hibaszázalékkal dolgozik. Ezekben a kisebb DNS-szeletekben a tapasztalatok szerint 0,1-10 százalék között találni hibát, a 10 százalék már laikus szemmel is elég nagynak érzékelhető arány.
Nem túlzás azt állítani, hogy a hiba megtalálása életbevágóan fontos, hiszen egy beteg élete is múlhat rajta.
Óriási feladatról van szó, hiszen azt kell minden kétséget kizáróan eldönteni, hogy egy adott DNS-szakaszban az oda nem illő bázispár ténylegesen ott van, és ebben az esetben mutációt találtak a génben, vagy csak a szekvenálás hibája látszik, amit nem kell figyelembe venni.
Jelentős fejlesztések történtek annak érdekében, hogy a hibát és a mutációt azonosítani tudják. Az egyik, ha nem a legjobb megoldással pedig a Google állt elő, ez a DeepVariant szoftver, amely mesterséges intelligenciát alkalmaz a munkájához. A szoftver óriási adatbázisokból dolgozik, a mintákat összeveti teljes genomokkal és más mintákkal, majd a hibákat javítja, a mutációkat pedig kimutatja.
A Google most úgy döntött, hogy a szoftver forráskódját nyílttá, azaz mindenki számára elérhetővé teszi. Ettől azt várják, hogy megindulnak a fejlesztések, hiszen ezentúl bárki rámozdulhat a lehetőségre.
Miért jó ez a Google-nek? A döntés mögött nem annyira humanitárius, mint inkább üzleti érdekek is lehetnek. A Google háza tájáról itt van egyszerű példának a Chrome böngésző, amely szintén nyílt, és mivel szinte mindenki fejleszt rá, segítségével a Google került kulcspozícióba a felhasználók számítógépeinek jelentős részénél. Ha pedig a DeepVariant tényleg nagyon jó, kiállja a szakma és az idő próbáját, akkor a Google a mesterséges intelligenciára építő genetikában is meghatározó pozícióba kerülhet.
Fotó: AFP/Europress
Tech
Fontos