Az ember örökítőanyagának "szövegét" (szekvenciáját) a Humán Genom Programban már évekkel ezelőtt meghatározták. Azóta a kutatók intenzív vizsgálatokat végeznek, hogy megfejtsék a genomban (a teljes örökítőanyagunkban) kódolt információ rejtélyét, legyen szó fehérjéket kódoló génekről vagy a gének kifejeződését irányító genomi szakaszokról.
Az elmúlt három évtizedben a vizsgálatok nagy része a sejtek felépítéséért és működéséért felelős biomolekulák képződésének mechanizmusaira összpontosult. A kutatók főleg egy-egy kiválasztott gén működését vizsgálták. Sikerült fényt deríteni olyan alapvető molekuláris folyamatok részleteire, mint például az RNS képződése, a kromatinszerkezet rendeződése, a hírvivő RNS-molekula átszabdalása (splicing) és a DNS-molekula megkettőződése. Az egy-egy gén tanulmányozásával nyert ismeretek nagy része további gének vizsgálata során is általános érvényűnek bizonyult. Hiába értjük azonban egyre pontosabban e molekuláris folyamatokat, még mindig nem tudjuk, hogyan működik a teljes genom, mint rendszer.
A genetikai állományunkról elsőre leginkább a gének jutnak eszünkbe, tehát azok az információs egységek, amelyek alapján - hírvivő RNS-molekulák közvetítésével - fehérjék képződnek. A gének annak köszönhetik "népszerűségüket", hogy látványosan mutatkoznak a külvilág felé. (Nem véletlen, hogy az élőlény teljes genetikai állományát felépítő DNS-szekvenciát éppen ezekről nevezték el genomnak.) A humán genom szekvenciájának leírásakor azonban kiderült: a gének csak igen kis százalékát alkotják a teljes genetikai állománynak. Arra is fény derült, hogy egyes, géneket nem tartalmazó genomi régiók különböző fajoknál nagyon hasonlítanak egymásra, más szóval erősen konzerváltak. Ez arra utal, hogy e DNS-régióknak valószínűleg fontos feladatuk van a sejt működésében.
A 35 kutatócsoportot egyesítő ENCODE konzorcium kutatói most a humán genom egyetlen százalékát elemezték kétszáznál is több kísérleti eredmény és bioinformatikai adatsor alapján. A mintegy 30 millió bázispár hosszúságú szekvencia vizsgálata (egy bázispárnak nevezzük a kétszálú DNS-ben kódolt információ molekuláris egységét), újra rámutatott a géneket nem tartalmazó genetikai elemek jelentőségére. Úgy tűnik, e nem kódoló szakaszok központi szabályozó szerepet töltenek be az örökítőanyag működésében.
Az elmúlt évek vizsgálatai során kiderült, számos betegség kialakulásáért e géneket nem kódoló régiók a felelősek. A kutatók több százezer apró, mindössze egyetlen betűnyi (bázispárnyi) eltérést találtak az emberi genom "szövegében". Ezek az ún. SNP-k (egynukleotidos polimorfizmusok, ejtsd: sznipek) egy genomi szekvenciának olyan, egyetlen betűben (bázispárban) különböző változatai, amelyek a népesség több mint 1 százalékában megjelennek. Közöttük számos olyan is akad, amely összefügg valamilyen örökletes betegség kialakulásával, és géneket nem tartalmazó régióban található. Egy közelmúltban végzett vizsgálat során például több olyan SNP-t azonosítottak, amelyek a 2-es típusú cukorbetegség tüneteivel kapcsolatosak, de közülük csak néhány helyezkedett el valamilyen fehérjekódoló gén szekvenciájában.
Ha szeretnénk tehát teljességében megérteni az emberi betegségeket, meg kell ismernünk a teljes örökítőanyagunk többségét adó, géneket nem kódoló genomi régiók működését is. Az ENCODE projekt célja az egymással kölcsönható DNS-elemek enciklopédiájának elkészítése: olyan genomi régiók feltérképezése, amelyek fontos szerepet játszanak a genom szerveződésében és működésében, függetlenül attól, kódolnak-e géneket vagy sem.