V. Integrált adatbázisok
Eddig például nem vettük figyelembe a fehérjék - géntermékek - térbeli alakját. Ha a molekulák felszínét nem tudjuk is az emberi szemnek jól felfogható formában ábrázolni, a fehérjemolekulák vázát alkotó láncok formáival már sokkal jobban boldogulunk.
Animáció: Térbeli alakok csoportosítása
Itt ugyanis szemmel láthatóak az ismétlődő egyenes és spirális szakaszok (vagyis a béta-szálak, alfa-hélixek), és szembetűnnek az egyezések is. A szekvenciák összehasonlításánál a számítógépek voltak ügyesebbek, a térbeli alakoknál azonban az ember: a fehérjék térbeli formáinak talán legjobb adatbázisát egy orosz kutató, Alekszej Murzin szabad szemmel osztályozza. Egyszerűen látja a különbségeket. Érdemes tehát odafigyelni, hogy mi az, amit az ember jobban tud, mint a számítógép. Két köznapi tárgy hasonlóságát például azonnal és csalhatatlanul észre szoktuk venni, mert nemcsak a közös szerkezeti elemeket látjuk, de ismerjük a közös funkciót is, vagyis például hogy egy váza úgy működik, hogy virágot tesznek bele.
Animáció: Tárgyak hasonlósága
Magyarul, szerkezeti és működési információt is használunk, méghozzá együttesen.
Vannak-e ilyen adataink? Vannak, bár jóval nehezebben kezelhetők, mint a szekvenciák adatai. Térszerkezetből például néhány ezret, funkcióból pedig néhány tízezret ismerünk. Feladatunk most az, hogy ezeket csoportosítsuk és közös adatbázisba integráljuk. A csoportosítást számítógépek végzik el, így különféleképpen rendezett adatbázisokat kapunk, amelyek között az azonos elemeket a világháló technikájával összeköthetjük.
Animáció: Integrált adatbázis - Azonosítás új adatok bevonásával
Így egy rendezett információs hálózathoz jutunk, amelyben az egyes csoportok megfeleltethetők egymásnak. Akkor is, ha nem minden tagjukról van meg minden információ. Az összekötéssel látszólag nagyon kis dolgot csináltunk, de ezzel a tárolt tudás életre kelt, eddigi bizonytalan értelmezéseinket meg tudjuk erősíteni!