A világon sok helyen tekintélyes erőforrásokat rendelnek a mesterséges intelligencia eszközeinek kutatására. A legnagyobb figyelem a mély neurális hálózatok felé fordul, mivel sok olyan problémát sikerült megoldani a segítségükkel, mint például az önvezető autók vezérlése, komplex képfelismerési feladatok megoldása vagy a legjobb humán gojátékos legyőzése.
A földi élet legfontosabb molekulái a fehérjék: az embernek mintegy 100 000 fehérjéje van,
a bennünk élő baktériumoknak pedig összességében több millió. Különböző nagy adatbázisok tárolják az eddig ismert fehérjék összetételét, így az elsődleges szerkezetüket leíró aminosav-szekvenciákat is. A fehérjeszekvenciákat, azaz az őket alkotó aminosavak sorrendjét ma már nem nehéz meghatározni, azonban az ismert szekvenciájú fehérjék funkciójának kiderítése még ma sem könnyű feladat.
Ennek fontosságát azzal lehet érzékeltetni, hogy sok betegség vizsgálatánál kiderült, hogy bizonyos fehérjék szintje megnő, illetve lecsökken, tehát ezek a fehérjék szoros kapcsolatban lehetnek az adott betegség kialakulásával.
Ezen fehérjék szekvenciájának meghatározása után a fehérjék funkciójának leírása nagyon fontos lépés lehet a betegség kialakulásának megértése, illetve gyógyítása felé.
A kutatók sok éve próbálkoznak mély neurális hálókat alkalmazni a fehérjék funkciójának jóslására, több-kevesebb sikerrel. Az ELTE PIT Bioinformatikai Csoport kutatói, Szalkai Balázs doktorjelölt és Grolmusz Vince professzor most megjelent publikációjukban írták le a SECLAF webszervert, amely – mindenki számára elérhetően – határozza meg a fehérjék funkcióját aminosav-sorrendjükből.
Az eredmény azért jelentős, mert eddig még nem látott, igen nagy pontosságú eszközről van szó, mely több mint 99.99%-os találati aránnyal osztályozza a fehérjeszekvenciákat az UniProt adatbázis 698 fehérjecsaládjába.
A webszerver nyilvánosan elérhető a https://pitgroup.org/seclaf/ oldalon.
A közlemény a Bioinformatics című lapban jelent meg, 2018. február 27-én. Az ingyenes változat itt érhető el: https://arxiv.org/abs/1708.04103 .