A Google által felvásárolt DeepMind cég mesterséges intelligenciája már több ízben bizonyított, eddig főként játékok terén. Nemrég az AlphaGo nevű szoftver verte meg a góbajnok Li Szedolt 4:1-re, korábban pedig számos 2D-s Atari játékot tanult meg játszani, többek közt a faltörő Breakoutot.
Most újabb kísérleti projektet jelentett be a Google, ezúttal focizni tanítják meg a szoftvert, hogy a 3D-s navigációt is fejlesszék. A tesztjáték valójában egy hangyafoci, játék közben azt fogja megtanulni a DQN nevű algoritmus, hogyan lőjön gólt, s miként taktikázzon, mindezt egy digitális hangya képében. Ez gyakorlatilag annak az algoritmusnak a továbbfejlesztett változata lesz, ami az Atari játékokat is játszotta.
Ennek megvalósításához a cég egyszerre használja fel a mély tanulást, a neurális hálózatokat, és a megerősítéses tanulást (reinforcement learning). Ez utóbbi módszer lényege, hogy
a program folyamatosan hibázik, és ezekből tanul.
Jutalmazással, illetve büntetéssel tanulja meg, mi volt a jó lépés.
A gépi mély tanulás alapja pedig, hogy a neurális hálózatokba táplált rengeteg adatot használja fel az algoritmus ahhoz, hogy következtetéseket és kapcsolatokat fedezzen fel, majd azokat alkalmazza az új információk esetében is.
A deep learning az utóbbi évek egyik legfontosabb technológiája,
ez teszi lehetővé, hogy a számítógépeket ne kelljen egyesével megtanítani minden különböző feladatra, hanem önmagától legyen képes elsajátítani dolgokat. Nem véletlen, hogy a Google mellett a Facebook és a Microsoft is erősítette csapatát ezzel foglalkozó szakemberekkel az utóbbi években.
A fejlesztést minden bizonnyal beépítik Google szolgáltatásokba is, hogy melyikbe, azt nem részletezte a cég. Az algoritmust korábban nem csak játékokhoz használták, de a keresési ajánlatokhoz is.
A cég említette azt is, hogy hasznos lehet később a robotikus manipulációban, a robotok irányításában.