Az MIT számítástechnikai és mesterséges intelligencia laborjában (CSAIL) egy olyan algoritmust fejlesztettek ki, amely az emberhez hasonló pontossággal képes megjósolni, mennyire emlékezetes vagy felejthető egy kép. Készül már hozzá egy alkalmazás is, amellyel nemsokára apró módosításokat végezhetünk fotóinkon a maradandóbb hatás, több lájk érdekében.
A MemNet nevű algoritmus minden fotót egy hőtérképhez hasonló képpé alakít: minél emlékezetesebb egy részlet, annál pirosabb, "forróbb" lesz. "Az emlékezetesség felderítése abban segít, hogy nyomatékosítsuk a legfontosabb tényeket, illetve kiderítsük, milyen információkat felejtenek el legkönnyebben az emberek", mondja a kapcsolódó tanulmány vezető szerzője, Aditya Khosla.
Tesztelje saját képeit a LaMem demóoldalán! Töltse fel fotóit, majd az algoritmus kiértékeli, mennyire emlékezetes a kép: a 0,5 körüli kép felejthető, a 0,9 fölötti érték már kimagasló.
A projekt részeként a fejlesztők megalkották a világ legnagyobb képi segédanyag-adatbankját. A LaMem mind a hatvanezer fotóját részletes metaadatokkal egészítették ki, ezekkel az adott kép tetszési, érzelmi mutatója állapítható meg. Az adatbázis hozzájárulhat a képi tartalom értelmezését segítő számítógépes látás tudományterületének fejlesztéséhez is.
Igazán érdekes, hogy dacára az eltérő egyéni tapasztalatoknak és ízléseknek,
mindannyian hasonló információkat nyerünk és tárolunk egy-egy kép megtekintése után.
Például a különféle események vagy egy tevékenységekben részt vevő emberek, illetve a központi elrendezésű tárgyak megjegyezhetőbbek számunkra, mint mondjuk a tájképek - bár azok a leglátványosabbak.
Ugyanez az univerzalitás érvényes azon jellemzőkre, amelyek miatt kiesik emlékezetünkből egy-egy fotó. Vagyis, ha mind a pozitív, mind a negatív értékelés egységes szempontok mentén zajlik, akkor arra egy algoritmus is képes lehet.
A kutatócsoport korábban már létrehozott egy algoritmust, amellyel az emberi arc emlékezetes vonásai térképezhetők fel. Az új program nem csupán annyiban fejlettebb, hogy ítélőképessége megközelíti a miénket, hanem azért is, mert
az úgynevezett mélytanulás eszközkészletét veti be a döntéshozatal során.
A mélytanulás a számítás- és idegtudományt egyesíti; a mesterséges intelligencia azon területe, amely különféle rendszereket, "ideghálózatokat" használ ahhoz, hogy megtanítsa a számítógépnek, miként találhat meg önállóan az adattengerben valamely értékelhető mintázatot.
Ilyen technológia van az Apple Siri asszisztense, a Google keresést segítő automata kiegészítő (autocomplete), illetve a Facebook fotómegjelölő (phototagging) rendszere mögött. Ezek a technológiai óriások már eddig is dollár százmilliókat költöttek a mélytanulással foglalkozó startupok felvásárlására.
"Jóllehet a mélytanulás nagy lökést adott a tárgyfelismerés és helyzetértékelés területének, az emberi emlékezet előrejelzéséről eddig az volt az általános meglátás, hogy az olyan magas fokú kognitív folyamat, amit a számítástechnika soha nem lesz érhet el" - mondta a kutatás társszerzője, Aude Oliva. - "Nekünk sikerült."
Működésük során az ideghálózatok emberi irányítás nélkül is képesek csoportosítani az adathalmazokat. A hálózatok rétegekbe szerveződnek, amelyek mindegyike véletlenszerű számításokat végez az adatokkal.
Ahogy a hálózat egyre több adatot nyer, újraszervezi magát, hogy minél pontosabb előrejelzéseket készíthessen.
A MemNet algoritmus teszteléséhez a kutatók hatvanezer fotóból álló adatbázist állítottak össze. A képek mindegyikéhez kiszámoltatták az emlékezetességi mutatót, vagyis annak mértékét, hogy egy átlagember mennyire emlékezne az adott fotóra.
Ezután mind az kísérletbe bevont alanyoknak, mind az algoritmusnak azt kellett megjósolnia, hogy az emberek mennyire fognak emlékezni egy sor olyan képre, amit még soha nem láttak korábban. Az alanyok 68 százalékos találati arányához képest a MemNet 64 százalékot ért el, ami csekély különbség. Ráadásul 30 százalékkal jobb eredmény, mint a korábbi algoritmusoké.
A kutatás nem várt eredményt is hozott: Khosla kíváncsi volt, ha megmutatja az algoritmus által legemlékezetesebbnek ítélt fotókat a kísérleti alanyoknak, vajon mindegyiket képesek lesznek-e felidézni később?
"Azt feltételeztük, hogy az emberek kifáradnak, és épp annyi részletet fognak elfelejteni, mint a véletlenszerűen kiválasztott képek esetén. Ám másképp történt, ami azt jelenti, hogy
ha a nézőknek valóban emlékezetes képeket mutatunk, akkor igenis emlékezni fognak rájuk
- mondta Khosla.
Kutatótársaival most az algoritmus továbbfejlesztésén dolgozik, hogy a MemNet képes legyen akár egyetlen ember emlékezőképességét is előre jelezni.
Emlékezetesebb képek választásával hangsúlyosabbá tehetők a reklámok, a közösségi médiában elhelyezett posztok, vagy akár a napi teendőinkre emlékeztető bejegyzések. Sőt, olyan vizuális tananyag is készíthető vele, amelyet nem kell bebiflázniuk a diákoknak, mert valósággal beleég a memóriájukba.