A robotokkal folytatott intelligens párbeszéd - a tudományos-fantasztikus irodalom klasszikus témája - hamarosan egy lépéssel közelebb kerül a valósághoz. A NASA és a Xerox ugyanis bemutatta Clarissa névre keresztelt, közös fejlesztésű számítógépes rendszerét, amelyet beszéddel vezérelhetnek majd a Nemzetközi Űrállomás asztronautái - közölte az amerikai nagyvállalat.
- Clarissa egy teljesen hangvezérelt virtuális űrasszisztens, segítségével az asztronauták hatékonyabban használhatják kezüket és szemüket, és teljes figyelmüket a megoldandó feladatra összpontosíthatják, miközben beszédparancsokkal vezérelik a rendszert - fejtette ki Beth Ann Hockey, a NASA Ames kutatóközpontjának vezető fejlesztője.
Felér egy emberrel
A Clarissa felszabadítja az asztronauták kezét és reagál beszédparancsaikra; munka közben hangosan felolvassa nekik a folyamat lépéseit, segít számon tartani a már elvégzett lépéseket, valamint rugalmasan megadható, beszédaktivált riasztásokkal és időzítőkkel biztosítja, hogy semmiről se feledkezzenek el. Az asztronautáknak manapság már mintegy 12 000 bonyolult műveletet kell elvégezniük a létfenntartó rendszerek működtetése, az űrruhák átvizsgálása, a tudományos kísérletek elvégzése, az orvosi vizsgálatok és más rutinfeladatok végrehajtása során.
- Próbáljon csak meg elemezni egy vízmintát, miközben végignézi egy eljárás kézikönyvét a számítógép képernyőjén, és mindezt mikrogravitációs lebegés közben - érzékelteti a feladat nehézségét Michael Fincke asztronauta, aki a nemzetközi űrállomáson eltöltött hat hónap után a közelmúltban tért vissza. - A Clarissa űrasszisztenst beszédparancsokkal irányíthatom, meghallgathatom az útmutató lépéseit, és közben mindkét kezem szabad a munkára - ez akkora segítség, mint ha még egy csapattag lenne a fedélzeten.
Nem kell külön szólongatni
Mivel a rendszernek folyamatosan készen kell állnia beszédparancsok fogadására, a virtuális asszisztens első változata minden, a közelében kiejtett szót megpróbált értelmezni, még a csapat tagjainak egymás közötti beszélgetéseit is. Ennek eredményeként a Clarissa nehezen tudta megkülönböztetni a beszélgetéseket a neki adott parancsoktól.
A NASA 2004-ben vette fel a kapcsolatot a Xeroxszal abban a reményben, hogy a vállalat gépi tanulás, nyelvészet és szövegkategorizálás terén szerzett tapasztalata révén tökéletesíthetik a rendszert.
- A NASA azt akarta, hogy a rendszer bármikor készen álljon a segítségre anélkül, hogy külön aktiválási parancsokat kéne adni neki. Ezért nem lehetett az egyszerűbb "Star Trek" megoldást választani, ahol az űrhajósok egy kérdés vagy egy parancs kimondása előtt valahogy megszólítják a rendszert, például azt mondják, "Számítógép!". Meg kellett oldanunk, hogy a rendszer jobban meg tudja különböztetni a parancsokat a beszélgetéstől. - mondta el Jean-Michel Renders, a Xerox kutatója.
Van még mit tanulnia
A Xerox dokumentumkezelésre is alkalmazott módszerével a Clarissa pontosabban tudja elemezni a beszédet: nem csak a szavakat ismeri fel, hanem a mondatok és a szavak összefüggéseit is, és reagálni tud a különbözőképpen megfogalmazott parancsokra. A rendszer megvizsgálja a mondat összes szavát, figyelembe azok helyes felismerésének megbízhatóságát, és gépi tanulási algoritmusával súlyozza az információkat.
Vannak egyszerű parancsok, mások azonban eléggé bonyolultak - magyarázza Hockey. - Többnyire olyan utasítások hangzanak el, mint "tovább" vagy "menj a 8. lépésre". Előfordul azonban, hogy ilyesmit kell mondani: "10 óra 25-ös riasztást kikapcsolni" vagy "visszakérdezéses ellenőrzés beállítása a 3-as - 14-es lépésekre".
A Clarissa jelenleg mintegy 75 különböző parancsot ért, amelyek 260 körüli szóból álló szókészlettel fogalmazhatók meg. A csapat azt tervezi, hogy a jövőben tovább növeli a parancsok számát és a használható szókészletet.