Krishnamurthy több listát állított össze a legdrasztikusabb hibákról, félreértésekről.
Jensen a "Gates jó marketingmunkát végez a Microsoftnál" mondatot hozza fel példaként, ami angolul, egy tipikus hibát beleerőltetve a következőképpen hangzik: Gates do good marketing job in Microsoft. A mondat a mi szándékunk szerinti jelentésben nyelvtanilag hibás, a program mégsem javítja ki. Miért nem? A "gate" szó angolul kaput, a "gates" kapukat jelent, a mondatnak "kapuk jó marketingmunkát végeznek a Microsoftnál" is lehet az olvasata. Mi persze valószínűleg nem így olvassuk, a gép viszont nem különbözteti meg (Bill) Gates Microsoft-főnököt a kapuktól. Számára csak az alany és az állítmány számbeli egyeztetése (Gates do) a fontos. Ráadásul mondatkezdő szó esetén a nagybetű is helyénvaló - mondat közepén ugyancsak furán hatna a kapukat ilyen mértékben megtisztelni. Azaz a gép szemével nézve nincs semmi kivetni- vagy aláhúznivaló. Sőt, ha a mondatot korrekten, az igét az egyes szám harmadik személyhez járó s raggal megtoldva írnánk - Gates does good marketing job -, minden bizonnyal hibát jelezne.
"Jelenleg egyetlen számítógépes programtól se várható el a megértésnek ez a szintje" - magyarázza Jensen. "Egyszer talán... Óriási lenne, de még nem tartunk ott."
Valószínűség, statisztika
A Wordöt a valószínűségi és statisztikai módszerek új, az internetes keresésnél, levélszemét-felderítésnél már figyelembe vett eredményeire támaszkodva kellene átalakítani - jelentette ki Christopher Manning, a Stanford Egyetem nyelvészeti és számítástudományi tanársegédje.
A szabályalapú módszerek mellett valószínűségi technikákat is alkalmaznak - állítják a Microsoftnál, majd hozzáfűzik: "össze lehet állítani a Wordtől elvárt, de felderítetlen hibákat tartalmazó mondatok listáját, ám ez nem reprezentálná a program tényleges használatát. A programot olyan hibák észrevételére fejlesztettük, amelyeket átlagos írott nyelvi szituációk során követünk el."
Krishnamurthy szerint ez az álláspont túlzottan egyszerűsít.
Forrás: Agent Portal