A Microsoft kutatói közzétettek pár részletet legújabb beszédfelismerő technológiájukról. Erről azt állítja a csoport, hogy úgy jegyzi le a társalgásokat, akár egy valódi ember.
Sikerült elérnünk az emberi szintet, ami történelmi eseménynek számít
- mondta el a cég vezető szakértője, Xuedong Huang. A rendszer 5,9 százalékos hibahatárral írja le az elhangzott szavakat, ami egyezik a profi gépírókéval.
A szoftver olyan neurális nyelvi hálózatokat használ, amelyek csoportosítják a hasonló szavakat, így hatékonyabban tudják kiválasztani az általánosságban használt kifejezéseket. A Microsoft tervei szerint később a technológiát felhasználják a Cortana virtuális asszisztenshez, illetve egy élőbeszédből szöveget író programhoz is.
Ugyan ez az eredmény elképesztő, még nem teljesen tökéletes. A Microsoft még finomítja a technológiát, hogy több életszerű, spontán helyzetben is megállja helyét, és több hangszínt ismerjen fel.
Fontos megjegyezni: ez a fejlesztés arra irányul, hogy milyen pontosan ismeri fel a szavakat a szoftver, nem pedig az értelmezésre.