Jó eséllyel sokan gondolkodtak már azon, hogy a köztudatba idén berobbant chatbotok nagy nyelvi modelljeinek betanításához mégis honnan szerezték a töméntelen mennyiségű információt a fejlesztőik. A válasz roppant egyszerű, a keresőmotorokhoz hasonlóan jóváhagyás nélkül beindexelték az interneten elérhető információkat, konkrét példaként a Bingben is elérhető ChatGPT-4 rendszert olyan 300 milliárd szónyi engedély nélkül szerzett információval képezték ki. Többek közt könyvekre, cikkekre, blogbejegyzésekre, fórumos és közösségi médiás posztokra kell gondolni.
Most megtörtént az emiatt borítékolható jogi lépés, egy Kaliforniában indítani kívánt perben azzal vádolják a ChatGPT-t fejlesztő OpenAI-t, hogy emberi ésszel felfoghatatlan méretű szerzői jogsértést követett el a termékének létrehozása érdekében, plusz magánszféra védelmével kapcsolatos törvényeket is sértett.
Hírünk írásáig az OpenAI nem kommentálta az ügyet, feltehetően valamiféle fair használatos érveléssel kívánja majd meggyőzni a bírót, hogy nem történt szerzői jogsértés. Ennél is messze nagyobb rejtély, hogy mi történik, amennyiben a cég nem képes meggyőzni a bírót: még ha az illetékességi okból csak az USA cégeire és polgáraira korlátozza az ügy sértettjeinek körét, akkor is potenciálisan több százmillió alperesről beszélünk.
Olyan méretű lehet a kártérítési ügy, hogy a kezelése műszakilag túlmutathat az igazságszolgáltatás képességein.
Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!