A generatív mesterséges intelligenciákat fejlesztő ipar az elmúlt években látványos áttöréseket ért el, bár a chatbotjaik, a képkészítőik, vagy legújabban a videógenerálóik továbbra sem olyan jók, hogy üzleti célokra megbízhatóan bevethetőek legyenek.
További óriási probléma, hogy ezeket a generálórendszereket kolosszális mennyiségű adaton kell betanítani, hogy működjenek. Éveken nem senki sem firtatta, hogy a fejlesztőcégek mégis honnan szedik a gigantikus mennyiségű információt, de a termékeik nyilvánossá válásával elkerülhetetlen lett a szennyes megpiszkálása: oroszlánrészt az internetről összegereblyézett, engedély nélkül lemásolt szövegeken, képeken, videókon lettek betanítva.
Most a YouTube új vezérigazgatója figyelmeztette emiatt a ChatGPT chatbotról és a DALL-E képgenerálóról elhíresült OpenAI fejlesztőcéget, hogy ne merje ellopkodni a Sora videógeneráló betanításához a videómegosztón lévő tartalmakat, az egyértelműen sértené a szolgáltatás felhasználási feltételeit.
Könnyen elképzelhető, hogy Neal Mohan alaposan elkésett az udvarias fenyegetőzéssel, a beírt szövegek alapján videókat generáló Sora már privát tesztelés alatt áll, a körülményekhez mérten pedig egészen lenyűgöző mozgóképeket tud előállítani. Szintén beszédes, hogy március közepén a The Wall Street Journal meginterjúvolta az OpenAI műszaki igazgatóját, és felmerült a Sora betanításához használt videók forrásának a kérdése is.
Mira Murati azt állította az interjúban, hogy fogalma sincs, honnan származik a kolosszális mennyiségű videó. Ez annyira kínos volt, hogy pár pillanatra még az interjúztatónak is elállt a lélegzete.
Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!