Az elmúlt évtized legnagyobb trendje az anonimizáltnak mondott adatgyűjtés lett, a mobilos és számítógépes alkalmazások, a legkülönfélébb szolgáltatások nyújtói (legyenek azok közösségi webhelyek vagy biztosítócégek) sokszor abszurd mennyiségű információval rendelkeznek, egyesek pedig brókereknek értékesítik is azokat némi plusz bevételért. A cégek szerint az adatokból nem lehet kideríteni az egyének személyazonosságát, hiszen az eladásuk előtt anonimizálják az információkat, azonban a biztonsági kutatók már évek óta kongatják a vészharangot, hogy ez gyakorlatilag mese habbal. Még akkor is, ha tényleg megvan a szándék az anonimizálásra.
Az Imperial College London és Leuveni Katolikus Egyetem kutatói kidolgoztak egy új módszert, állításuk szerint a gépi tanulást is használó algoritmusuk tizenöt ismertetőjegy alapján képes bármely anonimizált adathalmazban 99,98 százalékos pontossággal azonosítani bármely amerikai állampolgárt.
A szoftverük tanítása során ötféle forrásból szereztek információkat, a 210 különböző adathalmazban összesen 11 millió egyén adatai voltak benne.
Ezek az adathalmazok vagy nyilvánosak, vagy információbrókerektől származnak, azaz szabadon megvásárolhatóak. A kutatásukban csak a klasszikus, szűrésen alapuló azonosítási módszerrel foglalkoztak, azaz a nemhez, a születési dátumhoz, az irányítószámhoz, vagy éppen a családi állapothoz hasonló attribútumokkal dolgozik a megoldásuk.
Mindez viszont csak a jéghegy csúcsát jelenti, például mobilappokon, vagy éppen az internet böngészése során begyűjtött adatokból is nagyon sok következtetést lehet levonni, részben mivel mindenki specifikus rutinok szerint él,
a körülményei és a szokásai pedig teljesen egyedivé teszik.
Adott esetben akár komoly mintaelemzés nélkül is kideríthető valakinek a személyazonossága. Erre klasszikus példa, hogy mondjuk egy böngészőbeépülő elküldi a felhasználó által meglátogatott weblapok URL-jeit, az egyik linkben pedig benne lehet az illető felhasználói neve. Ennek ismeretében elképzelhető, hogy már csak egyetlen Google-keresésre van szükség az illető azonosításához.
A kutatók készítettek egy magyarázó weblapot is a kutatásukhoz, az angol nyelvű oldalon megadott információkat nem gyűjtik be.
Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!