Mi látszik az űrből az emberi arcokon?

arcfelismerő szoftver
Vágólapra másolva!
A kémműhold ráközelít a terroristák táborára, és az arcfelismerő rendszer máris lebuktatja a keresett személyt. Léteznek-e a valóságban az akciófilmekből ismert bravúrok, mire képesek a legmodernebb szenzorok?
Vágólapra másolva!

A helyszínelő sorozatokban és kémfilmekben túlzó jelenetek láthatók arról, hogyan alkalmazzák a túlnagyított, széteső felvételeket a tettesek leleplezésére. Mintha igyekeznének elhitetni a nézővel, hogy a digitális kép a végtelenségig nagyítható, és a pixelek megjelenése után jelentős mértékben élesíthető.

Az arcfelismerés korlátai

Egy tárgy vagy egy személy felismerhetőségét egy digitális képen több tényező határozza meg. Ha az alany nincsen takarásban, és a kamera felé tekint, akkor a levegő szennyezettsége és páratartalma, valamint a fény hiánya, esetleg a túlzott megvilágítás csökkentheti a felismerés valószínűségét. Ha a felvétel jó minőségű, és a felsorolt okok nem gátolják a detektoron való leképzést, akkor az a legmeghatározóbb szempont, hogy hány pixelen képződik le a tárgy. Ez pedig elsősorban a képérzékelő felbontásától, fizikai méreteitől, az optika fókusztávolságától és a tárgy távolságától függ.

Forrás: Bakó Gábor/Interspect
A 0,25 centiméter, 0,5 centiméter és 0,7 centiméter képsíkfelbontással készült felvételen jól megfigyelhető, hogyan veszít részletességéből az arc, az újság és a mérőműszer

Fél centiméteres felbontásnál (lásd keretes írásunkat) már jó esély van az emberi arc azonosítására, míg a negyed centiméteres tárgyképfelbontás már a legegyszerűbb arcfelismerő szoftverek számára is használható (lásd a fenti képen). A rálátás, az arc iránya és a levegő tisztasága, valamint a megvilágítás azonban nem mindig ideális. A korszerűtlen térfigyelő kamerák 15 méteres távolságból még nappal sem tették lehetővé az emberi arc felismerését, ám napjainkra nagy részüket felváltották a HD minőségű, színes és gyors képváltású berendezések.

Az adott pontra irányított kamerák felvételének részletessége természetesen jóval nagyobb, mint a nagy látószögű térfigyelőké, így a modern biztonsági kamerák segítségével sokkal valószínűbb az arcfelismerés, mint a parkok, közterületek bura alatt elrejtett őreinek képén. Így általánosságban elmondható, hogy zárt terekben (például mélygarázsok belsejében, alagutakban és pénzintézetekben) sokkal jobban rögzíthető az emberek mozgása, azonosítható a kilétük, mint a költséghatékonyan kiépített, nagy területet belátó közterület-figyelő rendszerekkel. Ráadásul a parkokban és a tereken a kamerák jóval magasabbra kerülnek.

A kép felbontása

Leegyszerűsítve a kérdést, az objektívre merőleges síkként képzelhető el a fotóalany. Ha mérőszámot szeretnénk rendelni a tárgysík felbontásához, akkor a pixelnek ezen a síkon értelmezett szélessége és magassága lesz a legmarkánsabb érték. Egy centiméter tárgysíkfelbontás esetén 1 centiméteres kockákra bontja az arcot a digitális felvétel pixelhálózata (raszter). Egy egyszerű kísérlettel szemléltető, hogyan csökken a képelemzés lehetősége a tárgykép felbontásának csökkenésével. A bűnügyi hírekben nagyjából 1 centiméteres négyzetekre bontással szokták az emberi arcot felismerhetetlenné tenni. Könnyen belátható, hogy az arcfelismeréshez ennél nagyobb részletességre van szükség.

A korai kisfelbontású, ráadásul fekete-fehér képet rögzítő, sokszor lassú képváltású biztonsági kamerák esetében csak különleges esetben volt azonosítható az elkövető. A tapasztalat azt mutatja, hogy 0,7 centiméter tárgyképfelbontás esetén már van esély az arcfelismerésre, ha ismerős közösségből kell felismerni valakit, vagy saját magunkat látjuk a képen. Szoftveres módszerrel az esélyek növelhetőek, különösen subpixeles (pixeleket szétbontó) eljárások esetében, de ettől sem várható sokkal jobb eredmény. (A pixel alatti eljárás lényege, hogy az elemi képpontot további pixelekre bontja, és a pixelek közötti kapcsolatokból megbecsüli, hogy az egyes részterületek milyen árnyalatúak lehetnek.)



Forrás: Bakó Gábor/Interspect
Az előző felvételek nagyítva: látható, hogyan csökken az arc pixelfelbontása

A szenzorok fejlődése teszi lehetővé a repülőtéri arcfelismerő rendszerek bevezetését is. Arról igyekeznek meggyőződni a biometrikus azonosítás segítségével, hogy mindenki a beszállókártyájának megfelelő járatra száll-e fel.

Arcfelismerés felülről

Egy felfelé tekintő személy színes (RGB) biztonsági kameráról vagy térfigyelő kameráról történő felismerését az előbbi tényezők befolyásolják. Az űrből (űrrepülőgépről, műholdról) készített nagyfelbontású felvételek részletessége csak a filmrendező képzeletében lehet nagyobb 10 centiméternél, így az űrből történő arcfelismerés jelenleg nem lehetséges.

A repülőgépről és helikopterről készített légifotó-térképek, látványpanorámák és filmfelvételek esetében azonban kellő felbontásnál megoldható az azonosítás. Itt újabb nehézség adódhat, az úgynevezett képvándorlás: a szenzort szállító eszköz haladási sebességéből adódó elmosódás. Ha a repülőgép túl gyorsan vagy túl alacsonyan (túl kis távolságra) halad el a fényképezett felszíntől, és a záridő (a szenzor megvilágítási ideje) túl hosszú, a felvétel bemozdul.

Forrás: Bakó Gábor/Interspect
Kirándulók a Börzsönyben, a Nagy Hideg-hegyi turistaház teraszán (Bakó Gábor, Interspect IS 4)

Jelenleg csupán egy légi szenzorrendszer képes fél centiméteres terepi felbontású légifelvétel-térkép készítésére: egy magyar fejlesztésű légi mérőkamera-rendszer, amelynek csökkentett felbontású változata akár 5 milliméter képfelbontás elérésére is képes.

A légi arcfelismerésnek leginkább marketingelőnyei vannak, de alkalmazzák bevetésirányításra és helikopteres követés irányítására is. A magyar fejlesztés eredetileg nem ezeket a területeket célozza. A szenzor alapvetően környezetvédelmi ellenőrzéshez, közigazgatási tervezéshez térképezi a felszínt. Haváriák esetén, a szennyeződés felderítésére és gyors behatárolására, a katasztrófaelhárítás tervezett lebonyolításának elősegítésére ad lehetőséget. Ezen felül a vegetáció feltérképezésére és építéshatósági kérdések tisztázására, a településszervezés elősegítésére készült. (A magyar kamerarendszerről bővebben korábbi cikkünkben olvashat.)

Arcfelismerő rendszerek a számítógépen és az interneten

Számos szoftvert készítenek a számítógépen található, régen böngészett mappák átláthatatlan hálózatában rejtőző képek rendszerezésére. A modernebb képkategorizáló programokat ellátják arcfelismerő modullal is, így lehetővé válik az olyan csoportképek, családi fotók, tablóképek és egyéb fotók egybegyűjtése, amelyeken az adott személy szerepel. A Google például a Carnegie Mellon Egyetem PittPatt (Pittsburgh Pattern Recognition) nevű szoftverét vásárolta meg és építette be a Google+ keresőszolgáltatásába Find My Face néven.

A Facebook közösségi oldalon bekapcsolható Tag Suggestions szolgáltatás az albumok, képek feltöltésekor megvizsgálja a képen szereplő személyeket, majd felajánlja a címkézést, ha a feltöltő maga vagy ismerősei szerepelnek rajta. Aktiválás esetén minden képet végigellenőriz feltöltéskor, és egy barát felismerése esetén jóváhagyást kér az illető nevének feljegyzéséhez.

A Carnegie Mellon Egyetem kutatói tovább gondolták szoftverüket az ismerősök automatikus címkézésénél. Lefényképeztek néhány diákot az egyetem kampuszán, majd a továbbfejlesztett arcfelismerő rendszer segítségével viszonylag gyorsan azonosítani tudták őket a Facebookon. A kísérlet áttörést jelentett a keresési lehetőségek kiszélesítésében, és egyben személyi jogi kérdéseket vet fel. Az Európai Unió adatvédelmi csoportjának felvetései alapján a Facebook egyelőre korlátozta a szolgáltatást.

Forrás: Image Source
Arcfelismerési bélyegek

A közösségi oldalak számára az arcfelismerő rendszerek megjelenése jelentős fejlődés, ahogyan a bűnüldöző és titkosszolgálati szervezetek is hasznukat veszik. Ma már sokkal könnyebb azonosítani valakit egy biztonsági kamera közeli felvételéről, mint, mondjuk, a kilencvenes években. Sokan nem is gondolják, hogy mások által publikált csoportképről azonosítják őket, vagy kerülnek közelebb hozzájuk.

Az arcfelismerő szoftverek működése

A szoftverek működése kétféle eljáráson alapul. Az egyik számkóddal ellátott csomópontokat helyez az azonosítható kiindulási pontokra, és az így létrejövő hálózatban, a távolságok arányaiban keres egyezést más arcképeken létrehozott hálózatokkal. A másik módszer a különböző világosságértékeket felvevő képpixelek egymáshoz viszonyított helyzetét elemzi, úgynevezett raszterosztályozással keres azonosságokat.

Elsődleges arányok:

  • A szemek távolsága
  • Arccsont alakja
  • Az orr szélessége
  • Az állkapocsvonal hosszúsága

Mindkét módszer olyan területeket vizsgál, amelyek az életkor előrehaladtával nem olyan gyorsan változnak.


Bakó Gábor, Molnár Zsolt
Szent István Egyetem - Interspect csoport

Google News
A legfrissebb hírekért kövess minket az Origo Google News oldalán is!