Programmering

Hva er ansiktsgjenkjenning? AI for Big Brother

Kan Big Brother identifisere ansiktet ditt fra CCTV-overvåking på gatenivå og fortelle om du er glad, trist eller sint? Kan identifikasjonen føre til at du blir arrestert på en utestående ordre? Hva er oddsen for at identifikasjonen er feil, og virkelig knytter seg til noen andre? Kan du beseire overvåkingen helt ved hjelp av et triks?

På baksiden, kan du komme inn i et hvelv beskyttet av et kamera og ansiktsidentifikasjonsprogramvare ved å holde en utskrift av ansiktet til en autorisert person? Hva om du tar på deg en 3D-maske av ansiktet til en autorisert person?

Velkommen til ansiktsgjenkjenning - og spoofing av ansiktsgjenkjenning.

Hva er ansiktsgjenkjenning?

Ansiktsgjenkjenning er en metode for å identifisere en ukjent person eller autentisere identiteten til en bestemt person fra ansiktet. Det er en gren av datasyn, men ansiktsgjenkjenning er spesialisert og kommer med sosial bagasje for noen applikasjoner, samt noen sårbarheter for spoofing.

Hvordan fungerer ansiktsgjenkjenning?

De tidlige ansiktsgjenkjenningsalgoritmene (som fremdeles er i bruk i dag i forbedret og mer automatisert form) er avhengige av biometri (som avstanden mellom øynene) for å gjøre de målte ansiktsegenskapene fra et todimensjonalt bilde til et sett med tall (en funksjon vektor eller mal) som beskriver ansiktet. Gjenkjenningsprosessen sammenligner deretter disse vektorene med en database med kjente ansikter som er kartlagt til funksjoner på samme måte. En komplikasjon i denne prosessen er å justere ansiktene til en normalisert visning for å ta hensyn til hodets rotasjon og tilt før du trekker ut beregningene. Denne klassen av algoritmer kalles geometrisk.

En annen tilnærming til ansiktsgjenkjenning er å normalisere og komprimere 2-D ansiktsbilder, og å sammenligne disse med en database med tilsvarende normaliserte og komprimerte bilder. Denne klassen av algoritmer kalles fotometrisk.

Tredimensjonal ansiktsgjenkjenning bruker 3-D-sensorer for å fange ansiktsbildet, eller rekonstruerer 3-D-bildet fra tre 2-D-sporingskameraer pekende i forskjellige vinkler. 3-D ansiktsgjenkjenning kan være betydelig mer nøyaktig enn 2-D-gjenkjenning.

Hudstrukturanalyse kartlegger linjene, mønstrene og flekkene i ansiktet til en annen funksjonsvektor. Å legge til hudteksturanalyse i 2-D eller 3-D ansiktsgjenkjenning kan forbedre gjenkjennelsesnøyaktigheten med 20 til 25 prosent, spesielt i tilfeller av look-alikes og tvillinger. Du kan også kombinere alle metodene, og legge til multispektrale bilder (synlig lys og infrarødt), for enda mer nøyaktighet.

Ansiktsgjenkjenning har forbedret seg år etter år siden feltet startet i 1964. I gjennomsnitt har feilraten redusert med halvparten hvert annet år.

Relatert video: Hvordan ansiktsgjenkjenning fungerer

Ansiktsgjenkjenning leverandør tester

NIST, US National Institute of Standards and Technology, har utført tester av ansiktsgjenkjenningsalgoritmer, Face Recognition Vendor Test (FRVT), siden 2000. Bildedatasettene som brukes er for det meste krusskudd, men inkluderer også in-the- ville stillbilder, som de som finnes i Wikimedia, og bilder med lav oppløsning fra webkameraer.

FRVT-algoritmene sendes for det meste av kommersielle leverandører. Sammenligningen fra år til år viser store gevinster i ytelse og nøyaktighet; ifølge leverandørene er dette først og fremst på grunn av bruken av dype nevrale nettverk.

Beslektede testprogrammer for NIST ansiktsgjenkjenning har studert demografiske effekter, påvisning av ansiktsmorfing, identifikasjon av ansikter lagt ut på sosiale medier og identifikasjon av ansikter i video. En tidligere serie med tester ble utført på 1990-tallet under en annen person, Face Recognition Technology (FERET).

NIST

Ansiktsgjenkjenningsprogrammer

Ansiktsgjenkjenningsprogrammer faller for det meste i tre hovedkategorier: sikkerhet, helse og markedsføring / detaljhandel. Sikkerhet inkluderer rettshåndhevelse, og den bruken av ansiktsgjenkjenning kan være like god som å matche folk med passbildene sine raskere og mer nøyaktig enn mennesker kan, og like skumle som "Person of Interest" -scenariet der folk blir sporet via CCTV og sammenlignet til sorterte bildedatabaser. Ikke-rettshåndhevelsessikkerhet inkluderer vanlige applikasjoner som ansiktslåsing for mobiltelefoner og tilgangskontroll for laboratorier og hvelv.

Helseapplikasjoner for ansiktsgjenkjenning inkluderer pasientinnsjekking, følelsesdeteksjon i sanntid, pasientsporing i et anlegg, vurdering av smertenivåer hos ikke-verbale pasienter, oppdagelse av visse sykdommer og tilstander, identifikasjon av personalet og sikkerheten til anlegget. Markedsføring og detaljhandel med ansiktsgjenkjenning inkluderer identifisering av lojalitetsprogrammedlemmer, identifikasjon og sporing av kjente butikktyver, og gjenkjenning av mennesker og deres følelser for målrettede produktforslag.

Kontroverser, skjevheter og forbud mot ansiktsgjenkjenning

Å si at noen av disse applikasjonene er kontroversielle, ville være en underdrivelse. Som en New York Times-artikkel fra 2019 diskuterer, har ansiktsgjenkjenning virvlet i kontrovers, fra bruk til stadionovervåkning til rasistisk programvare.

Stadionovervåking? Ansiktsgjenkjenning ble brukt i Super Bowl i 2001: programvaren identifiserte 19 personer som antas å være gjenstand for utestående tegningsretter, selv om ingen ble arrestert (ikke på grunn av manglende forsøk).

Rasistisk programvare? Det har vært flere problemer, startende med 2009-ansiktssporingsprogramvaren som kunne spore hvite, men ikke svarte, og fortsatte med MIT-studien fra 2015 som viste at datidens ansiktsgjenkjenningsprogramvare fungerte mye bedre på hvite mannlige ansikter enn kvinner og / eller Svarte ansikter.

Denne typen problemer har ført til direkte forbud mot ansiktsgjenkjenningsprogramvare på bestemte steder eller til spesifikk bruk. I 2019 ble San Francisco den første store amerikanske byen som hindret politi og andre politimyndigheter fra å bruke programvare for ansiktsgjenkjenning; Microsoft etterlyste føderale regler om ansiktsgjenkjenning; og MIT viste at Amazon Rekognition hadde flere problemer med å bestemme kvinnelig kjønn enn mannlig kjønn ut fra ansiktsbilder, samt mer problemer med svart kvinnelig kjønn enn hvitt kvinnelig kjønn.

I juni 2020 kunngjorde Microsoft at de ikke vil selge og ikke har solgt programvaren for ansiktsgjenkjenning til politiet; Amazon forbød politiet å bruke Rekognition i ett år; og IBM forlot ansiktsgjenkjenningsteknologien. Det er ikke lett å forby ansiktsgjenkjenning, med tanke på at det er bredt adoptert i iPhones (Face ID) og andre enheter, programvare og teknologier.

Ikke all programvare for ansiktsgjenkjenning lider av de samme skjevhetene. NIST-demografiske effekter-studien i 2019 fulgte opp MIT-arbeidet og viste at algoritmisk demografisk skjevhet varierer mye blant utviklere av ansiktsgjenkjenningsprogramvare. Ja, det er demografiske effekter på den falske samsvaringsfrekvensen og falske ikke-samsvaringsfrekvensen for ansiktsidentifikasjonsalgoritmer, men de kan variere med flere størrelsesordener fra leverandør til leverandør, og de har blitt avtagende over tid.

Hacking ansiktsgjenkjenning, og anti-spoofing teknikker

Gitt den potensielle personverntrusselen fra ansiktsgjenkjenning, og tiltrekningen av å få tilgang til høyverdige ressurser beskyttet av ansiktsgodkjenning, har det vært mange anstrengelser for å hacke eller spoof teknologien. Du kan presentere et utskrevet bilde av et ansikt i stedet for et levende ansikt, eller et bilde på en skjerm eller en 3D-trykt maske for å bestå autentisering. For overvåking av CCTV kan du spille av en video. For å unngå overvåking kan du prøve “CV Dazzle” tekstiler og sminke, og / eller IR-lysemittere, for å lure programvaren til ikke å oppdage ansiktet ditt.

Selvfølgelig er det anstrengelser for å utvikle anti-spoofing-teknikker for alle disse angrepene. For å oppdage trykte bilder bruker leverandører en levetidstest, for eksempel å vente på at motivet skal blinke, eller utføre bevegelsesanalyse, eller bruke infrarød for å skille et levende ansikt fra et trykt bilde. En annen tilnærming er å utføre mikroteksturanalyse, siden menneskelig hud er optisk forskjellig fra utskrifter og maskeringsmaterialer. De nyeste anti-spoofing-teknikkene er for det meste basert på dype konvolusjonelle nevrale nettverk.

Dette er et felt i utvikling. Det pågår en våpenkrig mellom angripere og anti-spoofing-programvare, samt akademisk forskning om effektiviteten til forskjellige angreps- og forsvarsteknikker.

Ansiktsgjenkjenning leverandører

I følge Electronic Frontier Foundation er MorphoTrust, et datterselskap av Idemia (tidligere kjent som OT-Morpho eller Safran), en av de største leverandørene av ansiktsgjenkjenning og annen biometrisk identifikasjonsteknologi i USA. Den har designet systemer for statlige DMV-er, føderale og statlige politimyndigheter, grensekontroll og flyplasser (inkludert TSA PreCheck) og statsavdelingen. Andre vanlige leverandører inkluderer 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst og NEC Global.

NIST Face Recognition Vendor Test viser algoritmer fra mange flere leverandører fra hele verden. Det finnes også flere åpen kildekode-ansiktsgjenkjenningsalgoritmer, av varierende kvalitet, og noen få store skytjenester som tilbyr ansiktsgjenkjenning.

Amazon Rekognition er en bilde- og videoanalysetjeneste som kan identifisere objekter, personer, tekst, scener og aktiviteter, inkludert ansiktsanalyse og tilpassede etiketter. Google Cloud Vision API er en forhåndsutdannet bildeanalysetjeneste som kan oppdage objekter og ansikter, lese utskrevet og håndskrevet tekst og bygge metadata i bildekatalogen din. Google AutoML Vision lar deg trene tilpassede bildemodeller.

Azure Face API gjør ansiktsgjenkjenning som oppfatter ansikter og attributter i et bilde, utfører personidentifikasjon som samsvarer med en person i ditt private lager på opptil 1 million mennesker, og utfører opplevd følelsesgjenkjenning. Face API kan kjøre i skyen eller på kanten i containere.

Ansiktsdatasett for gjenkjenningstrening

Det er dusinvis av ansiktsdatasett tilgjengelig for nedlasting som kan brukes til gjenkjenningstrening. Ikke alle ansiktsdatasett er like: De har en tendens til å variere i bildestørrelse, antall personer som er representert, antall bilder per person, bildeforhold og belysning. Politi har også tilgang til ikke-offentlige ansiktsdatasett, for eksempel gjeldende krusskudd og førerkortbilder.

Noen av de større ansiktsdatabasene er merket ansikter i naturen, med ~ 13 000 unike mennesker; FERET, brukt til de tidlige NIST-testene; Mugshot-databasen som brukes i den pågående NIST FRVT; SCFace-overvåkingsdatabasen, også tilgjengelig med ansikts landemerker; og merkede Wikipedia-ansikter, med ~ 1,5 000 unike identiteter. Flere av disse databasene inneholder flere bilder per identitet. Denne listen fra forsker Ethan Meyers gir noen gode råd om å velge et ansiktsdatasett til et bestemt formål.

Oppsummert forbedres ansiktsgjenkjenning, og leverandører lærer å oppdage mest spoofing, men noen applikasjoner av teknologien er kontroversielle. Feilfrekvensen for ansiktsgjenkjenning halveres hvert annet år, ifølge NIST. Leverandører har forbedret anti-spoofing-teknikkene sine ved å inkorporere nevrale nettverk.

I mellomtiden er det initiativer for å forby bruk av ansiktsgjenkjenning under overvåking, spesielt av politiet. Å forby ansiktsgjenkjenning ville imidlertid være vanskelig, med tanke på hvor utbredt det har blitt.

Les mer om maskinlæring og dyp læring:

  • Dyp læring kontra maskinlæring: Forstå forskjellene
  • Hva er maskinlæring? Intelligens hentet fra data
  • Hva er dyp læring? Algoritmer som etterligner den menneskelige hjerne
  • Maskinlæringsalgoritmer forklart
  • Automatisert maskinlæring eller AutoML forklart
  • Veiledet læring forklart
  • Semi-veiledet læring forklart
  • Uovervåket læring forklart
  • Forsterkningslæring forklart
  • Hva er datasyn? AI for bilder og video
  • Hva er ansiktsgjenkjenning? AI for Big Brother
  • Hva er naturlig språkbehandling? AI for tale og tekst
  • Kaggle: Hvor dataforskere lærer og konkurrerer
  • Hva er CUDA? Parallell behandling for GPUer
$config[zx-auto] not found$config[zx-overlay] not found