Programmering

Gjennomgang: Google Cloud AI lyser opp maskinlæring

Google har en av de største maskinlæringsstakkene i bransjen, for tiden sentrert på Google Cloud AI og maskinlæringsplattformen. Google spunnet ut TensorFlow som åpen kildekode for mange år siden, men TensorFlow er fremdeles det mest modne og mest siterte rammeverket for dyp læring. På samme måte spunnet Google ut Kubernetes som åpen kildekode for mange år siden, men det er fortsatt det dominerende containerhåndteringssystemet.

Google er en av de viktigste kildene til verktøy og infrastruktur for utviklere, dataforskere og maskinlæringseksperter, men Google AI har historisk ikke vært så attraktivt for forretningsanalytikere som mangler seriøs datavitenskap eller programmeringsbakgrunn. Det begynner å endre seg.

Google Cloud AI og Machine Learning Platform inkluderer AI-byggesteiner, AI-plattformen og akseleratorer og AI-løsninger. AI-løsningene er ganske nye og rettet mot bedriftsledere i stedet for dataforskere. De kan omfatte rådgivning fra Google eller dets partnere.

AI-byggesteinene, som er trent men tilpasses, kan brukes uten intim kunnskap om programmering eller datavitenskap. Likevel blir de ofte brukt av dyktige dataforskere av pragmatiske grunner, hovedsakelig for å få ting gjort uten omfattende modellopplæring.

AI-plattformen og akseleratorene er vanligvis for seriøse dataforskere, og krever kodingsferdigheter, kunnskap om datatilberedningsteknikker og mye treningstid. Jeg anbefaler å dra dit bare etter å ha prøvd de aktuelle byggesteinene.

Det er fortsatt noen manglende lenker i Google Clouds AI-tilbud, spesielt når det gjelder datautarbeidelse. Det nærmeste Google Cloud har en dataimport- og kondisjoneringstjeneste er tredjeparts Cloud Dataprep av Trifacta; Jeg prøvde det for et år siden og var overveldet. Funksjonsteknikken innebygd i Cloud AutoML-tabeller er imidlertid lovende, og det ville være nyttig å ha den slags tjenester tilgjengelig for andre scenarier.

Den søte undersiden av AI har å gjøre med etikk og ansvar (eller mangelen på disse), sammen med vedvarende modellforstyrrelser (ofte på grunn av partiske data som brukes til trening). Google publiserte sine AI-prinsipper i 2018. Det er et pågående arbeid, men det er et grunnlag for veiledning som diskutert i et nylig blogginnlegg om Ansvarlig AI.

Det er mye konkurranse i AI-markedet (over et dusin leverandører), og mye konkurranse i det offentlige skymarkedet (over et halvt dusin troverdige leverandører). For å gjøre sammenligningene rettferdige, måtte jeg skrive en artikkel minst fem ganger så lenge som denne, så mye som jeg hater å utelate dem, må jeg utelate de fleste produktsammenligninger. For den øverste åpenbare sammenligningen kan jeg oppsummere: AWS gjør det meste av det Google gjør, og er også veldig bra, men krever generelt høyere priser.

Google Cloud AI-byggesteiner

Google Cloud AI-byggeklosser er brukervennlige komponenter som du kan innlemme i dine egne applikasjoner for å legge til syn, språk, samtale og strukturerte data. Mange av AI-byggesteinene er forutdannede nevrale nettverk, men kan tilpasses med transferlæring og nevrale nettverkssøk hvis de ikke tjener dine behov ut av boksen. AutoML-tabeller er litt annerledes ved at den automatiserer prosessen en datavitenskapsmann vil bruke for å finne den beste maskinlæringsmodellen for et tabelldatasett.

AutoML

Google Cloud AutoML-tjenestene tilbyr tilpassede dype nevrale nettverk for oversettelse av språkpar, klassifisering av tekst, gjenkjenning av bilder, klassifisering og sporing av videoobjekter. De krever merkede data for opplæring, men krever ikke betydelig kunnskap om dyp læring, transferlæring eller programmering.

Google Cloud AutoML tilpasser Googles kamptestede, dyp nevrale nettverk med høy nøyaktighet for de merkede dataene dine. I stedet for å starte fra bunnen av når du trener modeller fra dataene dine, implementerer AutoML automatisk dypoverføringslæring (noe som betyr at den starter fra et eksisterende dypt nevralt nettverk trent på andre data) og nevral arkitektur-søk (noe som betyr at den finner den rette kombinasjonen av ekstra nettverkslag ) for oversettelse av språkpar og de andre tjenestene som er oppført ovenfor.

I hvert område har Google allerede en eller flere forhåndstrente tjenester basert på dype nevrale nettverk og enorme sett med merkede data. Disse kan godt fungere for dine data umodifiserte, og du bør teste det for å spare deg for tid og penger. Hvis de ikke gjør det du trenger, hjelper Google Cloud AutoML deg med å lage en modell som gjør det, uten at du trenger å vite hvordan du skal utføre overføringslæring eller hvordan du designer neurale nettverk.

Overføring læring gir to store fordeler over å trene et nevralt nettverk fra bunnen av. For det første krever det mye mindre data for trening, siden de fleste lagene i nettverket allerede er godt trente. For det andre trener den mye raskere, siden den bare optimaliserer de endelige lagene.

Mens Google Cloud AutoML-tjenestene tidligere ble presentert sammen som en pakke, er de nå oppført med sine basale pre-trente tjenester. Det de fleste andre selskaper kaller AutoML utføres av Google Cloud AutoML Tables.

Les hele anmeldelsen av Google Cloud AutoML

AutoML-tabeller

Den vanlige datavitenskapsprosessen for mange regresjons- og klassifiseringsproblemer er å lage en datatabell for opplæring, rense og kondisjonere dataene, utføre funksjonsteknikk og prøve å trene alle de aktuelle modellene på det transformerte bordet, inkludert et trinn for å optimalisere de beste modellene hyperparametere. Google Cloud AutoML-tabeller kan utføre hele prosessen automatisk når du manuelt identifiserer målfeltet.

AutoML-tabeller søker automatisk gjennom Googles modellpark for strukturert data for å finne den beste modellen for dine behov, alt fra lineære / logistiske regresjonsmodeller for enklere datasett til avanserte metoder for dyp, ensemble og arkitektur for større, mer komplekse. Den automatiserer funksjonsteknikk på et bredt spekter av tabelldata-primitiver - for eksempel tall, klasser, strenger, tidsstempler og lister - og hjelper deg med å oppdage og ta vare på manglende verdier, outliers og andre vanlige dataproblemer.

Det kodeløse grensesnittet veileder deg gjennom hele livssyklusen fra maskin til maskinell læring, noe som gjør det enkelt for alle i teamet ditt å bygge modeller og pålitelig innlemme dem i bredere applikasjoner. AutoML-tabeller gir omfattende inngangsdata og forklaringsfunksjoner for modellatferd, sammen med rekkverk for å forhindre vanlige feil. AutoML-tabeller er også tilgjengelig i API- og bærbare miljøer.

AutoML Tables konkurrerer med Driverless AI og flere andre AutoML-implementeringer og rammer.

Vision API

Google Cloud Vision API er en forhåndsutdannet maskinlæringstjeneste for å kategorisere bilder og trekke ut forskjellige funksjoner. Det kan klassifisere bilder i tusenvis av forhåndstrente kategorier, alt fra generiske gjenstander og dyr som finnes i bildet (for eksempel en katt), til generelle forhold (for eksempel skumring), til spesifikke landemerker (Eiffeltårnet, Grand Canyon), og identifisere generelle egenskaper for bildet, for eksempel dets dominerende farger. Det kan isolere områder som er ansikter, og deretter bruke geometriske (ansiktsorientering og landemerker) og følelsesmessige analyser på ansiktene, selv om det ikke gjenkjenner ansikter som tilhører bestemte mennesker, bortsett fra kjendiser (som krever en spesiell brukslisens). Vision API bruker OCR til å oppdage tekst i bilder på mer enn 50 språk og forskjellige filtyper. Det kan også identifisere produktlogoer og oppdage voksen, voldelig og medisinsk innhold.

Les hele gjennomgangen av Google Cloud Machine Learning API-er

Video Intelligence API

Google Cloud Video Intelligence API gjenkjenner automatisk mer enn 20 000 objekter, steder og handlinger i lagret og streaming av video. Det skiller også sceneendringer og trekker ut rike metadata på video-, skudd- eller bildenivå. Den utfører i tillegg tekstgjenkjenning og ekstraksjon ved hjelp av OCR, oppdager eksplisitt innhold, automatiserer teksting og teksting, gjenkjenner logoer og oppdager ansikter, personer og poser.

Google anbefaler Video Intelligence API for å trekke ut metadata for å indeksere, organisere og søke i videoinnholdet ditt. Det kan transkribere videoer og generere undertekster, samt markere og filtrere upassende innhold, alt mer kostnadseffektivt enn menneskelige transkriberere. Brukssaker inkluderer innholdsmoderering, innholdsanbefalinger, mediearkiv og kontekstuelle annonser.

Natural Language API

Naturlig språkbehandling (NLP) er en stor del av den "hemmelige sausen" som får innspill til Google Søk og Google Assistent til å fungere bra. Google Cloud Natural Language API avslører den samme teknologien for programmene dine. Den kan utføre syntaksanalyse (se bildet nedenfor), enhetsutvinning, sentimentanalyse og innholdsklassifisering på 10 språk. Du kan spesifisere språket hvis du vet det; ellers vil API-et forsøke å automatisk oppdage språket. Et eget API, som for øyeblikket er tilgjengelig for tidlig tilgang på forespørsel, spesialiserer seg på helserelatert innhold.

Les hele gjennomgangen av Google Cloud Machine Learning API-er

Oversettelse

Google Cloud Translation API kan oversette over hundre språkpar, kan automatisk oppdage kildespråket hvis du ikke spesifiserer det, og kommer i tre smaker: Basic, Advanced og Media Translation. Advanced Translation API støtter en ordliste, batch-oversettelse og bruk av tilpassede modeller. Basic Translation API er egentlig det som brukes av Google Translate-grensesnittet. AutoML-oversettelse lar deg trene tilpassede modeller ved hjelp av transfer learning.

Media Translation API oversetter innhold direkte fra lyd (tale), enten lydfiler eller strømmer, på 12 språk, og genererer automatisk tegnsetting. Det er separate modeller for lyd og video- og telefonsamtaler.

Les hele gjennomgangen av Google Cloud Machine Learning API-er