Programmering

Et tastatur? Hvor eiendommelig

Tiden med stemmesøk og stemmestyrt programvare er over oss. Som utvikler lever jeg og dør ved tastaturet, men jeg kan allerede se tegnene: Som for eksempel mange mennesker snakker jeg med Android-telefonen min (for eksempel "Naviger til Lowes [eller Starbucks eller Harris Teeter]") til Få veibeskrivelse.

I Mary Meekers 2016 Internet Trends Report, rapporterer hun at Google Voice-søkene har økt med en faktor på syv siden 2010. Jeg har også lagt merke til at sønnen min på 12 år gjør nesten alle søkene sine via stemmen - og min kjæresten tekster meg på denne måten med jevne mellomrom. Også selskapet jeg jobber for, Lucidworks, kunngjorde nylig et nytt partnerskap med IBM for å integrere Watson og tekst-til-tale-funksjoner i vårt søkeprodukt for bedrifter.

Teknologien fungerer mye bedre enn før, og det er lettere å integrere i applikasjoner. Hvis du utvikler deg for Android eller iOS, kan du enkelt koble deg til API-ene for talegjenkjenning. Men talegjenkjenning begynner ikke og slutter med enkle tale-til-tekst og talekommandoer.

Å forstå intensjonen med søket er en veldig kontekstuell oppgave, spesielt med talespråk. Videre har folk en tendens til å bruke flere ord i naturlig talespråk enn når de blir konfrontert med en søkefelt. Det er flere "støyord" i talespråk enn i et vanlig tekstsøk.

Dette er viktige AI-utfordringer. Men når vi overvinner kontekstproblemet, vil utviklere lære at mer kan gjøres med tale enn med tekst. Emosjonell kontekst vil spille en rolle. Hvis du leter etter en bensinstasjon, vil du ha den billigste eller nærmeste? Det følelsesmessige innholdet i stemmen din kan antyde det. Visst, du kan avklare, men du trenger ikke.

Din snakkesalige fremtid

Den stemmestyrte epoken handler ikke om søk alene. Det vil påvirke hele måten vi kommuniserer med datamaskiner på. I en ikke altfor fjern fremtid vil tastaturer bli betraktet som "sjarmerende", som Scotty berømt beskrev dem i "Star Trek IV."

Men det skiftet krever også et helt nytt brukergrensesnitt. Her er en eldgammel illustrasjon av hva jeg mener: Da Windows 95 kom ut, hadde IBM integrerte talekommandoer i PCene. På den tiden jobbet jeg som selger på Office Depot, og det ble raskt tydelig hvor upraktiske talekommandoer var. Vindusgrensesnittet ga seg ikke i det hele tatt til denne form for interaksjon.

Jeg mener, hvordan i helvete beveger du et vindu ut av veien til et annet vindu og endrer størrelsen på dem begge for å passe på skjermen på en effektiv måte med talekommandoer? Det gjør du ikke. Du fjerner disse vinduene (og sannsynligvis Windows) helt. Et stemmedrevet brukergrensesnitt bruker ikke de samme motivene. Du ser aldri et vindusgrensesnitt på "Star Trek."

Når vi snakker om "Star Trek", når folk begynner å kode eller gjøre noe teknisk, bytter de alltid til et taktilt grensesnitt (OK, ikke akkurat taktilt - det ser mer ut som et mikrobølgetastatur overlagt med art nouveau-gjengivelser av et kretskort). Men er regresjonen mot å "skrive" nødvendig? Riktignok kan jeg ikke forestille meg å bruke et stemmegrensesnitt for å kode i Scala. Kanskje det blir utviklet nye språk (uten parentes, i motsetning til Scala - og artiklene mine) som er spesielt tilpasset stemmen.

Nettsteder vil sikkert ikke se like ut og vil tilby nye navigasjonsparadigmer. Du vil si "vis meg tilbud på sko", og det du får tilbake vil trolig være bedre organisert og mer kontekstfølsomt enn det gjennomsnittlige nettstedet ditt ("tilbud" && "sko"). Videre vil jeg ikke bla eller si "neste side" mye, så interaksjonene må tilpasses. Systemet burde allerede vite at jeg vil ha herresko og ikke ha hardhælte sko på grunn av akilles senebetennelse. Kanskje den vet at jeg foretrekker mørke farger. Kanskje jeg fortalte det eller kanskje det analyserte oppførselen min.

Er dette i det hele tatt et nettsted? Visst, hvis jeg handler med sko, vil jeg ha en visuell fremstilling, men hvis jeg snakker, snakker maskinen kanskje tilbake. Kanskje det viser meg sko, så spør: "Leter du etter en bestemt type sko? Hvilket formål er disse skoene til? Har du på deg fotturer eller til fest?"

Tiden med stemmesøk vil endre alt fra hvordan vi kommuniserer med maskiner til hvordan vi koder. Mange av teknologiene vi trenger er allerede tilgjengelige for oss i dag, mens andre ennå ikke er oppfunnet. Effekten på brukergrensesnittene kan være dypere enn byttet fra hullkort til tastaturer.

Denne feiende endringen kommer ikke på en gang. I dag er ikke dagen for å kaste ut tastaturet. Men det kan være dagen du begynner å tenke på å redesigne nettstedet ditt for å være virkelig stemmetilgjengelig.

$config[zx-auto] not found$config[zx-overlay] not found