Hjem Fremadrettet tænkning Intelligent assistenter: hvad kommer efter siri?

Intelligent assistenter: hvad kommer efter siri?

Video: Is a HomeKit Home Right For You? (Oktober 2024)

Video: Is a HomeKit Home Right For You? (Oktober 2024)
Anonim

Intelligente assistenter - Siri, Google Now, Cortana og lignende - er gået fra nysgerrigheder og parlor-tricks for kun få år siden til vigtige værktøjer, som mange mennesker bruger i deres daglige liv. Sidste uge droppede jeg af Intelligent Assistants-konferencen i New York, præsenteret af Opus Research, og var imponeret over de fremskridt, softwaren gør inden for en række forskellige brancher, herunder økonomiske, forsikringsmæssige og medicinske virksomheders fremskridt med at bygge specifikke agenter.

Opus Research-grundlægger Dan Miller forklarede, at mange af kerneteknologierne, såsom talegenkendelse, har eksisteret i mere end 20 år. Selvom han for nylig har set nogle store forbedringer snarere end en revolution, sagde han "vi er på en evolutionær vej", med masser af produkter på et kontinuum med forskellige muligheder. Han bemærkede, at der er hundreder af intelligente virksomhedsassistenter, der kan bruges til en enkel tekstbaseret samtale på almindeligt engelsk ved hjælp af et fast datasæt, og til ting som at navigere på et websted eller en FAQ. I den anden ende af spektret er der sandsynligvis kun et par dusin "dynamiske, menneskelige følelsesapps", der er mere samtale- og kontekstbevidste.

Miller pegede på ansøgninger, der vandt priser på konferencen. Amtrak's Julie startede som en interaktiv telefonserviceagent for mange år siden, men er nu udviklet til en agent, der arbejder på webstedet for at guide rejsende gennem Amtrak.com, baseret på en agent fra Next IT. Telefonica Mexico har en agent ved navn Nico, der har en avatar og yder også support via Twitter og Facebook, baseret på AgentBots platform. ING Holland har Inge, en app, der giver dig mulighed for at kontrollere din bankkontosaldo eller overføre penge via stemme ved hjælp af stemmebiometrisk teknologi fra Nuance til at godkende din identitet.

Ærlige omtaler inkluderer sundhedsapplikationer, såsom en app, der hjælper dig med at vælge en sundhedsplan. Andre applikationer, jeg har hørt om på showet, inkluderer Domino's Pizza, som har en app kaldet Dom, der giver dig mulighed for at bruge stemme til at bestille pizza; og BMW, som har en virtuel agent som en del af sin Up2drive-autofinansieringsarm.

Nuances Brett Beraneck talte om, hvordan udviklingen inden for dyb læring af neurale netværk har forbedret ting som naturlig sprogforståelse såvel som stemmegenkendelse, og hvordan dette nu går sammen for at gøre det muligt for en meget mere interesse for området. Nuances Nina-assistent var et tidligt eksempel, og siden da er det vokset til en masse specifikke applikationer, lige fra interaktive stemmesvarssystemer hos forsikringsselskaber til shopping-apps. Hver af disse applikationer har en anden personlighed, afhængigt af hvad den prøver at hjælpe dig med.

En stor ny funktion, han diskuterede, var stemmebiometri, hvor din stemme erstatter et kodeord. Han talte om, hvordan virksomheder som ING i Europa udvikler agenter, der ikke kun bruger stemmegenkendelse og naturlig sprogbehandling, men også begynder at bruge stemme til at genkende den, der ringer. Han sagde, at dette var både mere sikkert og mere naturligt end et traditionelt kodeord.

Mens nylige studier har bekymret sig for, at stemmeafspilninger kunne narre sådanne systemer, bemærkede Nuance, at nutidens teknologi inkluderer funktioner, der sigter mod at afhente anomalier fra optaget stemme og pegede på andre undersøgelser, der tog et andet synspunkt. Desuden, sagde han, kan designere bruge forskellige niveauer af stemmebiometri til forskellige funktioner, såsom at bruge enkel genkendelse til at kontrollere en kontosaldo, eller bede dig om at gentage en tilfældig rækkefølge af ord for betydelige pengeoverførsler.

Stemmebiometri ser bestemt ud til at vinde lidt trækkraft. Ved sidste uges Gartner-symposium inkluderede en session om "seje kundesager" i finansielle tjenester en Citibank-app, der brugte denne funktion.

MyWave har en assistent kaldet Frank, som er beregnet til at være aktiveret af flere virksomheder, så du kan interagere med dem på en mere samtale måde i stedet for at få hver virksomhed til at udvikle sin egen. De første anvendelser inkluderer en New Zealand bank og en app kaldet Saveawatt designet til at hjælpe dig med at vælge din eludbyder.

Administrerende direktør Geraldine McBride forklarede, at virksomheden forsøger at skabe assistenter, der overbryder kløften mellem kunder og service-apps, med det, det kalder "kundestyrede forhold" eller CMR, et spin på traditionelle CRM-applikationer. En stor forskel, sagde hun, er, at kunden er ansvarlig for alle hans eller hendes data snarere end forretningen.

Et andet relativt nyt firma, Expect Labs, har et produkt kaldet MindMeld, der fungerer som en backend til en række virksomheder, der ønsker at tilbyde en stemmegrænseflade til at erstatte traditionelle grænseflader og håndtere spørgsmål og svar. Dette kan bruges til en række forskellige applikationer, såsom at se tv-shows ved blot at spørge navnet og have systemforespørgslen flere systemer. (Amazons Fire TV har nogle af disse funktioner, men er ikke integreret med din kabel-set-top-boks, mens en af ​​investorerne i Expect Labs er kabelselskabet Liberty Global.)

Administrerende direktør Tim Tuttle forklarede, at MindMeld har en tendens til at bruge den talegenkendelse, der allerede er tilgængelig på de fleste enheder, og i stedet fokuserer på naturlig sprogforståelse og opbygge en viden graf over den tilgængelige information. Han sagde, at firmaet forsøger at skalere systemet til at inkludere mere information fra flere kilder og nedbryde hierarkierne for forskellige kategorier af oplysninger, der er en del af de fleste af sådanne systemer. Virkelig forståelse af spørgsmål betyder at være i stand til at forstå intention på tværs af forskellige kategorier, sagde han.

Én ting, jeg hørte fra et antal deltagere, var statistikker, der antyder, at ca. 10 procent af alle websøgninger nu udføres via efterretningsagenter. (AI-pioneren Andrew Ng sagde, at dette var sandt for stemmesøgning på Baidu sidste år, og flere mennesker sagde, at dette også nu var sandt hos Google, men jeg har ikke hørt nogen førstehåndsbekræftelse.)

Ser fremad, sagde Opus Researchs Miller, at der stadig var masser af arbejde, der skulle gøres. Systemernes grundlæggende nøjagtighed har masser af plads til forbedringer, især ved at gå fra det, du siger, til det, du mener, hvad du skal gøre som et resultat. Han nævnte en tale fra Xerox PARC-direktør Stephen Hoover på konferencen, der sagde, at systemerne i dag nu er op til 90 procent nøjagtige til at forstå, hvad vi mener, men at 10 procent er stadig et problem, fordi det er, hvad de fleste husker, når de beskæftiger sig med et system. Og Miller sagde, at der er plads til bedre personalisering, for hvis systemet ved, hvem det taler til, kan det give bedre resultater. For eksempel bemærkede han, at Facebook ved, hvem der bruger systemet, fordi du er logget ind; og sagde, at problemfrit at gøre dette med flere agenter vil blive mere vigtigt.

Det er bestemt en fascinerende kategori, og jeg forventer, at vi alle vil bruge meget mere tid på at tale med vores telefoner og computere og interagere med agenter, der ikke er helt menneskelige. Jeg finder denne en af ​​de mest spændende tendenser inden for computing i disse dage.

Intelligent assistenter: hvad kommer efter siri?