Hjem udtalelser Hvordan ai, ml vil transformere tale-til-tekst, sprogoversættelser | tim bajarin

Hvordan ai, ml vil transformere tale-til-tekst, sprogoversættelser | tim bajarin

Video: AI Language Models & Transformers - Computerphile (Oktober 2024)

Video: AI Language Models & Transformers - Computerphile (Oktober 2024)
Anonim

En af de mest imponerende demoer hos Google I / O var Duplex, en kunstig intelligens, der foretog opkald til forretningssteder - i dette tilfælde en frisørsalon og en restaurant - for at booke aftaler. Menneskerne i den anden ende af linjen var tilsyneladende ingen klokere, og Duplex håndterede udfordringer med lethed, ligesom når restauranten sagde, at den ikke accepterede forbehold for små fester.

Denne særlige AI-meddelelse fik en masse dækning på Google I / O, men AI og maskinlæring var fremherskende i alle de produkter og tjenester, der blev vist på udviklerkonferencen. Bare se på dette diagram, som Google viste ved en AI-fokuseret analytikebegivenhed dagen før I / O åbnede.

Der var to andre ting, der blev vist ved den begivenhed, at jeg betragter potentielle spiludskiftere.

Den første er, hvordan AI anvendes til tale-til-tekst-oversættelse. Målet er at få dette til 99 procent nøjagtighed ved hjælp af AI og ML i de næste par år. Når det er sagt, var demoerne, som de dikterede kommentarer til forskellige G-Suite-applikationer, allerede ret nøjagtige. Vi så også en mere dybdegående demo af Smart Compose, hvor en person skriver en sætning i Gmail, og Smart Compose skriver den næste sætning til dig baseret på den første sætnings kontekst.

Forskellige stemmegenkendelsesprodukter, såsom Dragon Dictate, har været på markedet i årevis. Men disse programmer var afhængige af lokaliseret software og drage fordel af den aktuelle behandlingsstyrke, der var tilgængelig på tidspunktet for hver udgivelse. Disse programmer blev bedre med årene, men hvis du annoncerer AI og ML, er nøjagtighedsfrekvensen bestemt bedre.

Google forstår vigtigheden af ​​tale-til-tekst, når det drejer sig om vores hverdag. En nøjagtig tale-til-tekst-grænseflade er kritisk, når du besvarer en meddelelse, mens du kører. Det er en meningsfuld måde at svare på en e-mail eller tekstmeddelelse på wearables eller smartphones. Det vil til sidst blive et værdifuldt input, når du bruger blandede reality-briller, hvor brug af stemme som en del af navigationsprocessen og stemme-til-tekst er nødvendig for forskellige typer AR-applikationer.

Det andet er, hvordan AI og ML bruges i Google Translate, hvilket vil være virkelig transformativt, når oversættelser finder sted i realtid. Som en international rejsende, der kun taler engelsk, ville denne type oversættelse være en gave. Der er nogle håndholdte enheder, der forsøger at oversætte, hvad du siger til et lokalt sprog, men de har i øjeblikket mange begrænsninger.

Google har øje med denne type oversættelse, så det er sikkert at sige, at vi snart kunne se nogle reelle gennembrud i mere nøjagtig sprogoversættelse på Android-telefoner. Apple har også AI- og ML-forskning, der foregår omkring forskellige aspekter af tale- og tekstoversættelse, så det også sammen med potentielle partnere kunne levere en mobil sprogoversættelsesløsning på iOS en dag.

AI og ML vil have en dramatisk indflydelse på tale-til-tekst-oversættelse, og dets mest fremtrædende effekt kan være som en del af UI i AR og VR eller blandet reality-briller. Personligt er sprogoversættelserne mest begejstrede for mig, da det ville gøre mine verdensrejser lettere.

Hvordan ai, ml vil transformere tale-til-tekst, sprogoversættelser | tim bajarin