Hjem udtalelser Den hellige gral af stemmevisning, nu på skype | john c. dvorak

Den hellige gral af stemmevisning, nu på skype | john c. dvorak

Video: Realtime English - German voice translation with Skype (Oktober 2024)

Video: Realtime English - German voice translation with Skype (Oktober 2024)
Anonim

Hvis du fulgte computerrevolutionen fra starten af ​​mikroprocessoren, ville du vide, at der er en række tidlige løfter, som endnu ikke er opfyldt.

En af disse er en direkte oversat tale, hvor du siger noget på engelsk, og det gentages på et andet sprog, som spansk, i nær realtid. Selvom der stadig er et igangværende arbejde, er Microsoft nu et skridt nærmere med Skype Translator, hvis første fase blev startet denne uge.

Hvis dette kommer tæt på at arbejde og ikke er en vittighed, er det produktets årti. Lige nu understøtter Skype Translator spansk-til-engelsk og engelsk-til-spansk oversættelser, men flere sprog er indstillet til at følge.

Det typiske problem med disse slags ting er det skandaløse sværhedsniveau. Jeg har endnu ikke set en anstændig oversættelsespakke, der gør tekst-til-tekst-oversættelser, der fungerer godt. Taleoversættelse har et helt andet niveau af vanskeligheder, især i realtid.

Microsoft har en film, der viser to børn, der taler på spansk og engelsk, så det ser ud som om det fungerer godt. Men jeg så et lignende system demonstreret af IBM for næsten 20 år siden, som aldrig så dagens lys. IBMs version blev udviklet i 1990'erne, da der var en talegenkendelsesmani ledet af Lernout & Hauspie, et selskab, der gik for brød - inden det gik over en svindelskandale i 2001. Før det købte det dog enhver tale-teknologi selskab, det kunne, herunder Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone og andre. Microsoft havde en andel på 8 procent i L&H og endte med nogle af teknologierne som en konkursafskedsgave.

Nu vises Skype Translator pludselig. Sammentræf? Uanset hvad der har taget alt for lang tid, har det taget alt for lang tid at komme til dette punkt.

Se på de elendige tekst-til-tekst computeroversættelser udført af Google og andre. Tekst undgår og kan ikke undgå det mest indlysende af fejl. Intet af dette nærmer sig kompleksiteten af ​​taleoversættelse, som indebærer tung signalbehandling.

Jeg er en vinsamler og besøger ofte franske vingårdswebsteder. Min fransk er kun okay, så jeg tænder ofte for oversættelsen for at fremskynde læsning af webstedet. Her er vi i 2014, og ingen af ​​oversættere kan finde ud af, at oversættelsen af ​​Château Margaux er Château Margaux, ikke Castle Margaux. Hvor vanskeligt er det at afstå og ikke oversætte et almindeligt anvendt ord, der bruges i et rigtigt navn, såsom château, der normalt henviser til en bestemt vingård, til ordet slot? Det er tilsyneladende umuligt. De gør det alle sammen.

Hvor svært er det at skrive en undtagelse i koden, der fortæller oversætteren, at den findes på et websted om Bordeaux-vin? På dette sted betyder ordet château ikke slott. Ofte vil oversætteren også forsøge at afkode resten af ​​slottets navn med latterlige resultater. Det bedste, du generelt kan gøre med tekstoversættelse, er at få et indblik i, hvad webstedet siger.

Spørg dig selv: Hvis tekst er så vanskelig, hvordan vil Microsoft administrere tale?

Det er næsten umuligt, selv på det samme sprog. Tag Google Voice-telefontjenesten. Det har en tale-til-tekst beskedoptagelsesfunktion. Jeg har aldrig modtaget en tale-til-tekst-meddelelse, der endda kommer tæt på det, personen faktisk sagde. Ikke en gang.

Jeg må indrømme, at i et stille rum, når du taler tydeligt og tydeligt, er stemmegenkendelse godt. Jeg bruger den til tekstbeskeder på min Android-telefon. Men i en rigtig samtale snakker ingen sådan. Jeg beundrer Microsoft for at have rullet dette ud. Men det fungerer ikke som annonceret.

Når det er sagt, er det i det mindste noget at lege med. Det kan endda udløse en ny generation af forskning. Så jeg klager ikke for meget.

Alle vil have dette. Lad os komme tilbage til at arbejde på det.

Den hellige gral af stemmevisning, nu på skype | john c. dvorak