Hjem udtalelser Ai er (også) en styrke til god | ben dickson

Ai er (også) en styrke til god | ben dickson

2024

Indholdsfortegnelse:

Hvordan Deep Learning genererer menneskelige stemmer
Gendanne en stemme uden personers stemme
Afvejning af de negative anvendelser af AI-synthesizere

Video: Союзники будут бить нацистов по больному месту - Вторая мировая - 031 - 30 марта 1940 года (Oktober 2024)

I 2017 berøvede Amyotrophic Lateral Sclerosis (ALS), en ødelæggende neurologisk lidelse, Pat Quinn, grundlæggeren af den berømte Ice Bucket Challenge, for hans evne til at tale.

I 2018 hjalp kunstig intelligens ham med at få det tilbage.

Takket være fremskridt inden for maskinlæring og dyb læring er kunstige intelligensalgoritmer blevet meget gode til at efterligne mennesker. Men selvom mange fremtrædende udviklinger i rummet har været negativ, var AI's efterligningskraft en kraft af positiv forandring for Quinn.

"De fleste mennesker, der lever med ALS (også kendt som motorneuronsygdom) ender med at lamme og er ude af stand til at kommunikere med andet end kunstige 'computer'-stemmer, " siger Oskar Westerdal, medstifter af Project Revoice, et initiativ, der sigter mod at hjælpe ALS-patienter som Quinn.

For at genskabe Quinns stemme, samarbejdede Project Revoice med Lyrebird, en af en håndfuld virksomheder, der bruger AI til at klone en persons stemme - en gruppe, der også inkluderer Googles WaveNet og Voicery, en Y Combinator-understøttet opstart, der bruger AI til at skabe syntetiserede stemmeoptagelser.

Hvordan Deep Learning genererer menneskelige stemmer

Bag disse applikationer er dybelæringsalgoritmer, en populær gren af AI, der gennemgår store datasæt for indsigt og mønstre, der ikke kan indfanges med traditionel, regelbaseret software. Når du træner en dybelærende stemmesynthesizer med nok stemmeoptagelser, skaber den en digital model, der repræsenterer personens stemme og kan generere nye stemmeprøver.

Før fremkomsten af AI-drevet stemmesynteseteknologi måtte ALS-patienter bruge generiske digitale stemmer, der ikke var deres egne. Andre teknologier kunne sy sammen forindspilte sætninger med patientens stemme, men resultaterne var for kunstige og krævede snesevis af timers stemmeafspilning for at være minimal brug.

Deep-learning-applikationer kræver på den anden side langt mindre data og giver bedre resultater. "Hvad Lyrebird kan opnå med bare et par timers lyd er bemærkelsesværdigt - det giver folk en komplet digital stemmeklon, så de kan sige, hvad de vil, " siger Westerdal.

Gendanne en stemme uden personers stemme

En af grænserne for applikationer med dyb læring er deres afhængighed af dataprøver af høj kvalitet til at træne deres neurale netværk. Problemet med ALS-patienter er, at når de mister deres stemmer, er det umuligt at optage stemmeprøver. Heldigvis havde Quinn timer med indspillede keynoter og interviews.

"Den største udfordring var kvalitet. Denne teknologi er fuldstændig afhængig af at have ensartede optagelser i høj kvalitet, der også følger et nøjagtigt script - så vi var nødt til at arbejde med et lydstudie for manuelt at 'remaster' og transkribere alle linjer i dialog, vi kunne finde af Pat, ”siger Westerdal.

"Vi var lidt bange for, at vi ikke ville være i stand til at give en god kvalitet til at skabe Pats stemme, " siger Jose Sotelo, medstifter af Lyrebird. "Da vi ikke kunne få rene optagelser, er den endelige kvalitet af den kunstige stemme ikke perfekt. Vi tror, vi kan gøre et meget bedre stykke arbejde med rene optagelser."

Resultaterne lyder stadig lidt unaturlige og syntetiske. Men for Quinn, der havde brugt en generisk stemme til at kommunikere, var forskellen dramatisk. "Efter at have hørt min stemme gennem denne nye teknologi, blev jeg sprængt! For patienter at vide, at de kan have deres egen stemme, når ALS tager den væk, vil det ændre den måde, folk lever med ALS, " siger han.

Quinn anbefaler, at ALS-patienter optager deres stemmer, før det er for sent. "Efter at have hørt min egen stemme igen, har jeg brug for, at ALS-patienter ved, at det er utroligt vigtigt, at det er utroligt vigtigt at optage deres stemme, " siger han.

Afvejning af de negative anvendelser af AI-synthesizere

Tidligere i år udløste FakeApp, en AI-drevet ansigtsbyteapplikation, et angreb på falske pornografiske videoer med berømtheder og politikere. Der er bekymring for, at applikationer som FakeApp og Lyrebird indleder en ny tidsalder med falske nyheder, svig og forfalskning.

Etik-siden på Lyrebirds websted har tidligere erkendt, at teknologien kunne "potentielt have farlige konsekvenser såsom vildledende diplomater, svig og mere generelt ethvert andet problem, der skyldes at stjæle en andres identitet."

For at styre dette punkt har selskabets hjemmeside flere syntetiserede optagelser oprettet med stemmerne fra Donald Trump og Barack Obama.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- Lyrebird AI (@LyrebirdAi) 4. september 2017

Quinns historie kan hjælpe med at belyse de positive aspekter af en branche, der har taget flak for den potentielt uhyggelige og uetiske anvendelse af dens applikationer. "Det er vigtigt, at folk er klar over den lyse side af denne teknologi, " minder Lyrebird's Sotelo.

Bortset fra medicinsk brug kan AI-synthesizer-applikationer tjene andre produktive mål. Voicery leverer mærker med tilpassede digitaliserede stemmer drevet af AI-algoritmer. Google eksperimenterer også med WaveNet for at give en mere naturlig oplevelse til brugerne af dets Google Assistant-drevne enheder. Andre områder, hvor teknologien er nyttig inkluderer at automatisere lydbøger eller gøre stemmedobbing i film meget lettere.

Etiske og juridiske hindringer vil uden tvivl opstå, og debatter vil fortsætte. Men for Quinn er AI en styrke til det gode. ”Jeg vil ikke lyde som en computer, ” siger han. "Jeg vil lyde som mig."