Hoofd Innoveren De nieuwe tekst-naar-spraak-AI van Google is zo goed dat we durven wedden dat je het niet van een echt mens kunt onderscheiden

De nieuwe tekst-naar-spraak-AI van Google is zo goed dat we durven wedden dat je het niet van een echt mens kunt onderscheiden

Uw Horoscoop Voor Morgen

Kun je het verschil zien tussen door AI gegenereerde computerspraak en een echte, levende mens? Misschien heb je altijd gedacht dat je het kon. Misschien ben je dol op Alexa en Siri, maar geloof je dat je geen van beide met een echte vrouw zou verwarren.



Dingen staan ​​op het punt een stuk interessanter te worden. De technici van Google hebben hard gewerkt aan het maken van een tekst-naar-spraaksysteem met de naam Tacotron 2 . Volgens een papier ze deze maand publiceerden, maakt het systeem eerst een spectrogram van de tekst, een visuele weergave van hoe de spraak zou moeten klinken. Dat beeld wordt door het bestaande WaveNet-algoritme van Google gehaald, dat het beeld gebruikt om extreem natuurlijk klinkende menselijke spraak te produceren.

zodiac sign for january 23

Met deze methode rapporteren de onderzoekers: 'Ons model haalt een gemiddelde opiniescore (MOS) van 4,53 vergelijkbaar met een MOS van 4,58 voor professioneel opgenomen spraak.' (Een gemiddelde opiniescore is een telecommunicatieterm die meet hoe levensecht iets klinkt.)

Zoals de audiomonsters van Google aantonen, kan Tacotron 2 uit de context het verschil detecteren tussen het zelfstandig naamwoord 'desert' en het werkwoord 'desert', evenals het zelfstandig naamwoord 'present' en het werkwoord 'present', en de uitspraak dienovereenkomstig wijzigen. Het kan de nadruk leggen op woorden met een hoofdletter en de juiste verbuiging toepassen bij het stellen van een vraag in plaats van het maken van een verklaring.

En het kan tekst genereren die zo op menselijke spraak lijkt dat het moeilijk of onmogelijk is om het verschil te weten. Als je wilt zien hoe moeilijk het is, ga dan naar Google's pagina met audiovoorbeelden , en scroll naar beneden naar de laatste set samples, getiteld 'Tacotron 2 or Human?' Daar vind je Tacotron 2 en een echte persoon die elk zinnen zeggen als: 'Dat meisje heeft een video gemaakt over Star Wars-lippenstift.'



SPOILER ALERT: Om jezelf te testen, luister naar de voorbeelden en raad welke dat is voordat je de rest van deze kolom leest.

Welke samples zijn tekst-naar-spraak en welke een echte menselijke stem? De technici van Google zeggen het niet, maar ze hebben een heel belangrijke aanwijzing achtergelaten. Elk van de .wav-bestandsvoorbeelden heeft een bestandsnaam die de term 'gen' of 'gt' bevat. Op basis van het artikel is het zeer waarschijnlijk dat 'gen' spraak aangeeft die wordt gegenereerd door Tacotron 2, en 'gt' echte menselijke spraak is. ('GT' staat waarschijnlijk voor 'ground truth', een term voor machine learning die in feite 'the real deal' betekent.)

Ervan uitgaande dat dit correct is, zijn hier de antwoorden op de test:

stacy lattisaw husband and kids

'Dat meisje heeft een video gemaakt over Star Wars-lippenstift.'

Voorbeeld 1: Echte mens

Voorbeeld 2: Tacotron 2

'Ze is gepromoveerd in de sociologie aan de Columbia University.'

Voorbeeld 1: Tacotron 2

Voorbeeld 2: Echte mens

'George Washington was de eerste president van de Verenigde Staten.'

Voorbeeld 1: Tacotron 2

Voorbeeld 2: Echte mens

what zodiac sign is april 19

'Ik heb het te druk voor romantiek.'

Voorbeeld 1: Echte mens

Voorbeeld 2: Tacotron 2

Hoeveel heb je er goed? En kon je echt het verschil zien, of moest je gewoon raden?



Interessante Artikelen

Editor'S Choice

Deze oprichter studeerde gevechtspiloten en Navy SEALs om gamers te helpen beter te presteren
Deze oprichter studeerde gevechtspiloten en Navy SEALs om gamers te helpen beter te presteren
Mobalytics gebruikt kunstmatige-intelligentiesoftware om spelers van competitieve videogames te helpen hun vaardigheden te verbeteren.
Kelly LeBrock Bio
Kelly LeBrock Bio
Weet over Kelly LeBrock Bio, Affaire, Echtscheiding, Netto waarde, Etniciteit, Leeftijd, Nationaliteit, Lengte, Actrice, Wiki, Sociale media, Geslacht, Horoscoop. Wie is Kelly LeBrock? Kelly LeBrock is een in Amerika geboren Engelse actrice die beroemd is vanwege haar optredens in de films ‘Weird Science’ in 1985 en ‘Hard to Kill’ in 1990.
Riz Ahmed Bio
Riz Ahmed Bio
Weet over Riz Ahmed Bio, Affaire, Vrijgezel, Netto waarde, Etniciteit, Leeftijd, Nationaliteit, Lengte, Engelse acteur, Rapper, Wiki, Sociale media, Geslacht, Horoscoop. Wie is Riz Ahmed? De lange en knappe Riz Ahmed is een Engelse acteur en een rapper die sinds 2006 actief is op het gebied van entertainment.
Bill Gates zegt dat zijn niveau van geluk veel hoger is op 63 dan op 25, omdat hij ervoor kiest om deze 4 dingen te doen
Bill Gates zegt dat zijn niveau van geluk veel hoger is op 63 dan op 25, omdat hij ervoor kiest om deze 4 dingen te doen
De mede-oprichter van Microsoft deelt wijsheid die van toepassing is op elke generatie.
Patrice Bergeron Bio
Patrice Bergeron Bio
Weet over Patrice Bergeron Bio, Affaire, Getrouwd, Vrouw, Netto waarde, Salaris, Leeftijd, Nationaliteit, Lengte, IJshockeyspeler, Wiki, Sociale media, Geslacht, Horoscoop. Wie is Patrice Bergeron? Patrice Bergeron is een Canadese ijshockeyspeler.
Cole Galotti Bio
Cole Galotti Bio
Weet van Cole Galotti Bio, affaire, in relatie, nettowaarde, etniciteit, salaris, leeftijd, nationaliteit, lengte, sociale media-persoonlijkheid, YouNow Star, Wiki, sociale media, geslacht, horoscoop. Wie is Cole Galotti? Cole Galotti is een persoonlijkheid op sociale media en een YouNow-ster die immens populair is vanwege zijn werk als Instagram Star en YouNow-ster met meer dan 150.000 volgers op zijn Instagram-account en meer dan 150.000 volgers op YouNow.
Donald Cerrone Bio
Donald Cerrone Bio
Weet over Donald Cerrone Bio, Affaire, In relatie, Netto waarde, Leeftijd, Nationaliteit, Lengte, krijgskunstenaar, Wiki, Sociale media, Geslacht, Horoscoop. Wie is Donald Cerrone? Donald Cerrone is een Amerikaanse mixed martial artist, bokser en voormalig professioneel kickbokser.