WaveNet: Neue Google KI spricht wie ein Mensch

Googles Abteilung für künstliche Intelligenz, DeepMind, hat im Rahmen von Weiterentwicklungen einen Weg gefunden die Maschinen-Sprachausgabe menschlicher klingen zu lassen. WaveNet nennt sich die neue Methode, die Maschinen sogar zu Musik-Komponisten avancieren lassen kann.

Soziale Roboterfrau mit menschlicher Sprache (Source: NTU)

Soziale Roboterfrau mit menschlicher Sprache (Source: NTU)

Google WaveNet ist ganz dicht an der menschlichen Sprache dran

Chat-Bots und persönliche Sprachassistenten haben eine rosige Zukunft und werden unseren Alltag schon bald regelmäßig mit begleiten. Google arbeitet bereits seit geraumer Zeit schon an der Entwicklung künstlicher Intelligenz und ist dabei auch schon recht weit mit vorn. Wir erinnern uns an die Erfolge beim Schach- und GO-Spiel. Jüngst wurde auch noch Poker angegangen. In Zukunft können Sprachassistenten weniger wie Roboter und viel mehr wie Menschen klingen. Googles neue Methode erzeugt die KI-Sprache aus rohen Audiosignalen. Das neue neuronale Netzwerk WaveNet erstellt pro Sekunde 16.000 Samples. Hier lernt die Maschine allerdings mit jedem produziertem Signal auch wieder dazu. Vereinfacht dargestellt kann festgehalten werden, dass WaveNet Aufnahmen menschlicher Stimmen nutzt, um diese in der Folge nachzubilden. Gleichzeitigt lernt die KI dazu und nutzt die gewonnenen Erkenntnisse und Erfahrungen für die Prognosen der nächsten Sprachausgabe. Wie die Google Forscher betonen ist die neue Methode durchaus rechenaufwendiger, allerdings liefert diese die natürlichsten Ergebnisse.

Bisher wird bei der Sprachausgabe von Sprachassistenten wie etwa Apples Siri oder Microsofts Cortana mit gesprochenen Textbausteinen gearbeitet. Die künstliche Intelligenz formt diese dann für die Wiedergabe zu Sätzen. Ein Vorgang wird als konkatenatives Text-to-Speech-Verfahren (TTS) bezeichnet eine andere noch unnatürlicher klingende Methode wird parametrische TTS genannt.

WaveNet ist auch in der Lage verschiedene Sprecheridentitäten annehmen zu können. Die Forscher erklären, dass das Sprachergebnis umso besser ist, je mehr Sprecher kennengelernt werden. Das wirkt sich am Ende dann auch für die einzelne Identität positiv aus. Ein weiterer Mehrwert der Technologie ist, dass WaveNet auch Samples von Klavierstücken beispielsweise erstellen kann. Schließlich basiert die Methode ja auf einzelnen Audiosignalen. Google hält im ausführlichen Forschungsbeitrag fest, dass WaveNet auf Englisch schon sehr nahe an die natürliche Aussprache herankommt. Nach Tests der englischen und chinesischen Sprachausgabe, sollten Menschen die Qualität beurteilen. Das geschah anhand einer Skala von 1-5. Die menschliche Sprache erhielt den Wert 4,55, während WaveNet auf 4,21 kam und damit um die Hälfte besser ist als bisherige künstliche Sprachausgaben. Das DeepMind-Entwicklerteam ist von dem Ergebnis überwältigt und spricht von einer neuen Errungenschaft. Schon jetzt galten Googles TTS-Methoden als weltweit führend.

Es wird wohl nicht mehr lange dauern, bis Googles Sprachassistentin das WaveNet-Update verliehen bekommt. Einen ersten Eindruck von der natürlichen künstlichen Sprache liefert der DeepMind-Blog.

Technik / Künstliche intelligenz
[trendsderzukunft.de] · 12.09.2016 · 15:01 Uhr
[3 Kommentare]
Hier siehst Du die HOT 100 News pro Sparte, die in den letzten 14 Tagen am heißesten diskutiert wurden. Hier geht's zu den meistgelesenen News.

Top-Themen

Boulevard-News

IT-News

Gaming-News

Kino/TV-News

Sport-News

Finanznews

Business/Presse

 
Rechtsruck unter Jungen: Sozialarbeiter warnen vor Sparkurs
Jena (dpa) - Angesichts des in einer Studie festgestellten Rechtsrucks unter jungen Menschen […] (07)
«Let's Dance»: Eine Popsängerin muss abtanzen
Köln (dpa) – Aus für Popsängerin Lulu Lewe bei «Let's Dance»: Die Schwester von Popstar Sarah […] (00)
Das Erste und das ZDF zeigen Leichtathletik-EM
Zwischen dem 7. und 12. Juni 2024 findet die Leichtathlet-Europameisterschaft in Rom statt. Das Erste […] (00)
Brooke Shields: Intime Beziehung zu ihren Töchtern
(BANG) - Brooke Shields schläft immer noch im selben Bett wie ihre erwachsenen Töchter. Die US- […] (00)
Henkel optimistisch: Mehr Umsatz und Gewinn erwartet
Der Düsseldorfer Konzern Henkel, bekannt für seine breite Palette an Konsumgütern, hat seine […] (00)
Sky: FC Bayern fragt bei Spanier Lopetegui an
Berlin (dpa) - Bei der Suche nach einem neuen Trainer hat der FC Bayern München nach Sky- […] (02)
 
 
Suchbegriff