Trends der Zukunft

KI von Meta fungiert als Simultan-Übersetzer für 100 Sprachen

21. Januar 2025, 12:00 Uhr · Quelle: Trends der Zukunft
Meta hat das KI-Modell SEAMLESSM4T entwickelt, das gesprochene Sprache direkt in 36 Sprachen übersetzen kann, ohne vorherige Transkription. Trotz seiner Fortschritte in lauten Umgebungen hat die KI noch Herausforderungen bei Dialekten und undeutlicher Aussprache.

KI-Übersetzungsprogramme wie Google Translator oder DeepL sind schon längst Teil unseres täglichen Lebens. Allerdings sind solche Systeme in der Regel schriftbasiert. Um gesprochene Worte zu übersetzen, werden diese im Regelfall von einem KI-System transkribiert, um dann von einem weiteren Modell übersetzt zu werden. Anschließend sorgt ein Text-to-Speech-Modell für die Audioausgabe. Forscher:innen von Meta haben nun ein neues KI-System entwickelt, das gesprochene Sprache direkt in eine andere übersetzen kann, ohne dabei den Umweg über mehrere KI-Modelle zu nehmen. Die KI wurde auf den Namen „SEAMLESSM4T“ getauft und kann 101 Sprachen als Input verarbeiten und in 36 Sprachen Ausgeben.

Neue KI übersetzt 101 Sprachen

Übersetzungs-Systeme, die mehrere KI-Modelle einsetzen, erfordern viel Rechenleistung und KI, was eine weitere Skalierung dieser Systeme recht schwierig macht. Forscher:innen des Meta-Forschungszentrum FAIR haben nun einen andere Ansatz für Übersetzungen durch KI entwickelt: Ihr neues KI-Modell kann gesprochene Sprache direkt übersetzen, ohne den Umweg über eine Transkription machen zu müssen. „SEAMLESSM4T“ kann 101 Sprachen in insgesamt 36 Sprachen übersetzen. Im Fall von Speech-to-Text-Übersetzungen kann das System die Übersetzung in 96 Sprachen ausgeben. Der KI-Dolmetscher beherrscht somit deutlich mehr Sprachen als bisherige Speech-to-Speech- oder Speech-to-Text-Übersetzungsprogramme.

Das Vorbild für den KI-Übersetzer findet sich in der Literatur des Schriftstellers Douglas Adams: Der Babelfisch aus „Per Anhalter durch die Galaxis“ ist ein kleiner Fisch, der ins Ohr des Nutzers gesteckt wird und dann alle Sprachen des Universums simultan übersetzen kann. „Einen solchen Babelfish zu erschaffen, erfordert allerdings fortgeschrittene, innovative Technologien und linguistische Expertise„, so die Forscher:innen rund um Loïc Barrault.

SEAMLESSM4T ist anderen Systemen überlegen

Die Basis von SEAMLESSM4T ist ein KI-Modell, das mit etwa 4,5 Millionen Stunden Audiodaten aus dem Internet trainiert wurde. Dabei lernte der Algorithmus zu erkennen, wann ein Input mit einem zweiten inhaltlich übereinstimmt, etwa wenn ein Videoclip in einer Sprache mit Untertiteln in einer anderen übereinstimmt. Die Forscher:innen stellten 330.000 Stunden solcher Übereinstimmungen zusammen und ließen das KI-Modell sich dann selber tranieren.

Anschließend testeten die Forscher:innen, wie gut der KI-Dolmetscher im Vergleich zu anderen Speech-to-Speech-, Speech-to-text-, Text-to-text- und Text-to-Speech-Programmen arbeitet. SEAMLESSM4T stellte die Ergebnisse anderer Systeme dabei in den Schatten und erreichte acht Prozent höhere Werte bei Sprache-zu-Text- und 23 Prozent höhere Werte bei Sprache-zu-Sprache-Übersetzungen, so das Team.

Und auch in lauten, von vielen Stimmen erfüllten Umgebungen schlug das System sich gut. „SEAMLESSM4T-V2 ist dabei im Schnitt 42 bis 66 Prozent resilienter gegen Hintergrundgeräusche und Sprechervariationen„, so die Forscher:innen. Das KI-Modell ist außerdem Open Source, sodass das Grundmodell an die eigenen Bedürfnisse angepasst werden kann.

KI ist in bestimmten Situationen noch fehleranfällig

Die Forscher:innen gehen davon aus, dass die neue KI Chancen eröffnet, Menschen über Sprachbarrieren hinweg zu verbinden und die gesprochene Kommunikation deutlich leichter zu gestalten. Außerdem könnten sehbehinderte oder blinde Menschen und Personen, die nicht lesen können, von der KI profitieren. „Durch SEAMLESSM4T unterstützte Anwendungen können Nutzer in multilingualen Konversationen unterstützen und ihr Selbstvertrauen in solchen Interaktionen fördern„, schreibt das Team.

Das System ist indes auch noch nicht perfekt. Ähnlich wie andere gängige KI-Übersetzungsmodelle hat auch SEAMLESSM4T Probleme mit Dialekten, undeutlicher Aussprache und anderen Abweichungen von der „normalen“ Aussprache. Die Forscher:innen sehen ihre KI daher eher als eine Ergänzung zum Sprachenlernen oder eine Unterstützung für menschliche Dolmetscher:innen. Einen völligen Ersatz stellt das KI-Modell noch nicht da.

via Nature

Wissenschaft / KI
[trendsderzukunft.de] · 21.01.2025 · 12:00 Uhr
[0 Kommentare]
Elon Musks älteste Tochter erfuhr von ihren Halbgeschwistern online.
(BANG) - Elon Musks älteste Tochter erfuhr von ihren Halbgeschwistern online. Die konservative Influencerin Ashley St. Clair behauptete vor einigen Tagen, sie habe vor fünf Monaten das 13. Kind des SpaceX-Gründers zur Welt gebracht. Vivian Wilson (21), die der Tech-Mogul mit seiner Ex-Frau Justine hat, scherzte, dass dies nicht das erste Mal sei, dass sie nicht direkt über die Ereignisse im Leben […] (01)
vor 4 Stunden
Euromünze (Archiv)
Brüssel - Die Kommission der Europäischen Union bereitet die Mitgliedstaaten auf höhere Beitragszahlungen vor. "Ein Prozent der EU-Wirtschaftsleistung ist nicht genug, um die Wettbewerbsfähigkeit, die Sicherheit, die Kohäsion und die globale Präsenz der EU zu sichern", sagte der EU-Haushaltskommissar Piotr Serafin dem "Handelsblatt" (Dienstagausgabe). In den vergangenen Jahren hatten die […] (00)
vor 1 Stunde
Neues Studio Display soll bei Apple in Arbeit sein
Laut dem „Power On“-Newsletter des Bloomberg-Autors Mark Gurman könnte das neue Studio Display bis 2026 auf den Markt kommen, gemeinsam mit M5 Macs. Das Design soll vergleichbar mit dem aktuellen Modell und 27 Zoll groß sein. Neues Studio Display in Entwicklung Nach der aktuellen Ausgabe des „Power On“-Newsletters von Mark Gurman erscheint das neue Apple Studio Display wahrscheinlich bis […] (00)
vor 3 Stunden
Viktor Antonov ist verstorben: Der kreative Kopf hinter Half-Life 2 und Dishonored
Antonov wurde in Bulgarien geboren und machte sich in der Film- und Videospielindustrie einen Namen. Sein Durchbruch gelang ihm als Art Director von Half-Life 2, einem der meistgelobten Ego-Shooter aller Zeiten. Die düstere, dystopische Welt des Spiels trug seine Handschrift und setzte neue Maßstäbe im Spieldesign. Neben seiner Arbeit an Videospielen entwarf er auch die Graphic Novel „The Colony: […] (00)
vor 26 Minuten
'Dune: Messiah' soll Berichten zufolge ein Jahr früher als erwartet mit den Dreharbeiten beginnen.
(BANG) - 'Dune: Messiah' soll Berichten zufolge ein Jahr früher als erwartet mit den Dreharbeiten beginnen. Die kommende Sci-Fi-Fortsetzung, die von Serienregisseur Denis Villeneuve inszeniert wird, sollte ursprünglich im Sommer 2026 mit den Dreharbeiten beginnen, doch 'Deadline' berichtet jetzt, dass der Filmemacher plant, bereits im Juni dieses Jahres mit den Aufnahmen zu starten. 'Dune: […] (00)
vor 4 Stunden
Stefan Leitl
Berlin (dpa) - Stefan Leitl ist neuer Cheftrainer beim kriselnden Fußball-Zweitligisten Hertha BSC. Der 47-Jährige tritt die Nachfolge von Cristian Fiél an, von dem sich die Berliner am Sonntag nach vier Niederlagen in Serie getrennt hatten. Leitl, der die SpVgg Greuther Fürth 2021 überraschend in die Bundesliga geführt und zuletzt Hannover 96 betreut hatte, unterschrieb einen Vertrag bis 2027. […] (02)
vor 2 Stunden
BlackRock will Bitcoin-ETF effizienter machen
Ein ETF, der wirklich Bitcoin hält? BlackRock sorgt erneut für Bewegung im Kryptosektor. Der weltweit größte Vermögensverwalter hat bei der US-Börsenaufsicht SEC einen Antrag gestellt, um In-Kind BTC Redemptions für seinen Bitcoin-ETF zu ermöglichen. Das bedeutet: Anleger könnten Anteile des ETF künftig direkt in Bitcoin einlösen, statt dies über eine Fiat-Transaktion abzuwickeln. Bislang erfolgt […] (00)
vor 1 Stunde
Automatisierte KI-Optimierung von 5G-Netzen: brown-iposs unterstützt Netzbetreiber mit CARAT
Bonn/Barcelona, 17.02.2025 (PresseBox) - Automatisierte KI-Optimierung von 5G-Netzen: brown-iposs unterstützt Netzbetreiber mit CARAT brown-iposs stellt auf dem MWC aus Analyse von Verbindungsdaten während ihrer Entstehung Einladung zu Fachgesprächen am NRW-Gemeinschaftsstand brown-iposs, führender Anbieter von Software für die Analyse und Optimierung von Mobilfunknetzen, lädt das Fachpublikum des Mobile World Congress auf den NRW- […] (00)
vor 3 Stunden
 
Dua Lipa
(BANG) - Dua Lipa feiert den dritten Jahrestag ihrer globalen Redaktionsplattform 'Service95'. […] (00)
Recycling von Perowskit-Solarzellen: Diese Methode soll Müllberge aus Solaranlagen verhindern
Die Energiewende wird große Mengen Strom aus erneuerbaren Quellen wie etwa Sonne und Wind […] (03)
Take That wurden als musikalischer Act für 'F1 75 Live' bestätigt.
(BANG) - Take That und Kane Brown wurden als musikalische Acts für 'F1 75 Live' bestätigt. Die […] (00)
Bundeswehr-Soldaten (Archiv)
Berlin - Die deutsche Bundesregierung wendet sich gegen einen möglichen Plan, wonach in der […] (00)
Elon Musk baut Einfluss in Washington aus: Milliarden-Aufträge und neue Behördenmacht
Elon Musk, reichster Mann der Welt, sichert sich mit seinen sechs Unternehmen bereits Aufträge im Wert von […] (01)
CNN schaut auf Twitter
Die vierteilige Serie folgt der Insider-Geschichte hinter dem kometenhaften Aufstieg und dem späteren […] (00)
Heinz Hoenig
(BANG) - Zwischen Heinz Hoenig und seiner Ehefrau Annika Kärsten-Hoenig funkte es im Jahr 2018, […] (01)
FC Bayern München - Celtic Glasgow
München (dpa) - Beim FC Bayern München ist für das Playoff-Rückspiel gegen Celtic Glasgow in […] (00)
 
 
Suchbegriff