Trends der Zukunft

KI von Meta fungiert als Simultan-Übersetzer für 100 Sprachen

21. Januar 2025, 12:00 Uhr · Quelle: Trends der Zukunft
Meta hat das KI-Modell SEAMLESSM4T entwickelt, das gesprochene Sprache direkt in 36 Sprachen übersetzen kann, ohne vorherige Transkription. Trotz seiner Fortschritte in lauten Umgebungen hat die KI noch Herausforderungen bei Dialekten und undeutlicher Aussprache.

KI-Übersetzungsprogramme wie Google Translator oder DeepL sind schon längst Teil unseres täglichen Lebens. Allerdings sind solche Systeme in der Regel schriftbasiert. Um gesprochene Worte zu übersetzen, werden diese im Regelfall von einem KI-System transkribiert, um dann von einem weiteren Modell übersetzt zu werden. Anschließend sorgt ein Text-to-Speech-Modell für die Audioausgabe. Forscher:innen von Meta haben nun ein neues KI-System entwickelt, das gesprochene Sprache direkt in eine andere übersetzen kann, ohne dabei den Umweg über mehrere KI-Modelle zu nehmen. Die KI wurde auf den Namen „SEAMLESSM4T“ getauft und kann 101 Sprachen als Input verarbeiten und in 36 Sprachen Ausgeben.

Neue KI übersetzt 101 Sprachen

Übersetzungs-Systeme, die mehrere KI-Modelle einsetzen, erfordern viel Rechenleistung und KI, was eine weitere Skalierung dieser Systeme recht schwierig macht. Forscher:innen des Meta-Forschungszentrum FAIR haben nun einen andere Ansatz für Übersetzungen durch KI entwickelt: Ihr neues KI-Modell kann gesprochene Sprache direkt übersetzen, ohne den Umweg über eine Transkription machen zu müssen. „SEAMLESSM4T“ kann 101 Sprachen in insgesamt 36 Sprachen übersetzen. Im Fall von Speech-to-Text-Übersetzungen kann das System die Übersetzung in 96 Sprachen ausgeben. Der KI-Dolmetscher beherrscht somit deutlich mehr Sprachen als bisherige Speech-to-Speech- oder Speech-to-Text-Übersetzungsprogramme.

Das Vorbild für den KI-Übersetzer findet sich in der Literatur des Schriftstellers Douglas Adams: Der Babelfisch aus „Per Anhalter durch die Galaxis“ ist ein kleiner Fisch, der ins Ohr des Nutzers gesteckt wird und dann alle Sprachen des Universums simultan übersetzen kann. „Einen solchen Babelfish zu erschaffen, erfordert allerdings fortgeschrittene, innovative Technologien und linguistische Expertise„, so die Forscher:innen rund um Loïc Barrault.

SEAMLESSM4T ist anderen Systemen überlegen

Die Basis von SEAMLESSM4T ist ein KI-Modell, das mit etwa 4,5 Millionen Stunden Audiodaten aus dem Internet trainiert wurde. Dabei lernte der Algorithmus zu erkennen, wann ein Input mit einem zweiten inhaltlich übereinstimmt, etwa wenn ein Videoclip in einer Sprache mit Untertiteln in einer anderen übereinstimmt. Die Forscher:innen stellten 330.000 Stunden solcher Übereinstimmungen zusammen und ließen das KI-Modell sich dann selber tranieren.

Anschließend testeten die Forscher:innen, wie gut der KI-Dolmetscher im Vergleich zu anderen Speech-to-Speech-, Speech-to-text-, Text-to-text- und Text-to-Speech-Programmen arbeitet. SEAMLESSM4T stellte die Ergebnisse anderer Systeme dabei in den Schatten und erreichte acht Prozent höhere Werte bei Sprache-zu-Text- und 23 Prozent höhere Werte bei Sprache-zu-Sprache-Übersetzungen, so das Team.

Und auch in lauten, von vielen Stimmen erfüllten Umgebungen schlug das System sich gut. „SEAMLESSM4T-V2 ist dabei im Schnitt 42 bis 66 Prozent resilienter gegen Hintergrundgeräusche und Sprechervariationen„, so die Forscher:innen. Das KI-Modell ist außerdem Open Source, sodass das Grundmodell an die eigenen Bedürfnisse angepasst werden kann.

KI ist in bestimmten Situationen noch fehleranfällig

Die Forscher:innen gehen davon aus, dass die neue KI Chancen eröffnet, Menschen über Sprachbarrieren hinweg zu verbinden und die gesprochene Kommunikation deutlich leichter zu gestalten. Außerdem könnten sehbehinderte oder blinde Menschen und Personen, die nicht lesen können, von der KI profitieren. „Durch SEAMLESSM4T unterstützte Anwendungen können Nutzer in multilingualen Konversationen unterstützen und ihr Selbstvertrauen in solchen Interaktionen fördern„, schreibt das Team.

Das System ist indes auch noch nicht perfekt. Ähnlich wie andere gängige KI-Übersetzungsmodelle hat auch SEAMLESSM4T Probleme mit Dialekten, undeutlicher Aussprache und anderen Abweichungen von der „normalen“ Aussprache. Die Forscher:innen sehen ihre KI daher eher als eine Ergänzung zum Sprachenlernen oder eine Unterstützung für menschliche Dolmetscher:innen. Einen völligen Ersatz stellt das KI-Modell noch nicht da.

via Nature

Wissenschaft / KI
[trendsderzukunft.de] · 21.01.2025 · 12:00 Uhr
[0 Kommentare]
Afrikas werden zu Kohlenstoffschleudern: Wie ein ganzer Kontinent seine CO₂-Bilanz verändert
Afrikas Wälder befinden sich an einem kritischen Wendepunkt. Jahrzehntelang galten sie als zuverlässige Kohlenstoffsenken: dichte Regenwälder, weitläufige Feuchtgebiete und ausgedehnte Baumflächen entzogen der Atmosphäre CO₂ und banden den Kohlenstoff in Holz, Laub und Böden. Aktuelle Untersuchungen zeigen jedoch, dass sich dieses Bild verändert. Satellitendaten, verstärkte Feldbeobachtungen und […] (00)
vor 8 Stunden
Bolsonaro nominiert Sohn als Präsidentschaftskandidaten
Brasília (dpa) - Der Sohn des inhaftierten brasilianischen Ex-Präsidenten Jair Bolsonaro will im kommenden Jahr neues Staatsoberhaupt des südamerikanischen Landes werden und den linken Amtsinhaber Luiz Inácio Lula da Silva ablösen. Flávio Bolsonaro schrieb auf der Plattform X: «Mit großer Verantwortung bestätige ich die Entscheidung des größten politischen und moralischen Führers Brasiliens, Jair […] (03)
vor 1 Stunde
Das Starship der Raumfahrtfirma SpaceX
San Francisco (dpa) - Elon Musks Raumfahrtfirma SpaceX hat Investoren einem Medienbericht zufolge einen Börsengang in der zweiten Jahreshälfte 2026 in Aussicht gestellt. Zugleich erwäge SpaceX, dass einige Mitarbeiter und frühe Geldgeber Aktien verkaufen können, schrieb die Website «The Information». SpaceX solle dabei insgesamt mit 800 Milliarden Dollar (gut 687 Mrd Euro) bewertet werden, hieß es […] (00)
vor 4 Stunden
Portfolio-Erweiterung bei Raw Fury:  Sci-Fi-Puzzle und Roguelite-Shooter im Line-up
Während des PC Gaming Show: Most Wanted Showcase hat Raw Fury, der schwedische Indie-Publisher hinter Titeln wie dem mit dem Golden Joystick Award ausgezeichneten Blue Prince, The Séance of Blake Manor, Call of the Sea, Sable und anderen, spannende Neuigkeiten zu seinen kommenden Spielen angekündigt. Zu den Ankündigungen gehörten neue Publishing-Partnerschaften mit dem Entwickler Exnilo Studio […] (00)
vor 6 Stunden
Paramount+ verlängert «Landman» um dritte Staffel
Die Verlängerung des Ölindustrie-Dramas kommt nach den ersten drei Folgen. Die neuen Geschichten werden wohl noch warten müssen. Paramount+ hat die Serie Landman vorzeitig um eine dritte Staffel verlängert. Die Nachricht kommt, während Staffel zwei erst drei Episoden veröffentlicht hat, Folge vier erscheint am 7. Dezember. Das Format von Taylor Sheridan entwickelt sich damit weiter zu einem der Eckpfeiler des Paramount+-Originalportfolios. […] (02)
vor 7 Stunden
Fußball-WM 2026 - Auslosung Vorrunde
Washington (dpa) - US-Präsident Donald Trump ist bei der FIFA-Zeremonie in Washington erstmals seit Amtsantritt mit der mexikanischen Staatschefin Claudia Sheinbaum zusammengetroffen - und nach einer Phase der Abkühlung auch mit dem kanadischen Premier Mark Carney. Zu Beginn der Veranstaltung hatte sich Trump gegenüber den beiden Co-Gastgebern der Fußball-WM betont freundlich geäußert, nachdem es […] (00)
vor 2 Stunden
bitcoin, cryptocurrency, money, currency, digital, electronic, virtual, internet, finance, crypto currency, block chain, brown money, brown finance, brown internet, brown digital, bitcoin, bitcoin, bitcoin, bitcoin, bitcoin, cryptocurrency, cryptocurrency
Fundstrats Tom Lee teilte den Teilnehmern der Binance Blockchain Week mit, dass er glaubt, dass die schlimmste Phase des jüngsten Krypto-Einbruchs wahrscheinlich vorbei ist und dass die Märkte möglicherweise bereit für eine allmähliche Erholung sind. Er verwies auf nachlassenden Verkaufsdruck und zunehmende zugrunde liegende Aktivität als Gründe für vorsichtigen Optimismus. Die Marktstimmung könnte sich einem […] (00)
vor 39 Minuten
Startschuss für Bohrgenehmigungen: Zündet hier auch bald die erste Kursrakete?
Lüdenscheid, 05.12.2025 (lifePR) - Future Fuels Inc. (ISIN: CA36118K1084 | WKN: A40TUW). Future Fuels oder das Unternehmen, freut sich bekannt zu geben, dass es offiziell das Genehmigungsverfahren für Bohrungen in seinem zu 100 % unternehmenseigenen Uranprojekt “Hornby Basin” eingeleitet hat, das sich etwa 95 Kilometer südwestlich von Kugluktuk (Nunavut) befindet. Der wichtigste Vermögenswert […] (00)
vor 8 Stunden
 
Russell Thomas und Kim Cattrall
(BANG) - Kim Cattrall ist mit ihrem Partner Russell Thomas vor den Traualtar getreten. Der 'Sex […] (00)
Glen Powell
(BANG) - Glen Powell trifft sich "unverbindlich" mit Michelle Randolph. Der US-Schauspieler […] (01)
Ed Sheeran hat 'noch eine große Tour' in sich, bevor er sesshaft wird.
(BANG) - Ed Sheeran hat "noch eine große Tour" in sich, bevor er sesshaft wird. Der 34-jährige […] (00)
Bundeswehr-Soldaten (Archiv)
Berlin - Vor der Abstimmung über einen neuen Wehrdienst an diesem Freitag im Bundestag hat die […] (05)
Margot Robbie
(BANG) - Margot Robbie ist fest entschlossen, ihr Kind aus der Öffentlichkeit herauszuhalten. […] (00)
Erfahrt mehr zu Amazon Luna Games im Dezember
Willkommen zum monatlichen Luna-Inhaltsupdate. Die Prime-Mitgliedschaft ist eine All-in-One- […] (00)
Netflix übernimmt Warner Bros.
Los Angeles (dpa) - Beben in Hollywood: Der Streaming-Riese Netflix setzt zur Übernahme des […] (00)
Janina Hettich-Walz
Östersund (dpa) - Eines war für Biathletin Janina Hettich-Walz schon immer klar. Sie will nicht […] (03)
 
 
Suchbegriff