Trends der Zukunft

KI von Meta fungiert als Simultan-Übersetzer für 100 Sprachen

21. Januar 2025, 12:00 Uhr · Quelle: Trends der Zukunft
Meta hat das KI-Modell SEAMLESSM4T entwickelt, das gesprochene Sprache direkt in 36 Sprachen übersetzen kann, ohne vorherige Transkription. Trotz seiner Fortschritte in lauten Umgebungen hat die KI noch Herausforderungen bei Dialekten und undeutlicher Aussprache.

KI-Übersetzungsprogramme wie Google Translator oder DeepL sind schon längst Teil unseres täglichen Lebens. Allerdings sind solche Systeme in der Regel schriftbasiert. Um gesprochene Worte zu übersetzen, werden diese im Regelfall von einem KI-System transkribiert, um dann von einem weiteren Modell übersetzt zu werden. Anschließend sorgt ein Text-to-Speech-Modell für die Audioausgabe. Forscher:innen von Meta haben nun ein neues KI-System entwickelt, das gesprochene Sprache direkt in eine andere übersetzen kann, ohne dabei den Umweg über mehrere KI-Modelle zu nehmen. Die KI wurde auf den Namen „SEAMLESSM4T“ getauft und kann 101 Sprachen als Input verarbeiten und in 36 Sprachen Ausgeben.

Neue KI übersetzt 101 Sprachen

Übersetzungs-Systeme, die mehrere KI-Modelle einsetzen, erfordern viel Rechenleistung und KI, was eine weitere Skalierung dieser Systeme recht schwierig macht. Forscher:innen des Meta-Forschungszentrum FAIR haben nun einen andere Ansatz für Übersetzungen durch KI entwickelt: Ihr neues KI-Modell kann gesprochene Sprache direkt übersetzen, ohne den Umweg über eine Transkription machen zu müssen. „SEAMLESSM4T“ kann 101 Sprachen in insgesamt 36 Sprachen übersetzen. Im Fall von Speech-to-Text-Übersetzungen kann das System die Übersetzung in 96 Sprachen ausgeben. Der KI-Dolmetscher beherrscht somit deutlich mehr Sprachen als bisherige Speech-to-Speech- oder Speech-to-Text-Übersetzungsprogramme.

Das Vorbild für den KI-Übersetzer findet sich in der Literatur des Schriftstellers Douglas Adams: Der Babelfisch aus „Per Anhalter durch die Galaxis“ ist ein kleiner Fisch, der ins Ohr des Nutzers gesteckt wird und dann alle Sprachen des Universums simultan übersetzen kann. „Einen solchen Babelfish zu erschaffen, erfordert allerdings fortgeschrittene, innovative Technologien und linguistische Expertise„, so die Forscher:innen rund um Loïc Barrault.

SEAMLESSM4T ist anderen Systemen überlegen

Die Basis von SEAMLESSM4T ist ein KI-Modell, das mit etwa 4,5 Millionen Stunden Audiodaten aus dem Internet trainiert wurde. Dabei lernte der Algorithmus zu erkennen, wann ein Input mit einem zweiten inhaltlich übereinstimmt, etwa wenn ein Videoclip in einer Sprache mit Untertiteln in einer anderen übereinstimmt. Die Forscher:innen stellten 330.000 Stunden solcher Übereinstimmungen zusammen und ließen das KI-Modell sich dann selber tranieren.

Anschließend testeten die Forscher:innen, wie gut der KI-Dolmetscher im Vergleich zu anderen Speech-to-Speech-, Speech-to-text-, Text-to-text- und Text-to-Speech-Programmen arbeitet. SEAMLESSM4T stellte die Ergebnisse anderer Systeme dabei in den Schatten und erreichte acht Prozent höhere Werte bei Sprache-zu-Text- und 23 Prozent höhere Werte bei Sprache-zu-Sprache-Übersetzungen, so das Team.

Und auch in lauten, von vielen Stimmen erfüllten Umgebungen schlug das System sich gut. „SEAMLESSM4T-V2 ist dabei im Schnitt 42 bis 66 Prozent resilienter gegen Hintergrundgeräusche und Sprechervariationen„, so die Forscher:innen. Das KI-Modell ist außerdem Open Source, sodass das Grundmodell an die eigenen Bedürfnisse angepasst werden kann.

KI ist in bestimmten Situationen noch fehleranfällig

Die Forscher:innen gehen davon aus, dass die neue KI Chancen eröffnet, Menschen über Sprachbarrieren hinweg zu verbinden und die gesprochene Kommunikation deutlich leichter zu gestalten. Außerdem könnten sehbehinderte oder blinde Menschen und Personen, die nicht lesen können, von der KI profitieren. „Durch SEAMLESSM4T unterstützte Anwendungen können Nutzer in multilingualen Konversationen unterstützen und ihr Selbstvertrauen in solchen Interaktionen fördern„, schreibt das Team.

Das System ist indes auch noch nicht perfekt. Ähnlich wie andere gängige KI-Übersetzungsmodelle hat auch SEAMLESSM4T Probleme mit Dialekten, undeutlicher Aussprache und anderen Abweichungen von der „normalen“ Aussprache. Die Forscher:innen sehen ihre KI daher eher als eine Ergänzung zum Sprachenlernen oder eine Unterstützung für menschliche Dolmetscher:innen. Einen völligen Ersatz stellt das KI-Modell noch nicht da.

via Nature

Wissenschaft / KI
[trendsderzukunft.de] · 21.01.2025 · 12:00 Uhr
[0 Kommentare]
Quantenphysik schlägt künstliche Intelligenz — mit nur neun Atomen
Wer mehr Rechenleistung braucht, baut größere Systeme — so lautet die Grundannahme, auf der ein großer Teil der modernen Computerentwicklung beruht. Mehr Schichten, mehr Verbindungen, mehr Energie. Eine aktuelle Studie, veröffentlicht im renommierten Fachjournal Physical Review Letters, stellt diese Logik grundsätzlich infrage. Ein Forschungsteam hat […] (00)
vor 7 Stunden
US-Präsident Trump
Washington/Teheran (dpa) - US-Präsident Donald Trump hat dem Iran mit einer Zerstörung aller Brücken und Kraftwerke binnen weniger Stunden nach Ablauf seines Ultimatums gedroht. Die USA könnten innerhalb von vier Stunden eine «völlige Zerstörung» herbeiführen, sagte Trump im Weißen Haus. Die Frist, die er Teheran zur Öffnung der Straße von Hormus […] (16)
vor 1 Stunde
Review: Reolink Duo 3V PoE – statische Überwachung mit Dual-Kamera
Die Reolink Duo 3V PoE fällt schon beim ersten Blick aus dem Rahmen klassischer Überwachungskameras. Sie verzichtet auf ein einzelnes Objektiv und setzt stattdessen auf ein Dual-Lens-System, das zwei separate Kameras zu einem 180°-Panoramabild kombiniert. Das ist keine Spielerei: Die Kamera zielt darauf ab, maximale Flächen mit minimaler Hardware […] (00)
vor 4 Stunden
Ich habe mal ausgerechnet, wie viele Stunden ich allein in Charakter-Editoren verbracht habe. Über alle Spiele hinweg, seit ich 2003 meinen ersten Helden in Neverwinter Nights zusammengeklickt habe. Das Ergebnis: mindestens 200 Stunden. Zweihundert Stunden, in denen ich Nasenlängen justiert, Augenbrauen verschoben und Haarfarben verglichen habe, ohne […] (00)
vor 2 Stunden
Prime Video zeigt Doku «Jerry West: The Logo» im April
Der Streamingdienst widmet der Basketball-Legende eine persönliche und schonungslose Dokumentation. Prime Video hat den Trailer zur Dokumentation Jerry West: The Logo veröffentlicht. Der abendfüllende Film feiert am 16. April seine Premiere und wird weltweit in mehr als 240 Ländern und Territorien verfügbar sein. Regie führt Kenya Barris, der mit «Jerry West: The Logo» sein Dokumentarfilmdebüt […] (00)
vor 11 Stunden
Daniel Altmaier
Monte-Carlo (dpa) - Tennisprofi Daniel Altmaier hat sein Auftaktmatch beim Masters-1000-Turnier in Monte-Carlo verloren. Der Deutsche unterlag dem Tschechen Tomas Machac in einer umkämpften Partie mit 4: 6, 6: 1, 3: 6. Nach verlorenem ersten Satz zeigte sich Altmaier stark verbessert. Nach einem schnellen Break zum 3: 1 wehrte er in einem umkämpften […] (00)
vor 6 Stunden
bitcoin, money, finance, cryptocurrency, coin, currency, blockchain, bank, banking, business
Der Kryptoanalyst und Taproot-Entwickler Udi Wertheimer hat darauf hingewiesen, dass das Lightning-Netzwerk in einer post-quantencomputergestützten Welt grundlegend verwundbar ist. Er behauptet, dass das Design des Netzwerks die Gelder der Nutzer auf eine Weise gefährdet, die unter den aktuellen Annahmen nicht abgemildert werden kann. Wertheimer […] (00)
vor 47 Minuten
Veranstaltungstipp – Familienrundgang mit Bewegungsimpulsen und freier Eintritt
Mainz, 06.04.2026 (lifePR) - Wir laden Familien herzlich zu einer gemeinsamen Entdeckungstour durch die Kunsthalle ein. Hier gibt es immer etwas anderes zu erleben. Gemeinsames Rätseln, Forschen oder Zeichnen vor den Kunstwerken – mach einfach mit! Der Familienrundgang mit Bewegungsimpulsen findet am Sonntag, den 19/04 um 14 Uhr statt und ist Teil des Programms  Freistunden. Im Rahmen der  […] (00)
vor 5 Stunden
 
Patrice Aminati
(BANG) - Patrice Aminati enthüllt, wie sie mit ihrem neuesten Rückschlag im Kampf […] (01)
Herzogin Meghan
(BANG) - Herzogin Meghan hat sich bei ihrem 'Suits'-Kollegen gemeldet, nachdem sie […] (00)
Gordon Ramsay
(BANG) - Gordon Ramsay soll im Mittelpunkt einer weiteren Netflix-Dokumentation […] (01)
Thomas Erndl (Archiv)
Berlin - Der verteidigungspolitische Sprecher der Unionsfraktion, Thomas Erndl (CSU), […] (03)
«Sesame Street» kommt mit 250 Folgen zu Tubi
Der Streamingdienst erweitert sein Angebot um die Kult-Kinderserie und setzt auf Nostalgie für […] (00)
Bonnie Wright
(BANG) - Bonnie Wright ist zum zweiten Mal schwanger. Die 35-jährige Schauspielerin – […] (00)
Starfield DLC verrät neue Stadt – Fans hoffen auf echten Neustart
Es fühlt sich fast wie ein versteckter Blick hinter die Kulissen an: Neue […] (00)
Fashion-Influencer «Gramps»
Mainz (dpa) - Er hat rund 5,5 Millionen Follower auf Tiktok, noch mal knapp 2,5 […] (00)
 
 
Suchbegriff