Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

11. Dezember 2025, 11:15 Uhr · Quelle: Pressebox
Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
Foto: Pressebox
Insiders Technologies veröffentlicht aktuellen Benchmarking-Report.
Insiders Technologies' OvAItion Private LLM erzielt im Q4-Benchmark deutliche Fortschritte trotz komplexerer Daten. Der Bericht betont, dass gezielte Spezialisierung in der AI den entscheidenden Vorsprung bringt.

Kaiserslautern, 11.12.2025 (PresseBox) - Insiders Technologies, technologisch führender Anbieter von Software für Intelligent Automation (IA), kann in der neuesten, vierten Ausgabe seines LLM Benchmarks einen deutlichen Qualitätssprung des eigenen OvAItion Private LLM verzeichnen. Das Modell verbessert sich trotz verdoppeltem Datenumfang und erheblich komplexerer Dokumente um mehr als zwei Prozentpunkte gegenüber dem Vergleich im dritten Quartal und rückt erstmals in den Leistungsbereich von Top-Modellen wie Claude 4.5 Haiku vor. Generell zeichnet der Benchmark ein klares Bild: Die entscheidenden Fortschritte im IDP-Umfeld entstehen zunehmend durch Spezialisierung, nicht durch immer größere Foundation-Modelle.

Das OvAItion Private LLM vereint hohe Performance mit voller Datenhoheit, C5-zertifizierter Sicherheit und stabilen Verarbeitungszeiten. Es wird künftig das bisherige Private LLM ablösen und weiter auf die IDP-Anforderungen der Insiders Kunden und Partner zugeschnitten. Laufendes Finetuning, optimierte Trainings und zusätzliche Daten basierend auf jahrelanger Erfahrung sorgen auch in Zukunft für eine kontinuierliche Verbesserung.

Die Spitze rückt zusammen – mit verlangsamtem Fortschritt und Schwachpunkten

Im vierten Quartal hat Insiders Technologies das Benchmarking deutlich erweitert. Dazu wurde der Testdatensatz nahezu verdoppelt und um anspruchsvollere Dokumententypen ergänzt. Dadurch sank das generelle Score-Niveau leicht, die Aussagekraft konnte im Hinblick auf reale produktive Workflows jedoch erneut gesteigert werden. Insgesamt testete das Team im vierten Quartal 24 Large Language Modelle, darunter Claude 4.5 Sonnet, GPT-5.1 und Gemini 3 Pro. Modelle mit überholten Nachfolgern oder geringerem Relevanzbezug wurden nicht berücksichtigt.

Die Ergebnisse zeigen ein immer enger zusammenrückendes Spitzenfeld: Viele Modelle bewegen sich im Bereich 80 bis 88 Punkte. Foundation-Modelle, die bewusst breit aufgestellt sind und auf riesigen, oft unspezifischen Daten trainiert werden, liefern weiterhin gute Resultate, doch der Fortschritt verlangsamt sich hier. Reasoning-Modelle erreichen zwar hohe Scores, sind im laufenden IDP-Betrieb aber häufig zu langsam oder zu kostenintensiv. Datenschutz bleibt zudem ein zentraler Schwachpunkt global gehosteter Modelle. Obwohl der Anteil in der EU betriebener Modelle im Benchmark bewusst steigt, bleibt er im Markt nach wie vor gering.

Die wichtigsten Erkenntnisse des Q4-Benchmarks:

• die Entwicklung großer Foundation-Modelle stagniert im IDP-Kontext
• reine Reasoning-Modelle sind leistungsstark, aber betrieblich schwer planbar
• echte Fortschritte kommen aus Spezialisierung und gezielten Trainingsmethoden
• Performance und regulatorische Sicherheit bleiben selten in Einklang
• das OvAItion Private LLM erzielt den eindeutig größten Fortschritt im Feld

Der Benchmark stärkt den Best-of-Breed-Ansatz von Insiders. Über die OvAItion Engine können Unternehmen LLMs flexibel kombinieren und nach Kriterien wie Performance, Latenz, Kosten oder Dunkelverarbeitung auswählen. Funktionen wie Green Voting sorgen für automatische Validierung und geringere Nachbearbeitung. Kunden müssen sich damit nicht zwischen Leistung und Sicherheit entscheiden, sondern können die jeweils beste Modellkombination für ihre Prozesse einsetzen.

„Man braucht nicht automatisch die neuesten oder teuersten Modelle, um im IDP-Einsatz gute Ergebnisse zu erzielen“, erklärt Dr. Alexander Lück, Team OvAItion/Data Management und Verantwortlicher für das LLM Benchmarking bei Insiders Technologies. „Unser Vergleich zeigt wieder, dass der größte Qualitätssprung nicht von generischen Foundation-Modellen, sondern von modellseitiger Spezialisierung kommt. Immer wichtiger werden zudem Kriterien wie Datenhoheit, Sicherheit, Stabilität, Anpassbarkeit und kontrollierbare Kosten.“

Die vollständige Benchmarking-Ausgabe Q4 2025 bietet einen aktuellen Überblick über die Leistungsfähigkeit der relevanten Modelle und dient als verlässliche Orientierung für IDP-Verantwortliche. Für individuelle Benchmarkings mit eigenen Use Cases stehen die KI-Expertinnen und -Experten von Insiders zur Verfügung.

Hier kann das Insiders LLM Benchmarking Q4-2025 kostenlos bezogen werden:
https://insiders-technologies.com/de/insiders-llm-benchmarking-dezember-2025/

Weitere Informationen über den Hersteller intelligenter Software für Prozessautomatisierung auf Basis von KI: https://www.insiders-technologies.com/

Zusammenfassung
Insiders Technologies veröffentlicht seinen neuen LLM-Benchmark. Das OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

Software / AI / LLM / Benchmark / IDP
[pressebox.de] · 11.12.2025 · 11:15 Uhr
[0 Kommentare]
DHEA – Das „Mutterhormon“ der Jugend
Höchst i. Odw., 03.04.2026 (lifePR) - Dehydroepiandrosteron (DHEA) gilt als eines der wichtigsten Steroidhormone im menschlichen Körper. Es wird hauptsächlich in der Nebennierenrinde produziert und dient als Vorläufer (Prohormon) für zahlreiche andere Hormone, darunter Testosteron, Östrogen und andere Sexualhormone. Deshalb wird es oft als „Mutter aller […] (00)
vor 1 Stunde
Mann droht mit Anschlag in ICE
Siegburg (dpa) - Inmitten der Oster-Reisewelle hat ein Mann in einem ICE in Nordrhein-Westfalen Polizeiangaben zufolge mit einem Anschlag gedroht und Böller explodieren lassen. Zwölf Fahrgäste wurden bei dem Vorfall am Donnerstagabend leicht verletzt. Der 20-jährige Deutsche aus Aachen soll in dem Zug von dort nach Frankfurt laut Zeugenaussagen […] (01)
vor 11 Minuten
Vernähtes Holz: Neue Ansätze für stabile Leichtbaumaterialien
Die mechanischen Eigenschaften von Holz machen es zu einem vielseitigen, aber auch begrenzt belastbaren Werkstoff. Besonders dünne Holzschichten, sogenannte Furniere, werden in vielen Anwendungen eingesetzt, etwa in Leichtbaukonstruktionen oder Sportgeräten. Dennoch zeigen sie Schwächen, insbesondere wenn Kräfte quer zur Faserrichtung wirken. Eine neue […] (00)
vor 17 Stunden
Apple iPad Air 3 WLAN landet auf der Vintage-Liste
Apple hat nun auch die WLAN-Version des iPad Air 3 offiziell in seine sogenannte Vintage-Liste aufgenommen. Damit folgt das Tablet den Mobilfunk-Modellen, die diesen Status bereits zuvor erreicht hatten. Das beliebte Gerät feierte vor gut sieben Jahren, im März 2019, seine Markteinführung. Augmented Reality auf dem iPad, Quelle: Patrick […] (00)
vor 16 Stunden
Assassin’s Creed – Xbox Free Play Days und zusätzlich Rabatte im Store
Während der Xbox Free Play Days können vom 2. bis 6. April alle Xbox-Spieler: innen kostenlos auf die folgenden Titel der  Assassin’s Creed -Reihe zugreifen, ohne dass eine Xbox Game Pass-Mitgliedschaft erforderlich ist: Assassin’s Creed Unity Assassin’s Creed Syndicate Assassin’s Creed Origins Assassin’s Creed Odyssey […] (00)
vor 10 Stunden
«Mensch Retter» ist zum Start noch keine Hilfe
Die erste Folge der siebten Staffel hatte bei RTLZWEI Probleme, so richtig auf die Beine zu kommen. Diesen Donnerstag, den 2. April, startete der Sender RTLZWEI eine neue Staffel einer seiner Dokusoaps. Gehandelt hat es sich dabei allerdings mal nicht um eine der zahlreichen Sozialreportagen. Vielmehr ging es um die Helfer-Sendung Mensch Retter, die in ihre nunmehr siebte Runde geht. Doch […] (00)
vor 1 Stunde
Basketballer Ivan Kharchenkov
Indianapolis (dpa) - Statt mit dem FC Bayern in der Bundesliga gegen den Mitteldeutschen BC spielt Basketball-Nationalspieler Ivan Kharchenkov am Wochenende vor rund 70.000 Zuschauern im NFL-Stadion der Indianapolis Colts. Dass er es als Leistungsträger mit den Arizona Wildacts ins Final Four der March Madness schaffen würde, dem legendären College- […] (00)
vor 28 Minuten
bitcoin, currency, finance, coin, crypto, cryptocurrency, brown finance
Aktuelle Daten zeigen, dass das Open Interest von Ethereum einen starken Anstieg verzeichnete, bevor der Kurs der Kryptowährung innerhalb eines Tages um fast 5% fiel. Bearishe Kursentwicklung bei Ethereum in den letzten 24 Stunden In den ersten drei Tagen dieser Woche erholte sich Ethereum zusammen mit dem breiteren Markt für digitale Vermögenswerte. […] (00)
vor 1 Stunde
 
Lärm im Mietshaus: Trommeln, Trampeln, Türknallen
Düsseldorf, 02.04.2026 (lifePR) - Zum Weltschlagzeugertag am 4. April richtet sich […] (00)
Saisonstart 2026 im Ziegeleipark Mildenberg
Zehdenick OT Mildenberg, 02.04.2026 (lifePR) - Der Ziegeleipark Mildenberg startet in […] (00)
Der neue TEXHUB Job Wizard: Gamification trifft textile Berufe
Stuttgart, 02.04.2026 (lifePR) - Seit Juni letzten Jahres lädt der Wirtschafts- und […] (00)
Vernichtungsschlag oder Wahnsinn? Trumps widersprüchliches Beben lässt die Welt erzittern
Der totale Sieg steht auf tönernen Füßen Donald Trump liebt die große Bühne, doch […] (03)
KONAMI veröffentlicht Darwin’s Paradox!
Konami Digital Entertainment, B.V. (KONAMI) gibt heute die Veröffentlichung von […] (00)
Zwischen Biologie und Technik: Menschlicher Uterus lebt erstmals außerhalb des weiblichen Körpers
Die Entwicklung künstlicher oder teilweise künstlicher Fortpflanzungssysteme hat in […] (02)
Apple feiert 50 Jahre Innovationen mit besonderer Website-Animation
Zu seinem 50-jährigen Jubiläum hat Apple am heutigen Tag seine offizielle Website mit […] (01)
Veränderungen im regulatorischen Umfeld In einer Ära, in der Innovation das […] (00)
 
 
Suchbegriff