Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

11. Dezember 2025, 11:15 Uhr · Quelle: Pressebox
Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
Foto: Pressebox
Insiders Technologies veröffentlicht aktuellen Benchmarking-Report.
Insiders Technologies' OvAItion Private LLM erzielt im Q4-Benchmark deutliche Fortschritte trotz komplexerer Daten. Der Bericht betont, dass gezielte Spezialisierung in der AI den entscheidenden Vorsprung bringt.

Kaiserslautern, 11.12.2025 (PresseBox) - Insiders Technologies, technologisch führender Anbieter von Software für Intelligent Automation (IA), kann in der neuesten, vierten Ausgabe seines LLM Benchmarks einen deutlichen Qualitätssprung des eigenen OvAItion Private LLM verzeichnen. Das Modell verbessert sich trotz verdoppeltem Datenumfang und erheblich komplexerer Dokumente um mehr als zwei Prozentpunkte gegenüber dem Vergleich im dritten Quartal und rückt erstmals in den Leistungsbereich von Top-Modellen wie Claude 4.5 Haiku vor. Generell zeichnet der Benchmark ein klares Bild: Die entscheidenden Fortschritte im IDP-Umfeld entstehen zunehmend durch Spezialisierung, nicht durch immer größere Foundation-Modelle.

Das OvAItion Private LLM vereint hohe Performance mit voller Datenhoheit, C5-zertifizierter Sicherheit und stabilen Verarbeitungszeiten. Es wird künftig das bisherige Private LLM ablösen und weiter auf die IDP-Anforderungen der Insiders Kunden und Partner zugeschnitten. Laufendes Finetuning, optimierte Trainings und zusätzliche Daten basierend auf jahrelanger Erfahrung sorgen auch in Zukunft für eine kontinuierliche Verbesserung.

Die Spitze rückt zusammen – mit verlangsamtem Fortschritt und Schwachpunkten

Im vierten Quartal hat Insiders Technologies das Benchmarking deutlich erweitert. Dazu wurde der Testdatensatz nahezu verdoppelt und um anspruchsvollere Dokumententypen ergänzt. Dadurch sank das generelle Score-Niveau leicht, die Aussagekraft konnte im Hinblick auf reale produktive Workflows jedoch erneut gesteigert werden. Insgesamt testete das Team im vierten Quartal 24 Large Language Modelle, darunter Claude 4.5 Sonnet, GPT-5.1 und Gemini 3 Pro. Modelle mit überholten Nachfolgern oder geringerem Relevanzbezug wurden nicht berücksichtigt.

Die Ergebnisse zeigen ein immer enger zusammenrückendes Spitzenfeld: Viele Modelle bewegen sich im Bereich 80 bis 88 Punkte. Foundation-Modelle, die bewusst breit aufgestellt sind und auf riesigen, oft unspezifischen Daten trainiert werden, liefern weiterhin gute Resultate, doch der Fortschritt verlangsamt sich hier. Reasoning-Modelle erreichen zwar hohe Scores, sind im laufenden IDP-Betrieb aber häufig zu langsam oder zu kostenintensiv. Datenschutz bleibt zudem ein zentraler Schwachpunkt global gehosteter Modelle. Obwohl der Anteil in der EU betriebener Modelle im Benchmark bewusst steigt, bleibt er im Markt nach wie vor gering.

Die wichtigsten Erkenntnisse des Q4-Benchmarks:

• die Entwicklung großer Foundation-Modelle stagniert im IDP-Kontext
• reine Reasoning-Modelle sind leistungsstark, aber betrieblich schwer planbar
• echte Fortschritte kommen aus Spezialisierung und gezielten Trainingsmethoden
• Performance und regulatorische Sicherheit bleiben selten in Einklang
• das OvAItion Private LLM erzielt den eindeutig größten Fortschritt im Feld

Der Benchmark stärkt den Best-of-Breed-Ansatz von Insiders. Über die OvAItion Engine können Unternehmen LLMs flexibel kombinieren und nach Kriterien wie Performance, Latenz, Kosten oder Dunkelverarbeitung auswählen. Funktionen wie Green Voting sorgen für automatische Validierung und geringere Nachbearbeitung. Kunden müssen sich damit nicht zwischen Leistung und Sicherheit entscheiden, sondern können die jeweils beste Modellkombination für ihre Prozesse einsetzen.

„Man braucht nicht automatisch die neuesten oder teuersten Modelle, um im IDP-Einsatz gute Ergebnisse zu erzielen“, erklärt Dr. Alexander Lück, Team OvAItion/Data Management und Verantwortlicher für das LLM Benchmarking bei Insiders Technologies. „Unser Vergleich zeigt wieder, dass der größte Qualitätssprung nicht von generischen Foundation-Modellen, sondern von modellseitiger Spezialisierung kommt. Immer wichtiger werden zudem Kriterien wie Datenhoheit, Sicherheit, Stabilität, Anpassbarkeit und kontrollierbare Kosten.“

Die vollständige Benchmarking-Ausgabe Q4 2025 bietet einen aktuellen Überblick über die Leistungsfähigkeit der relevanten Modelle und dient als verlässliche Orientierung für IDP-Verantwortliche. Für individuelle Benchmarkings mit eigenen Use Cases stehen die KI-Expertinnen und -Experten von Insiders zur Verfügung.

Hier kann das Insiders LLM Benchmarking Q4-2025 kostenlos bezogen werden:
https://insiders-technologies.com/de/insiders-llm-benchmarking-dezember-2025/

Weitere Informationen über den Hersteller intelligenter Software für Prozessautomatisierung auf Basis von KI: https://www.insiders-technologies.com/

Zusammenfassung
Insiders Technologies veröffentlicht seinen neuen LLM-Benchmark. Das OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

Software / AI / LLM / Benchmark / IDP
[pressebox.de] · 11.12.2025 · 11:15 Uhr
[0 Kommentare]
Echtschmuck mit Ultraschall reinigen: Schonend, gründlich und strahlend sauber in wenigen Minuten
Mörfelden-Walldorf, 28.03.2026 (lifePR) - Echtschmuck mit Ultraschall reinigen Wer regelmäßig Echtschmuck trägt, kennt das Problem: Feiner Staub, Hautfette, Schweiß oder Umwelteinflüsse setzen sich auf Ringen, Ketten oder Armbändern ab. Mit der Zeit wirkt selbst hochwertiger Schmuck matt und verliert seinen Glanz. Statt zu chemischen Reinigern oder […] (01)
vor 8 Stunden
"Earth Hour" - Berlin
Berlin/New York (dpa) - In vielen Ländern weltweit vom Pazifik bis Europa sind am Abend bekannte Wahrzeichen für eine Stunde im Dunkeln geblieben. In den USA schaltete unter anderem das Empire State Building in New York seine Beleuchtung ab. In Brasilien beteiligte sich erneut die berühmte Christusstatue in Rio de Janeiro. Mit der weltweiten Aktion […] (07)
vor 23 Minuten
Leighton Meester
(BANG) - Leighton Meester ist stolz auf die "Balance" in ihrem Leben. Die Schauspielerin sprach darüber, wie sie versucht, Privatleben und Karriere miteinander zu vereinbaren. Beim Launch eines Duftes in New York erklärte sie im Gespräch mit 'People': "Ich wünschte, ich könnte sagen, dass immer alles ruhig und entspannt ist und einfach friedlich – aber […] (00)
vor 16 Stunden
Review: ECOVACS WINBOT W3 OMNI im Test
Fensterputzen gehört für viele Menschen zu den ungeliebtesten Aufgaben im Haushalt. Gerade große Glasflächen, bodentiefe Fenster oder schwer erreichbare Bereiche kosten Zeit, Nerven und oft auch Überwindung. Mit dem WINBOT W3 OMNI bringt ECOVACS eine Lösung auf den Markt, die genau hier ansetzt und die Glasreinigung auf ein völlig neues Level hebt. In […] (01)
vor 10 Stunden
Pokémon Pokopia Guide: Kristall-Fragmente finden und effektiv farmen
In Pokémon Pokopia sammelst du ständig Materialien, um Gebäude zu reparieren, neue Gegenstände herzustellen oder Quests abzuschließen. Während viele Ressourcen relativ leicht zu finden sind, gibt es ein Material, das bei Spielern immer wieder für Frust sorgt: Kristall-Fragmente. Diese kleinen blauen Splitter gehören zu den seltensten Rohstoffen im […] (01)
vor 9 Stunden
«Die Spur» deckt gefährliches Online-Netzwerk für Jugendliche auf
Die ZDF-Doku zeigt, wie Täter Minderjährige im Internet manipulieren und in Gewaltspiralen treiben. Das ZDF widmet sich am Mittwoch, den 29. April 2026, um 22: 15 Uhr einem besonders erschütternden Thema: In Die Spur „White Tiger und das Sadisten-Netzwerk 764“ rekonstruieren die Autorinnen Alexandra Hardorf und Christiane Schwarz die Strukturen eines internationalen Online-Netzwerks, das […] (00)
vor 15 Stunden
Florian Lipowitz
Queralt (dpa) - Die deutsche Radsport-Hoffnung Florian Lipowitz ist bei der Katalonien-Rundfahrt auf Podestkurs. Auf der vorletzten Etappe über 158,2 schwere Bergkilometer von Berga zur Wallfahrtskirche Santuari de Queralt belegte der 25-Jährige den dritten Rang. Mit tatkräftiger Unterstützung seines Red-Bull-Teamkollegen Remco Evenepoel verbesserte […] (03)
vor 10 Stunden
kostenloses stock foto zu anlagekonzept, binance-logo, bitcoin
Der jüngste Kursverlauf von Bitcoin zeigt einen klaren strukturellen Einbruch, der Wochen der Seitwärtsbewegung beendet und das Momentum nach unten verschiebt. Obwohl eine kurzfristige Erholung möglich ist, bleibt der allgemeine Ausblick bärisch. Solange wichtige Widerstandsniveaus nicht schnell zurückerobert werden, dürften Aufwärtsbewegungen nur von […] (00)
vor 1 Stunde
 
AI-Domains - die Goldgrube im Netz
Koeln, 27.03.2026 (PresseBox) - Es ist ein unscheinbarer Moment, irgendwo zwischen […] (00)
Reisenetz stellt Trendradar für Kinder- und Jugendreisen vor
Berlin, 27.03.2026 (lifePR) - Das Reisenetz – Fachverband für Kinder- und Jugendreisen e. V. – […] (00)
Owasys stellt neues Industrial IoT-Gateway owa347A vor
Wehrheim, 27.03.2026 (PresseBox) - Der spanische Hersteller Owasys, der für seine […] (00)
Iranische Revolutionsgarden
Teheran (dpa) - Der Iran droht mit Angriffen gegen israelische und US-amerikanische […] (00)
Los Angeles Lakers - Brooklyn Nets
Los Angeles (dpa) - LeBron James hat in der NBA einen besonderen Moment mit seinem […] (00)
Lisa Kudrow
(BANG) - Lisa Kudrow wird immer noch 'ein wenig emotional', wenn sie an 'Friends' […] (01)
Runde Silber  Und Goldmünzen
Das britische Außenministerium hat den chinesischsprachigen Krypto-Marktplatz Xinbi […] (00)
Kommende iPhone 18 Modelle sollen wichtige Designänderung erhalten
Nach aktuellen Informationen eines bekannten Leakers könnten alle […] (00)
 
 
Suchbegriff