Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

11. Dezember 2025, 11:15 Uhr · Quelle: Pressebox
Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
Foto: Pressebox
Insiders Technologies veröffentlicht aktuellen Benchmarking-Report.
Insiders Technologies' OvAItion Private LLM erzielt im Q4-Benchmark deutliche Fortschritte trotz komplexerer Daten. Der Bericht betont, dass gezielte Spezialisierung in der AI den entscheidenden Vorsprung bringt.

Kaiserslautern, 11.12.2025 (PresseBox) - Insiders Technologies, technologisch führender Anbieter von Software für Intelligent Automation (IA), kann in der neuesten, vierten Ausgabe seines LLM Benchmarks einen deutlichen Qualitätssprung des eigenen OvAItion Private LLM verzeichnen. Das Modell verbessert sich trotz verdoppeltem Datenumfang und erheblich komplexerer Dokumente um mehr als zwei Prozentpunkte gegenüber dem Vergleich im dritten Quartal und rückt erstmals in den Leistungsbereich von Top-Modellen wie Claude 4.5 Haiku vor. Generell zeichnet der Benchmark ein klares Bild: Die entscheidenden Fortschritte im IDP-Umfeld entstehen zunehmend durch Spezialisierung, nicht durch immer größere Foundation-Modelle.

Das OvAItion Private LLM vereint hohe Performance mit voller Datenhoheit, C5-zertifizierter Sicherheit und stabilen Verarbeitungszeiten. Es wird künftig das bisherige Private LLM ablösen und weiter auf die IDP-Anforderungen der Insiders Kunden und Partner zugeschnitten. Laufendes Finetuning, optimierte Trainings und zusätzliche Daten basierend auf jahrelanger Erfahrung sorgen auch in Zukunft für eine kontinuierliche Verbesserung.

Die Spitze rückt zusammen – mit verlangsamtem Fortschritt und Schwachpunkten

Im vierten Quartal hat Insiders Technologies das Benchmarking deutlich erweitert. Dazu wurde der Testdatensatz nahezu verdoppelt und um anspruchsvollere Dokumententypen ergänzt. Dadurch sank das generelle Score-Niveau leicht, die Aussagekraft konnte im Hinblick auf reale produktive Workflows jedoch erneut gesteigert werden. Insgesamt testete das Team im vierten Quartal 24 Large Language Modelle, darunter Claude 4.5 Sonnet, GPT-5.1 und Gemini 3 Pro. Modelle mit überholten Nachfolgern oder geringerem Relevanzbezug wurden nicht berücksichtigt.

Die Ergebnisse zeigen ein immer enger zusammenrückendes Spitzenfeld: Viele Modelle bewegen sich im Bereich 80 bis 88 Punkte. Foundation-Modelle, die bewusst breit aufgestellt sind und auf riesigen, oft unspezifischen Daten trainiert werden, liefern weiterhin gute Resultate, doch der Fortschritt verlangsamt sich hier. Reasoning-Modelle erreichen zwar hohe Scores, sind im laufenden IDP-Betrieb aber häufig zu langsam oder zu kostenintensiv. Datenschutz bleibt zudem ein zentraler Schwachpunkt global gehosteter Modelle. Obwohl der Anteil in der EU betriebener Modelle im Benchmark bewusst steigt, bleibt er im Markt nach wie vor gering.

Die wichtigsten Erkenntnisse des Q4-Benchmarks:

• die Entwicklung großer Foundation-Modelle stagniert im IDP-Kontext
• reine Reasoning-Modelle sind leistungsstark, aber betrieblich schwer planbar
• echte Fortschritte kommen aus Spezialisierung und gezielten Trainingsmethoden
• Performance und regulatorische Sicherheit bleiben selten in Einklang
• das OvAItion Private LLM erzielt den eindeutig größten Fortschritt im Feld

Der Benchmark stärkt den Best-of-Breed-Ansatz von Insiders. Über die OvAItion Engine können Unternehmen LLMs flexibel kombinieren und nach Kriterien wie Performance, Latenz, Kosten oder Dunkelverarbeitung auswählen. Funktionen wie Green Voting sorgen für automatische Validierung und geringere Nachbearbeitung. Kunden müssen sich damit nicht zwischen Leistung und Sicherheit entscheiden, sondern können die jeweils beste Modellkombination für ihre Prozesse einsetzen.

„Man braucht nicht automatisch die neuesten oder teuersten Modelle, um im IDP-Einsatz gute Ergebnisse zu erzielen“, erklärt Dr. Alexander Lück, Team OvAItion/Data Management und Verantwortlicher für das LLM Benchmarking bei Insiders Technologies. „Unser Vergleich zeigt wieder, dass der größte Qualitätssprung nicht von generischen Foundation-Modellen, sondern von modellseitiger Spezialisierung kommt. Immer wichtiger werden zudem Kriterien wie Datenhoheit, Sicherheit, Stabilität, Anpassbarkeit und kontrollierbare Kosten.“

Die vollständige Benchmarking-Ausgabe Q4 2025 bietet einen aktuellen Überblick über die Leistungsfähigkeit der relevanten Modelle und dient als verlässliche Orientierung für IDP-Verantwortliche. Für individuelle Benchmarkings mit eigenen Use Cases stehen die KI-Expertinnen und -Experten von Insiders zur Verfügung.

Hier kann das Insiders LLM Benchmarking Q4-2025 kostenlos bezogen werden:
https://insiders-technologies.com/de/insiders-llm-benchmarking-dezember-2025/

Weitere Informationen über den Hersteller intelligenter Software für Prozessautomatisierung auf Basis von KI: https://www.insiders-technologies.com/

Zusammenfassung
Insiders Technologies veröffentlicht seinen neuen LLM-Benchmark. Das OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

Software / AI / LLM / Benchmark / IDP
[pressebox.de] · 11.12.2025 · 11:15 Uhr
[0 Kommentare]
Green Bridge Metals: 1. Bohrphase bei „Titac South“ abgeschlossen
Lüdenscheid, 27.03.2026 (PresseBox) - Green Bridge Metals Corp. (ISIN: CA3929211025; WKN: A3EW4S), freut sich, ein Update zu seinem laufenden Phase-1-Diamantkernbohrprogramm dem Projekt “Titac” bereitzustellen, das sich im “South Contact District” des Unternehmens im Nordosten des US-Bundesstaates Minnesota befindet. Das Projekt “Titac” beherbergt eine […] (00)
vor 8 Stunden
US-Präsident Trump
Miami (dpa) - US-Präsident Donald Trump hat die Straße von Hormus «Straße von Trump» genannt. Auf einem Kongress in Miami sprach der Republikaner über den Verlauf des Iran-Kriegs und sagte: «Sie müssen die Straße von Trump öffnen - ich meine Hormus.» Im Publikum wurde daraufhin gelacht.  Trump ergänzte dann: «Entschuldigung - es tut mir so leid. So ein […] (03)
vor 27 Minuten
Beyond Aero: Dieser Geschäftsjet soll mit Wasserstoff fliegen
Der Luftverkehr steht vor der Herausforderung, seine Emissionen deutlich zu reduzieren, ohne dabei auf Reichweite und Wirtschaftlichkeit zu verzichten. Wasserstoff gilt seit einigen Jahren als vielversprechender Energieträger, doch konkrete Anwendungen in der zivilen Luftfahrt befinden sich bislang meist im experimentellen Stadium. Ein französisches […] (00)
vor 6 Stunden
FBI-Chef Patel
Washington (dpa) - Der Direktor der US-Bundespolizeibehörde FBI, Kash Patel, ist Medienberichten zufolge Opfer eines Hackerangriffs geworden. Eine Gruppe mit Verbindungen zum Iran habe den Cyberangriff für sich reklamiert, schrieb unter anderem die «New York Times». Demnach wurden Fotos und Dokumente von Patels privatem E-Mail-Konto auf einer Webseite […] (00)
vor 3 Stunden
Rematch: Season 3 startet jetzt mit neuen Missionstypen, Battle Pass Belohnungen und mehr
Rematch , das preisgekrönte Action-Fußballspiel von Sloclap, dem Studio hinter  Sifu, setzt mit mit dem Start von  Season 3  zum nächsten Treffer an und bringt frische Inhalte auf PC, PlayStation 5 und Xbox Series X|S. Hier ein kurzer Überblick über die Neuerungen, bevor es zurück ins nächste Spiel geht: Tägliche und wöchentliche Missionen: […] (00)
vor 4 Stunden
«The Bold and the Beautiful»: Eigene Streaming-App
Mit BBTV bringt die Kult-Soap erstmals ihr komplettes Archiv auf eine eigene Plattform. Fans von The Bold and the Beautiful bekommen ein neues Zuhause: Zum 39. Jubiläum der Serie ist mit BBTV ein eigener Streamingdienst gestartet, der erstmals die komplette Historie der Soap bündelt. Entwickelt wurde die Plattform von Bell-Phillip Television Productions, die auch hinter der langlebigen CBS- […] (00)
vor 3 Stunden
US-Golfstar Tiger Woods in Autounfall verwickelt
Jupiter Island (dpa) - US-Golfstar Tiger Woods ist nach einem Autounfall in den USA wegen Drogenverdachts festgenommen worden. Ein Atemalkoholtest habe zwar einen Wert von null angezeigt, sagte John Budensiek vom Martin County Sheriff's Office in Florida bei einer Pressekonferenz. Einen Urintest habe Woods aber nicht machen wollen. Die Ermittler vermuten, dass er «irgendein Medikament oder eine […] (02)
vor 3 Stunden
cryptocurrency, bitcoin, coin, money, digital, finance, crypto, cognac, liquor, clock
Die Stimmung unter Krypto-Investoren hat einen Tiefpunkt erreicht, doch große Bitcoin-Inhaber sehen darin eine Kaufgelegenheit. Kleinere Verkäufer, größere Käufer Während sich Kleinanleger zurückziehen, haben Wallets mit einem Bestand zwischen 10 und 10.000 Bitcoin in den letzten 30 Tagen etwa 61.568 Coins hinzugefügt, wie Daten der Marktanalysefirma […] (00)
vor 29 Minuten
 
Mit Kunst auf globale Wasserknappheit aufmerksam machen
Heidelberg, 26.03.2026 (PresseBox) - Mit zwei Aktionen am Weltwassertag 2026 machte die  […] (00)
Buchrezension: Jutta Eisele: Christ und Gendern?
Ostfildern, 27.03.2026 (lifePR) -. Themen: Buchrezension Buchrezension Jutta Eisele: Christ […] (00)
Fernstudium Infotage vom 15.- 29. April
Wismar, 27.03.2026 (lifePR) - Das Abi schon fast in der Tasche und noch keine Pläne, […] (00)
Tempolimit in Deutschland (Archiv)
Berlin - Angesichts drohender Versorgungsengpässe beim Sprit ist eine kontroverse […] (25)
Stefanie Giesinger
(BANG) - Stefanie Giesinger startete emotional schwierig ins Jahr 2026, nachdem sie […] (00)
Neue Staffel von «Die Millionendiebin» gestartet
True Crime, Historienkrimis und persönliche Geschichten: Die ARD bündelt zahlreiche neue Audio- […] (00)
Tomodachi Life überrascht mit Gratis-Demo – du kannst das Switch-Spiel schon jetzt spielen
Nintendo bringt eine der ungewöhnlichsten Lebenssimulationen zurück. Mit Tomodachi […] (00)
kostenloses stock foto zu 4k wallpaper, anlagekonzept, bitcoin
Die geopolitischen Spannungen im Nahen Osten zwischen Iran und Israel/USA haben in […] (00)
 
 
Suchbegriff