Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

11. Dezember 2025, 11:15 Uhr · Quelle: Pressebox
Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
Foto: Pressebox
Insiders Technologies veröffentlicht aktuellen Benchmarking-Report.
Insiders Technologies' OvAItion Private LLM erzielt im Q4-Benchmark deutliche Fortschritte trotz komplexerer Daten. Der Bericht betont, dass gezielte Spezialisierung in der AI den entscheidenden Vorsprung bringt.

Kaiserslautern, 11.12.2025 (PresseBox) - Insiders Technologies, technologisch führender Anbieter von Software für Intelligent Automation (IA), kann in der neuesten, vierten Ausgabe seines LLM Benchmarks einen deutlichen Qualitätssprung des eigenen OvAItion Private LLM verzeichnen. Das Modell verbessert sich trotz verdoppeltem Datenumfang und erheblich komplexerer Dokumente um mehr als zwei Prozentpunkte gegenüber dem Vergleich im dritten Quartal und rückt erstmals in den Leistungsbereich von Top-Modellen wie Claude 4.5 Haiku vor. Generell zeichnet der Benchmark ein klares Bild: Die entscheidenden Fortschritte im IDP-Umfeld entstehen zunehmend durch Spezialisierung, nicht durch immer größere Foundation-Modelle.

Das OvAItion Private LLM vereint hohe Performance mit voller Datenhoheit, C5-zertifizierter Sicherheit und stabilen Verarbeitungszeiten. Es wird künftig das bisherige Private LLM ablösen und weiter auf die IDP-Anforderungen der Insiders Kunden und Partner zugeschnitten. Laufendes Finetuning, optimierte Trainings und zusätzliche Daten basierend auf jahrelanger Erfahrung sorgen auch in Zukunft für eine kontinuierliche Verbesserung.

Die Spitze rückt zusammen – mit verlangsamtem Fortschritt und Schwachpunkten

Im vierten Quartal hat Insiders Technologies das Benchmarking deutlich erweitert. Dazu wurde der Testdatensatz nahezu verdoppelt und um anspruchsvollere Dokumententypen ergänzt. Dadurch sank das generelle Score-Niveau leicht, die Aussagekraft konnte im Hinblick auf reale produktive Workflows jedoch erneut gesteigert werden. Insgesamt testete das Team im vierten Quartal 24 Large Language Modelle, darunter Claude 4.5 Sonnet, GPT-5.1 und Gemini 3 Pro. Modelle mit überholten Nachfolgern oder geringerem Relevanzbezug wurden nicht berücksichtigt.

Die Ergebnisse zeigen ein immer enger zusammenrückendes Spitzenfeld: Viele Modelle bewegen sich im Bereich 80 bis 88 Punkte. Foundation-Modelle, die bewusst breit aufgestellt sind und auf riesigen, oft unspezifischen Daten trainiert werden, liefern weiterhin gute Resultate, doch der Fortschritt verlangsamt sich hier. Reasoning-Modelle erreichen zwar hohe Scores, sind im laufenden IDP-Betrieb aber häufig zu langsam oder zu kostenintensiv. Datenschutz bleibt zudem ein zentraler Schwachpunkt global gehosteter Modelle. Obwohl der Anteil in der EU betriebener Modelle im Benchmark bewusst steigt, bleibt er im Markt nach wie vor gering.

Die wichtigsten Erkenntnisse des Q4-Benchmarks:

• die Entwicklung großer Foundation-Modelle stagniert im IDP-Kontext
• reine Reasoning-Modelle sind leistungsstark, aber betrieblich schwer planbar
• echte Fortschritte kommen aus Spezialisierung und gezielten Trainingsmethoden
• Performance und regulatorische Sicherheit bleiben selten in Einklang
• das OvAItion Private LLM erzielt den eindeutig größten Fortschritt im Feld

Der Benchmark stärkt den Best-of-Breed-Ansatz von Insiders. Über die OvAItion Engine können Unternehmen LLMs flexibel kombinieren und nach Kriterien wie Performance, Latenz, Kosten oder Dunkelverarbeitung auswählen. Funktionen wie Green Voting sorgen für automatische Validierung und geringere Nachbearbeitung. Kunden müssen sich damit nicht zwischen Leistung und Sicherheit entscheiden, sondern können die jeweils beste Modellkombination für ihre Prozesse einsetzen.

„Man braucht nicht automatisch die neuesten oder teuersten Modelle, um im IDP-Einsatz gute Ergebnisse zu erzielen“, erklärt Dr. Alexander Lück, Team OvAItion/Data Management und Verantwortlicher für das LLM Benchmarking bei Insiders Technologies. „Unser Vergleich zeigt wieder, dass der größte Qualitätssprung nicht von generischen Foundation-Modellen, sondern von modellseitiger Spezialisierung kommt. Immer wichtiger werden zudem Kriterien wie Datenhoheit, Sicherheit, Stabilität, Anpassbarkeit und kontrollierbare Kosten.“

Die vollständige Benchmarking-Ausgabe Q4 2025 bietet einen aktuellen Überblick über die Leistungsfähigkeit der relevanten Modelle und dient als verlässliche Orientierung für IDP-Verantwortliche. Für individuelle Benchmarkings mit eigenen Use Cases stehen die KI-Expertinnen und -Experten von Insiders zur Verfügung.

Hier kann das Insiders LLM Benchmarking Q4-2025 kostenlos bezogen werden:
https://insiders-technologies.com/de/insiders-llm-benchmarking-dezember-2025/

Weitere Informationen über den Hersteller intelligenter Software für Prozessautomatisierung auf Basis von KI: https://www.insiders-technologies.com/

Zusammenfassung
Insiders Technologies veröffentlicht seinen neuen LLM-Benchmark. Das OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

Software / AI / LLM / Benchmark / IDP
[pressebox.de] · 11.12.2025 · 11:15 Uhr
[0 Kommentare]
Green Bridge Metals: 1. Bohrphase bei „Titac South“ abgeschlossen
Lüdenscheid, 27.03.2026 (PresseBox) - Green Bridge Metals Corp. (ISIN: CA3929211025; WKN: A3EW4S), freut sich, ein Update zu seinem laufenden Phase-1-Diamantkernbohrprogramm dem Projekt “Titac” bereitzustellen, das sich im “South Contact District” des Unternehmens im Nordosten des US-Bundesstaates Minnesota befindet. Das Projekt “Titac” beherbergt eine […] (00)
vor 2 Stunden
Außenminister-Treffen der G7
Vaux-de-Cernay (dpa) - Trotz Kritik aus den USA an den europäischen Partnern haben die G7-Außenminister eine gemeinsame Linie zum Iran-Krieg gefunden. Der deutsche Außenminister Johann Wadephul sagte nach einem Gespräch auch mit seinem US-Kollegen Marco Rubio, es gebe keinen Dissens und auch keine Forderung der USA zu einem militärischen Beitrag vor […] (08)
vor 12 Minuten
Bruce Springsteen
(BANG) - Die kommende Tour von Bruce Springsteen wird "politisch sein". "The Boss" startet seine US-Tour mit der E Street Band am 31. März in Minneapolis, nur wenige Monate nachdem er dort im Januar bei einem Anti-ICE-Konzert seinen Protestsong 'Streets of Minneapolis' erstmals vorgestellt hatte. Die Tour soll am 27. Mai in Washington, D.C. enden. […] (01)
vor 5 Stunden
Illustration - Smartphone-Nutzung
Brüssel (dpa) - Im Kampf gegen Kinderpornografie wird es in der EU ab Ende kommender Woche keine rechtssicheren Kontrollen von Online-Kommunikation mehr geben. Eine Mehrheit der Abgeordneten des Europaparlaments lehnte bei einer Abstimmung in Brüssel am Donnerstag die Verlängerung der Erlaubnis für Online-Plattformen wie Instagram oder LinkedIn ab. Die […] (00)
vor 3 Stunden
Kingdom Come Mitgründer zu DLSS 5: „Hater werden das nicht aufhalten“
Die Debatte um Nvidias DLSS 5 reißt nicht ab – doch während viele Entwickler und Animatoren die Technologie scharf kritisieren, gibt es auch prominente Stimmen, die eine ganz andere Perspektive einnehmen. Daniel Vávra, Mitgründer von Warhorse Studios und Kopf hinter der Kingdom-Come-Deliverance-Reihe, hat sich in einem Social-Media-Beitrag klar […] (00)
vor 6 Stunden
NBC verlängert «Chicago Fire», «Chicago P.D.» und «Chicago Med»
Das „One Chicago“-Universum bleibt stabil: Alle drei Serien kehren auch in der Saison 2026/27 zurück. Der US-Network NBC setzt weiter auf sein erfolgreichstes Franchise und hat gleich drei Formate verlängert: Chicago Fire, Chicago P.D. und Chicago Med erhalten jeweils neue Staffeln für die Season 2026/27. Damit kommen die Serien auf beeindruckende Laufzeiten von 15, 14 und 12 Staffeln. Die […] (00)
vor 1 Stunde
US-Golfstar Tiger Woods
Jupiter Island (dpa) - US-Golfstar Tiger Woods ist laut US-Medienberichten in einen Autounfall verwickelt worden. Das Fahrzeug überschlug sich am Freitagnachmittag (Ortszeit) in der Stadt Jupiter Island im Bundesstaat Florida, wie unter anderem ABC News und NBC News unter Berufung auf das örtliche Sheriff-Büro berichteten. Zum Gesundheitszustand von […] (02)
vor 12 Minuten
Runde Silber  Und Goldmünzen
Analysten sind der Meinung, dass der aktuelle Preis von XRP, der sich bei etwa $1,40 bewegt, unterbewertet ist. Obwohl die Kryptowährung im letzten Jahr über $3 gestiegen ist, erreichte sie kein neues Allzeithoch und hat seitdem einen deutlichen Rückgang erlebt, da ihre technische Struktur schwächer wurde. Trotz dieser Entwicklungen bleiben Analysten optimistisch und argumentieren, dass selbst […] (00)
vor 1 Stunde
 
KI kommt, Mensch bleibt
Heilbronn, 27.03.2026 (PresseBox) - Wenn Unternehmen KI-Systeme einführen, stehen oft […] (00)
Osterhauptstadt Bautzen: Tradition, Brauchtum und buntes Programm für die ganze Familie
Bautzen, 27.03.2026 (lifePR) - Frühlingsblüher verwandeln die Stadt Bautzen derzeit […] (00)
Mehrfamilienhaus in Dortmund: Welche Sanierungspflichten das Gebäudeenergiegesetz vorschreibt
Dortmund, 27.03.2026 (lifePR) - Das Gebäudeenergiegesetz (GEG) verpflichtet […] (00)
Wetter in Hessen
Offenbach (dpa) - Es wird wieder frostig: Nach frühlingshaften Tagen kehrt am […] (02)
Rosalía
(BANG) - Rosalía war gezwungen, zum ersten Mal ein Konzert vorzeitig zu beenden, […] (00)
HRE-Zombie lebt: Wie Deutschland 17 Jahre nach der Finanzkrise noch immer Milliarden abwickelt
Ein Gewinn, der die eigentliche Geschichte verdeckt 43 Millionen Euro Gewinn. Das […] (00)
Pressekonferenz Nationalmannschaft
Basel (dpa) - Kai Havertz feiert nach mehr als einem Jahr sein Comeback in der […] (03)
Durabook Z14I-HG – Die leistungsstärkste Rugged 14-Zoll-KI-Workstation ihrer Klasse
Mit der neuen Z14I-HG stellt  Durabook, weltweit renommierte Marke für […] (00)
 
 
Suchbegriff