Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

11. Dezember 2025, 11:15 Uhr · Quelle: Pressebox
Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark
Foto: Pressebox
Insiders Technologies veröffentlicht aktuellen Benchmarking-Report.
Insiders Technologies' OvAItion Private LLM erzielt im Q4-Benchmark deutliche Fortschritte trotz komplexerer Daten. Der Bericht betont, dass gezielte Spezialisierung in der AI den entscheidenden Vorsprung bringt.

Kaiserslautern, 11.12.2025 (PresseBox) - Insiders Technologies, technologisch führender Anbieter von Software für Intelligent Automation (IA), kann in der neuesten, vierten Ausgabe seines LLM Benchmarks einen deutlichen Qualitätssprung des eigenen OvAItion Private LLM verzeichnen. Das Modell verbessert sich trotz verdoppeltem Datenumfang und erheblich komplexerer Dokumente um mehr als zwei Prozentpunkte gegenüber dem Vergleich im dritten Quartal und rückt erstmals in den Leistungsbereich von Top-Modellen wie Claude 4.5 Haiku vor. Generell zeichnet der Benchmark ein klares Bild: Die entscheidenden Fortschritte im IDP-Umfeld entstehen zunehmend durch Spezialisierung, nicht durch immer größere Foundation-Modelle.

Das OvAItion Private LLM vereint hohe Performance mit voller Datenhoheit, C5-zertifizierter Sicherheit und stabilen Verarbeitungszeiten. Es wird künftig das bisherige Private LLM ablösen und weiter auf die IDP-Anforderungen der Insiders Kunden und Partner zugeschnitten. Laufendes Finetuning, optimierte Trainings und zusätzliche Daten basierend auf jahrelanger Erfahrung sorgen auch in Zukunft für eine kontinuierliche Verbesserung.

Die Spitze rückt zusammen – mit verlangsamtem Fortschritt und Schwachpunkten

Im vierten Quartal hat Insiders Technologies das Benchmarking deutlich erweitert. Dazu wurde der Testdatensatz nahezu verdoppelt und um anspruchsvollere Dokumententypen ergänzt. Dadurch sank das generelle Score-Niveau leicht, die Aussagekraft konnte im Hinblick auf reale produktive Workflows jedoch erneut gesteigert werden. Insgesamt testete das Team im vierten Quartal 24 Large Language Modelle, darunter Claude 4.5 Sonnet, GPT-5.1 und Gemini 3 Pro. Modelle mit überholten Nachfolgern oder geringerem Relevanzbezug wurden nicht berücksichtigt.

Die Ergebnisse zeigen ein immer enger zusammenrückendes Spitzenfeld: Viele Modelle bewegen sich im Bereich 80 bis 88 Punkte. Foundation-Modelle, die bewusst breit aufgestellt sind und auf riesigen, oft unspezifischen Daten trainiert werden, liefern weiterhin gute Resultate, doch der Fortschritt verlangsamt sich hier. Reasoning-Modelle erreichen zwar hohe Scores, sind im laufenden IDP-Betrieb aber häufig zu langsam oder zu kostenintensiv. Datenschutz bleibt zudem ein zentraler Schwachpunkt global gehosteter Modelle. Obwohl der Anteil in der EU betriebener Modelle im Benchmark bewusst steigt, bleibt er im Markt nach wie vor gering.

Die wichtigsten Erkenntnisse des Q4-Benchmarks:

• die Entwicklung großer Foundation-Modelle stagniert im IDP-Kontext
• reine Reasoning-Modelle sind leistungsstark, aber betrieblich schwer planbar
• echte Fortschritte kommen aus Spezialisierung und gezielten Trainingsmethoden
• Performance und regulatorische Sicherheit bleiben selten in Einklang
• das OvAItion Private LLM erzielt den eindeutig größten Fortschritt im Feld

Der Benchmark stärkt den Best-of-Breed-Ansatz von Insiders. Über die OvAItion Engine können Unternehmen LLMs flexibel kombinieren und nach Kriterien wie Performance, Latenz, Kosten oder Dunkelverarbeitung auswählen. Funktionen wie Green Voting sorgen für automatische Validierung und geringere Nachbearbeitung. Kunden müssen sich damit nicht zwischen Leistung und Sicherheit entscheiden, sondern können die jeweils beste Modellkombination für ihre Prozesse einsetzen.

„Man braucht nicht automatisch die neuesten oder teuersten Modelle, um im IDP-Einsatz gute Ergebnisse zu erzielen“, erklärt Dr. Alexander Lück, Team OvAItion/Data Management und Verantwortlicher für das LLM Benchmarking bei Insiders Technologies. „Unser Vergleich zeigt wieder, dass der größte Qualitätssprung nicht von generischen Foundation-Modellen, sondern von modellseitiger Spezialisierung kommt. Immer wichtiger werden zudem Kriterien wie Datenhoheit, Sicherheit, Stabilität, Anpassbarkeit und kontrollierbare Kosten.“

Die vollständige Benchmarking-Ausgabe Q4 2025 bietet einen aktuellen Überblick über die Leistungsfähigkeit der relevanten Modelle und dient als verlässliche Orientierung für IDP-Verantwortliche. Für individuelle Benchmarkings mit eigenen Use Cases stehen die KI-Expertinnen und -Experten von Insiders zur Verfügung.

Hier kann das Insiders LLM Benchmarking Q4-2025 kostenlos bezogen werden:
https://insiders-technologies.com/de/insiders-llm-benchmarking-dezember-2025/

Weitere Informationen über den Hersteller intelligenter Software für Prozessautomatisierung auf Basis von KI: https://www.insiders-technologies.com/

Zusammenfassung
Insiders Technologies veröffentlicht seinen neuen LLM-Benchmark. Das OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

Software / AI / LLM / Benchmark / IDP
[pressebox.de] · 11.12.2025 · 11:15 Uhr
[0 Kommentare]
Durchhaltevermögen: Die innere Kraft, die über Erfolg entscheidet
Höchst i. Odw., 04.04.2026 (lifePR) - In einer schnelllebigen Welt voller Herausforderungen, Leistungsdruck und ständiger Veränderungen wird Durchhaltevermögen (auch mentale Stärke oder Resilienz) zu einer der wichtigsten Fähigkeiten. Es beschreibt die Fähigkeit, trotz Rückschlägen, Erschöpfung oder Hindernissen an Zielen festzuhalten, Aufgaben mit […] (00)
vor 2 Stunden
Buckelwal liegt weiter in Wismarbucht
Wismar (dpa) - Der vor Wismar gestrandete Buckelwal lebt noch. Der Zustand des Tieres habe sich in der Nacht nicht verändert, teilte ein Sprecher des Umweltministeriums Mecklenburg-Vorpommern am Morgen mit. Demnach kam es in der Nacht zu «keinen besonderen Vorkommnissen». Der geschwächte Wal liegt weiterhin vor der Insel Poel im flachen Wasser. […] (02)
vor 2 Stunden
Blake Lively
(BANG) - Blake Lively erklärt, sie sei "dankbar" für die Entscheidung des Gerichts – obwohl 10 von 13 Anschuldigungen in ihrer Klage gegen ihren 'It Ends With Us'-Co-Star Justin Baldoni abgewiesen wurden. Die 38-jährige Schauspielerin veröffentlichte am Freitag (3. April) eine Stellungnahme in ihrer Instagram-Story und kritisierte zugleich den "Online- […] (00)
vor 1 Stunde
iPhone 18 Pro offenbar ohne schwarze Farbvariante
Einem aktuellen Gerücht zufolge wird Apple bei den kommenden iPhone 18 Pro Modellen auf ein schwarzes Gehäuse verzichten. Zum Vergleich: Die derzeitige iPhone 17 Pro Serie ist in den markanten Farben Silber, Cosmic Orange und Deep Blue erhältlich. iPhone im Business, Quelle: Unsplash Kein Schwarz für die iPhone 18 Pro Modelle Wie der bekannte […] (00)
vor 18 Stunden
Switch 2: Ehemaliger Nintendo-Mitarbeiter warnt vor kommendem Preisanstieg
Die Nintendo Switch 2 ist seit ihrem Launch eine der meistgekauften Konsolen des Jahres – doch wer noch mit dem Kauf gehadert hat, könnte bald in eine unangenehme Situation geraten. Ein ehemaliger Nintendo-Vertriebsmitarbeiter hat sich öffentlich zu den Preisentwicklungen des Unternehmens geäussert, und seine Einschätzung lässt aufhorchen. Was der Ex- […] (01)
vor 18 Stunden
Apple TV entwickelt «Fegefeuer der Eitelkeiten»
Der Klassiker von Tom Wolfe bekommt eine neue Serienadaption – mit prominenter Besetzung hinter den Kulissen. Beim Streamingdienst Apple TV nimmt eine Serienversion von Bonfire of the Vanities Gestalt an. Für die Umsetzung zeichnet David E. Kelley verantwortlich, der das Drehbuch schreibt und als Executive Producer fungiert. Die Regie übernimmt Matt Reeves, der ebenfalls als Produzent […] (00)
vor 1 Stunde
Joachim Löw
Berlin (dpa) - Um Weltmeister-Trainer Joachim Löw gibt es ein überraschendes und wenig glaubhaftes Comeback-Gerücht - und der 66-Jährige räumt es auch schnell aus der Welt. Laut des Portals «ghanasoccernet» könnte Löw für die anstehende Fußball-WM die Nationalmannschaft Ghanas als Trainer übernehmen. Doch dazu wird es wohl nicht kommen. «Mit mir hat […] (06)
vor 19 Stunden
bitcoin, table, courses, finance, virtual, crypto, currency, money, coin, computer
Charles Schwab, einer der größten Finanzdienstleister der USA, hat eine neue Seite für Kryptowährungen eingeführt. Dies folgt auf die Ankündigung des CEO Rick Wurster im letzten Jahr, dass das Unternehmen plant, kryptofokussierte Produkte bis zur ersten Hälfte 2026 anzubieten. Das 1971 gegründete Unternehmen verwaltet Vermögenswerte in Höhe von rund 12 […] (00)
vor 35 Minuten
 
Wenn der Vorplatz zum Showroom wird
Sinsheim, 02.04.2026 (lifePR) - Wenn sich am ersten Sonntag im Monat von 9 bis 14 Uhr […] (00)
Saisonstart 2026 im Ziegeleipark Mildenberg
Zehdenick OT Mildenberg, 02.04.2026 (lifePR) - Der Ziegeleipark Mildenberg startet in […] (00)
Redwood AI beschleunigt die Suche nach Alzheimer-Medikamenten
Lüdenscheid, 03.04.2026 (lifePR) - Redwood AI (ISIN: CA7579221093 | WKN: A422EZ) , […] (00)
Schweißer bei der Arbeit (Archiv)
Berlin - In Deutschland ist die Zahl der ausgeschriebenen Stellen in der Industrie […] (00)
Christian Ulmen
(BANG) - Die Vorwürfe gegen Schauspieler Christian Ulmen sorgen derzeit bundesweit […] (00)
kostenloses stock foto zu aktienmarkt, banknoten, berlin
Aktuelle On-Chain-Daten zeigen, dass große Bitcoin-Investoren in letzter Zeit […] (00)
Apple iPad Air 3 WLAN landet auf der Vintage-Liste
Apple hat nun auch die WLAN-Version des iPad Air 3 offiziell in seine sogenannte […] (00)
Echoes of Aincrad – Neuer Story Trailer gibt Einblicke
Bandai Namco Entertainment Europe veröffentlicht den Story-Trailer zu  Echoes of […] (00)
 
 
Suchbegriff