Neuer Insiders LLM Benchmark für intelligente Dokumentenverarbeitung
Aktueller Report stützt Best-of-Breed-Ansatz und zeigt Licht und Schatten bei Reasoning-Modellen. Insiders Private LLM holt bei Performance auf und überzeugt bei Datenschutz und Regulatorik.

28. September 2025, 10:33 Uhr · Quelle: Pressebox
Der Insiders LLM Benchmark Q3-2025 zeigt, dass Modelle wie GPT-5 in der Leistung überzeugen, aber mit höheren Kosten einhergehen. Insiders' eigene LLM nähern sich den Top-Performances an, bei starkem Fokus auf Datenschutz.

Kaiserslautern, 28.09.2025 (PresseBox) - Insiders Technologies, technologisch führender Anbieter von Software für Intelligent Automation (IA), veröffentlicht eine neue Version des Insiders LLM Benchmarking Reports. Das Insiders LLM Benchmarking vergleicht die Leistungen gängiger Large Language Modelle (LLM) wie beispielsweise von OpenAI, Google, Anthropic und Mistral sowie eigener Modelle von Insiders.
Besonders praxisnah wird der Vergleich dabei durch die Leistungsbewertung der unterschiedlichen Modelle für Anwendungsfälle in der intelligenten Verarbeitung von Dokumenten (engl. Intelligent Document Processing, kurz IDP). Da als Testdaten ein standardisierter IDP-Datensatz mit realen Dokumenten aus der Versicherungs- und Finanzwelt verwendet wird, sind die quartalsweise veröffentlichten Benchmarks miteinander vergleichbar und die Ergebnisse direkt auf Kundenanforderungen in der Praxis übertragbar.

LLM überzeugen – Reasoning-Modelle mit Licht und Schatten

Die Auswertung zeigt: Globale Modelle setzen mit großem Datenvolumen und leistungsstarker Hardware den Standard. GPT-5 von OpenAI führt das Ranking in der Leistungsfähigkeit mit 90,7 Punkten an, gefolgt von Claude 4 Sonnet (90,0) und dem Sieger des zuletzt analysierten Quartals Claude 3.7 Sonnet (89,9). Zugleich zeigt sich jedoch, dass Reasoning-Modelle wie GPT-5, die speziell auf komplexes logisches Denken trainiert wurden, zwar knapp die besten Ergebnisse in Klassifikation und Extraktion erzielen, diese Vorteile jedoch mit spürbaren Nachteilen einhergehen und stark vom jeweiligen Modell abhängen. So liegen die Verarbeitungszeiten bei GPT-5 um den Faktor 4 höher und auch die Token-Kosten steigen dementsprechend um ein Vielfaches – ein Aspekt, der für den produktiven Einsatz nicht zu vernachlässigen ist. Reasoning-Modelle sollten daher in der Praxis mit Vorsicht und nur in sinnvollen Use Cases angewendet werden.
In Summe übernimmt deshalb Claude 4 Sonnet als schnelles und leistungsstarkes Modell gehostet in der EU die Führung im aktuellen Benchmarking. Auch Claude 3 Haiku glänzt als bewährtes Modell mit beeindruckenden Ergebnissen in der Geschwindigkeit und eignet sich daher bei überschaubaren Genauigkeitsverlusten ideal für Volumenverarbeitung.

Private LLM von Insiders rückt an die Spitzengruppe heran

Durch den Wechsel zu einem leistungsfähigeren Modell konnte das Insiders Private LLM – gehostet bei Insiders – seine Qualität bei gleichbleibender Bearbeitungszeit von 67,9 in Q2 auf nun 78,2 Punkte in Q3 steigern. Es nähert sich damit den Top-Modellen – ohne dabei an Datenschutz oder Geschwindigkeit einzubüßen. Auch der Prototyp des neuen Insiders OvAItion LLM, ebenfalls gehostet bei Insiders, rückt mit 80,1 Punkten weiter an die Spitzengruppe heran. Im Gegensatz zu globalen Modellen von OpenAI, Google, Anthropic und Co. sind die Insiders LLM auf höchsten Datenschutz und regulatorische Sicherheit ausgelegt. Durch den Betrieb in der ISO 27001-zertifizierten Insiders Cloud eignen sie sich besonders für sensible Dokumente wie Finanzunterlagen oder Gesundheitsdaten. Für Branchen wie das Finanz- und Versicherungswesen oder Health Care bietet dieser Ansatz einen klaren Vorteil.
„Unser kontinuierliches Benchmarking unterschiedlicher Modelle bildet nicht nur die Grundlage für unsere fundierte Beratung zur Auswahl von KI-Technologien, sondern treibt auch unsere eigene Modellentwicklung voran“, erklärt Dr. Alexander Lück, Team OvAItion/Data Management und Verantwortlicher für das LLM Benchmarking bei Insiders Technologies.

An Best of Breed führt kein Weg vorbei

Das regelmäßige LLM Benchmarking mit realen IDP-Szenarien macht deutlich, dass es nicht das eine „beste“ LLM gibt. Zum einen verändern sich die Leistungen mit Blick auf Performance und Speed durch immer neue Versionen der Modelle erheblich. Zum anderen sind für den konkreten Einsatz immer auch die individuellen regulatorischen Anforderungen zu berücksichtigen. Mit einer auf dem Best-of-Breed-Ansatz basierenden flexiblen KI-Infrastruktur, die die jeweils bestgeeigneten LLM flexibel und auch in Kombination untereinander oder mit anderen bewährten KI-Technologien einsetzen kann, sind Kunden für die sehr dynamischen Veränderungen und Technologiesprünge bestens gerüstet.

Die aktuelle Version des Insiders LLM Benchmarking Q3-2025 kann hier kostenlos bezogen werden. Zudem besteht die Möglichkeit, individuelle Use Cases benchmarken zu lassen: https://insiders-technologies.com/de/insiders-llm-benchmarking-september-2025
Weitere Informationen über den Hersteller intelligenter Software für Prozessautomatisierung auf Basis von KI: https://www.insiders-technologies.com

Zusammenfassung
Neuer Insiders LLM Benchmark für intelligente Dokumentenverarbeitung stützt Best-of-Breed-Ansatz und zeigt Licht und Schatten bei Reasoning-Modellen. Private LLM holen bei Performance auf und überzeugen bei Datenschutz und Regulatorik.

Keywords
LLM, Benchmark, Versicherungswirtschaft, Performance, Inputmanagement, Intelligent Automation, KI, IDP

Software / LLM / Benchmark / IDP / KI
[pressebox.de] · 28.09.2025 · 10:33 Uhr
[0 Kommentare]
Veranstaltungstipp – Familienrundgang mit Bewegungsimpulsen und freier Eintritt
Mainz, 06.04.2026 (lifePR) - Wir laden Familien herzlich zu einer gemeinsamen Entdeckungstour durch die Kunsthalle ein. Hier gibt es immer etwas anderes zu erleben. Gemeinsames Rätseln, Forschen oder Zeichnen vor den Kunstwerken – mach einfach mit! Der Familienrundgang mit Bewegungsimpulsen findet am Sonntag, den 19/04 um 14 Uhr statt und ist Teil des Programms  Freistunden. Im Rahmen der  […] (00)
vor 3 Stunden
Bundeswehr-Soldat mit Pistole (Archiv)
Berlin/Oldenburg - Verfassungsrechtler kritisieren eine mögliche Genehmigungspflicht für Auslandsreisen für junge Männer. "Insgesamt halte ich die aktuelle Regelung außerhalb des Spannungs- und Verteidigungsfalles nicht für verhältnismäßig", sagte Alexander Thiele, Professor für Öffentliches Recht an der Business & Law School Berlin, der "Welt". Ziel […] (00)
vor 3 Minuten
Quantenphysik schlägt künstliche Intelligenz — mit nur neun Atomen
Wer mehr Rechenleistung braucht, baut größere Systeme — so lautet die Grundannahme, auf der ein großer Teil der modernen Computerentwicklung beruht. Mehr Schichten, mehr Verbindungen, mehr Energie. Eine aktuelle Studie, veröffentlicht im renommierten Fachjournal Physical Review Letters, stellt diese Logik grundsätzlich infrage. Ein Forschungsteam hat […] (00)
vor 4 Stunden
Review: Reolink Duo 3V PoE – statische Überwachung mit Dual-Kamera
Die Reolink Duo 3V PoE fällt schon beim ersten Blick aus dem Rahmen klassischer Überwachungskameras. Sie verzichtet auf ein einzelnes Objektiv und setzt stattdessen auf ein Dual-Lens-System, das zwei separate Kameras zu einem 180°-Panoramabild kombiniert. Das ist keine Spielerei: Die Kamera zielt darauf ab, maximale Flächen mit minimaler Hardware […] (00)
vor 1 Stunde
Super Mario Galaxy-Film sprengt Kino-Rekorde – Milliarden-Erfolg zeichnet sich ab
Was gerade im Kino passiert, fühlt sich fast unwirklich an. Der neue Super Mario-Film startet und bricht direkt Rekorde. Innerhalb weniger Tage katapultiert sich der Animations-Hit an die Spitze der weltweiten Kinocharts und zeigt einmal mehr, wie stark diese Marke wirklich ist. Mit einem globalen Einspielergebnis von rund 345 Millionen Euro (372,5 […] (00)
vor 24 Stunden
Prime Video zeigt Doku «Jerry West: The Logo» im April
Der Streamingdienst widmet der Basketball-Legende eine persönliche und schonungslose Dokumentation. Prime Video hat den Trailer zur Dokumentation Jerry West: The Logo veröffentlicht. Der abendfüllende Film feiert am 16. April seine Premiere und wird weltweit in mehr als 240 Ländern und Territorien verfügbar sein. Regie führt Kenya Barris, der mit «Jerry West: The Logo» sein Dokumentarfilmdebüt […] (00)
vor 9 Stunden
Daniel Altmaier
Monte-Carlo (dpa) - Tennisprofi Daniel Altmaier hat sein Auftaktmatch beim Masters-1000-Turnier in Monte-Carlo verloren. Der Deutsche unterlag dem Tschechen Tomas Machac in einer umkämpften Partie mit 4: 6, 6: 1, 3: 6. Nach verlorenem ersten Satz zeigte sich Altmaier stark verbessert. Nach einem schnellen Break zum 3: 1 wehrte er in einem umkämpften […] (00)
vor 3 Stunden
Trumps 1,5-Billionen-Beben: Der totale Vernichtungsschlag gegen den Sozialstaat
Der fiskalische Urknall kam ohne Vorwarnung, aber mit der Präzision einer lasergesteuerten Rakete. Donald Trump hat dem Kongress ein Budget-Diktat vorgelegt, das die Koordinaten der Weltmacht USA verschieben soll. 1,5 Billionen Dollar – eine Zahl mit zwölf Nullen –, die allein in die nationale Verteidigung fließen sollen. Es ist die größte […] (00)
vor 1 Stunde
 
Epstein-Barr-Virus (EBV): Der weit verbreitete „Kussvirus“, der oft unterschätzt wird
Höchst i. Odw., 06.04.2026 (lifePR) - Das Epstein-Barr-Virus (EBV) ist eines der am […] (00)
Erster Tierarztbesuch: So bleibt dein Welpe oder Kitten entspannt und stressfrei
Mörfelden-Walldorf, 06.04.2026 (lifePR) - Der Welpe ist da; das Kitten ist […] (00)
Moderne Immobilienvermarktung im Saarland!
Püttlingen, 06.04.2026 (lifePR) - Der Immobilienverkauf verlangt heute weit mehr als […] (00)
Fans mit Pyrotechnik (Archiv)
Düsseldorf - Der nordrhein-westfälische Innenminister Herbert Reul (CDU) hat auf die […] (02)
Harry Kane
München (dpa) - Auf dieses Signal hatte der FC Bayern vor dem Abflug nach Madrid gehofft. […] (03)
Ghost Master: Resurrection im Test: Spuken wie früher?
Ghost Master: Resurrection ist ein Remake des Originals aus 2003. Ich habe als Kind […] (00)
Dan Levy
(BANG) - Dan Levy hatte vor dem Tod von Catherine O’Hara über eine Fortsetzung von […] (00)
Südkoreas strategische Reaktion auf die Rohölkrise In einer Zeit, in der die […] (00)
 
 
Suchbegriff