Datenextraktionslösung für einen Straight-Through-Prozess im Kunden-Onboarding

SERVICE OFFERS:

Geschäftliche Herausforderungen

Unser Kunde

Wir betreuen ein führendes internationales Versicherungs- und Finanzdienstleistungsunternehmen mit über 1,5 Millionen Kunden in Asien, Kanada und den Vereinigten Staaten. Auf dem vietnamesischen Markt bietet das Unternehmen über ein Netzwerk von 80 Niederlassungen Finanzberatung, Versicherungen, Vermögensverwaltung und Asset-Management-Dienstleistungen für Privatpersonen, Gruppen und Institutionen an.

Herausforderungen des Projekts

Begrenzte Erfassungskapazität des OCR-Systems

Die derzeit eingesetzte OCR-Engine des Kunden ist auf die Erfassung von Personalausweisen ausgelegt, während der Onboarding-Prozess inzwischen für verschiedene Arten von Identitätsdokumenten geöffnet wurde, wie z. B. Reisepässe, Geburtsurkunden, militärische Ausweise usw. Dies führt zu Einschränkungen bei der automatisierten Dokumentenverarbeitung und macht einen erhöhten manuellen Prüfaufwand erforderlich.

Data Extraction Solution For Customer Onboarding v5

Projektziel

  • Verkürzung der Dokumenten- und Datenverarbeitungszeit auf unter eine Minute pro Dokument.
  • Ermöglichung eines durchgängigen, automatisierten Genehmigungsprozesses bei gleichzeitig höchster Datenqualität.

Projektumfang

Aufbau eines Straight-Through-Prozesses für das Kunden- und Agenten-Onboarding durch Erweiterung der Extraktionskapazität der OCR-Engine.

  • Dokumenttypen:
    • Identitätsdokumente (Personalausweise, Reisepässe, Geburtsurkunden, militärische Ausweise usw.)
    • Antragsformulare
  • Sprachen: Englisch und Vietnamesisch
  • Servicezeit: 24/7
  • Garantierte Genauigkeitsrate: 95 %

Lösung

Datenextraktionslösung

Da die Qualität der Eingangsdaten einen entscheidenden Einfluss auf die Ausgabequalität hat, hat DIGI-TEXX einen dreistufigen Datenextraktionsprozess entwickelt, der keine manuelle Verifizierung erfordert.

Data Extraction Solution For Customer Onboarding V3

DIGI-TEXX setzt in der Vorverarbeitung eine Bildqualitätsverbesserung ein, um Dokumentenbilder für die nachfolgenden OCR-Verarbeitungsschritte zu optimieren.

Diese Technologie identifiziert die wichtigsten Merkmale und Details der Bilder und passt sie anschließend mithilfe digitaler Bildverarbeitungstechniken an, wie zum Beispiel:

  • Entfernung von Bildhintergrundrauschen
  • Korrektur von Schieflage und Rotation
  • Zuschneiden überflüssiger Bildbereiche
  • Anpassung von Helligkeit, Schärfe und weiteren Farbeinstellungen
Hintergrundinformationen zur Datenextraktion im Bankwesen

Die vorverarbeiteten Dokumente werden von DIGI-XTRACT verarbeitet, einem Dokumentenverarbeitungsservice, der vom Softwareentwicklungsteam von DIGI-TEXX entwickelt wurde.

DIGI-XTRACT nutzt Machine-Learning (ML)- und Deep-Learning (DL)-Technologien, um die Datenextraktionsqualität für eine Vielzahl von Dokumenten wie Geburtsurkunden, Reisepässe, militärische Ausweise und Kontoauszüge zu verbessern.

Data Extraction Solution For Customer Onboarding V2

Auto QC führt die Qualitätskontrolle auf Basis eines Konfidenzniveaus durch und nutzt ein komplexes Bewertungssystem zur Sicherstellung höchster Ausgabequalität:

  • Allgemeine Regeln wie Ausweisformate, Postleitzahlen, Alter, Geschlecht sowie Datums- und Zeitformate
  • Geschäftsregeln basierend auf dem Geschäftsbereich des Kunden
  • Beziehungen zwischen Datenfeldern
  • Analyse der Bildqualität: klar/unklar, unscharf, schief, gespiegelt, verzerrt, niedrige Auflösung

Liegt das Konfidenzniveau der extrahierten Daten unter dem vordefinierten Schwellenwert, wird der Kunde für weitere Maßnahmen benachrichtigt.

Geschäftsergebnisse

  • Die Bearbeitungszeit pro Dokument wurde von 3 Minuten auf 5 Sekunden pro Dokument verkürzt
  • Genauigkeitsrate: von 60 % auf 97 % (auf Feldebene)
  • Steigerung der Dokumentenverarbeitungskapazität von 95.000 Seiten pro Monat auf 3 Millionen Seiten pro Monat
  • Die Qualität der Datenausgabe ist nicht mehr von menschlichen Eingriffen abhängig.
Data Extraction Solution For Customer Onboarding

RELATED CASE STUDIES

Data Generation on Multiple Platforms to Build User Behavior Datasets for AI Agent Training 9

Data Generation on Multiple Platforms to Build User Behavior Datasets for AI Agent Training

DIGI-TEXX provided a large-scale data generation on multiple platforms that simulated real user interactions across online and enterprise systems

DATA ANNOTATION FOR BIM MODELING 2025 Thumbnail

Data Annotation for BIM System to Enhance Spatial Digital Twin Accuracy

DIGI-TEXX provided data annotation for BIM system to improve the alignment between captured building imagery and architectural floor plans, enhancing the...

Automated Data Extraction Solution to Streamline and Enhance Accuracy in School Exam Scoring - Case study

Automated Data Extraction Solution to Streamline and Enhance Accuracy in School Exam Scoring

DIGI-TEXX offers Automated Data Extraction Solution with Multi-Layered QC for universities...

SHARE YOUR CHALLENGES