THÁCH THỨC TỪ DOANH NGHIỆP
Khách Hàng Của Chúng Tôi
Chúng tôi phục vụ cho một công ty dịch vụ tài chính và bảo hiểm quốc tế hàng đầu với hơn 1,5 triệu khách hàng đang hoạt động tại Châu Á, Canada và Hoa Kỳ. Tại thị trường Việt Nam, mạng lưới 80 văn phòng của họ cung cấp dịch vụ tư vấn tài chính, bảo hiểm, quản lý tài sản và quản lý tài sản cho cá nhân, nhóm và tổ chức.
Thách Thức:
Khả năng Nhận dạng Ký Tự Quang học (OCR) Còn Hạn Chế
Công cụ OCR hiện tại của khách hàng được thiết kế để chỉ trích xuất thông tin từ thẻ căn cước công dân. Tuy nhiên, quy trình onboarding hiện nay đã mở rộng để tiếp nhận nhiều loại giấy tờ tùy thân khác nhau (thẻ căn cước công dân, hộ chiếu, giấy khai sinh, thẻ căn cước quân đội,…). Điều này dẫn đến hạn chế về loại giấy tờ mà công cụ OCR có thể xử lý, do đó cần tăng thêm nhân lực để xác minh thủ công.
Mục tiêu dự án
- Giảm thiểu thời gian xử lý dữ liệu và tài liệu dưới 1 phút cho mỗi đơn.
- Tự động hóa quy trình phê duyệt toàn bộ trong khi vẫn đảm bảo độ chính xác dữ liệu ở mức cao nhất.
Phạm vi dự án
Xây dựng giải pháp tự động hóa toàn bộ quy trình cho khách hàng và đối tác bằng cách nâng cao khả năng trích xuất dữ liệu của công cụ nhận dạng ký tự quang học (OCR)
- Loại tài liệu:
- Giấy tờ tùy thân (Căn cước công dân, Hộ chiếu, Giấy khai sinh, Căn cước quân đội,..)
- Mẫu đơn đăng ký
- Ngôn ngữ: Tiếng Anh và Tiếng Việt
- Thời gian phục vụ: 24/7
- Tỷ lệ chính xác cam kết: 95%
GIẢI PHÁP
Giải Pháp Trích Xuất Dữ Liệu
Chất lượng dữ liệu đầu vào đóng vai trò quan trọng trong việc xác định chất lượng dữ liệu đầu ra. Chính vì vậy, DIGI-TEXX đã phát triển giải pháp trích xuất dữ liệu ba bước mà không cần kiểm tra thủ công.
Ở bước tiền xử lý, DIGI-TEXX ứng dụng công nghệ Nâng cao chất lượng ảnh để cải thiện hình ảnh và giúp công cụ OCR nhận dạng hiệu quả hơn trong các giai đoạn xử lý tiếp theo.
Công nghệ này hoạt động bằng cách xác định các chi tiết và đặc điểm quan trọng của hình ảnh, sau đó điều chỉnh chúng thông qua các kỹ thuật xử lý ảnh kỹ thuật số như:
- Loại bỏ nhiễu nền ảnh
- Điều chỉnh độ nghiêng và xoay
- Cắt các khu vực thừa
- Điều chỉnh độ sáng, độ sắc nét và các cài đặt màu khác
Các tài liệu được xử lý sẽ được đưa vào DIGI-XTRACT, một giải pháp xử lý tài liệu được phát triển bởi đội ngũ kỹ thuật của DIGI-TEXX.
DIGI-XTRACT được vận hành bởi công nghệ Học Máy (Machine Learning – ML) và Học Sâu (Deep Learning – DL). Nhờ đó, chất lượng trích xuất dữ liệu được nâng cao, hỗ trợ nhiều loại tài liệu hơn như giấy khai sinh, hộ chiếu, thẻ căn cước quân đội và sao kê ngân hàng.
Kiểm soát chất lượng tự động vận hành dựa trên mức độ tin cậy, một hệ thống tính điểm phức hợp kết hợp nhiều yếu tố để đảm bảo chất lượng đầu ra ở mức cao nhất:
- Quy tắc chung: Kiểm tra các yếu tố như định dạng thẻ căn cước công dân, mã bưu điện, độ tuổi, giới tính, ngày/giờ,..
- Quy tắc kinh doanh dựa trên tính chất của doanh nghiệp khách hàng
- Liên kết giữa các trường dữ liệu
- Phân tích chất lượng ảnh: Đánh giá chất lượng ảnh dựa trên các tiêu chí như rõ ràng/mờ, nhòe, nghiêng, đảo ngược, méo mó, độ phân giải thấp.
Nếu mức độ tin cậy của dữ liệu trích xuất thấp hơn ngưỡng đặt trước, thông báo sẽ được gửi đến khách hàng để thực hiện các bước xử lý tiếp theo.
KẾT QUẢ ĐẠT ĐƯỢC
- Giảm thiểu thời gian xử lý tài liệu từ 3 phút xuống chỉ còn 5 giây/ mỗi tài liệu.
- Tỷ Lệ Chính Xác: 60%đến97% (theo từng cấp độ trường)
- Nâng cao năng suất xử lý tài liệu của khách hàng từ95,000 trang/ tháng lên đến 3 triệu trang/ tháng
- Quy trình trích xuất dữ liệu tự động, không còn phụ thuộc vào con người để đảm bảo chất lượng đầu ra.