DIGI-XTRACT

Giải pháp trích xuất dữ liệu hoàn toàn tự động.

DIGI-XTRACT là giải pháp xử lý tài liệu và hồ sơ được xây dựng trên nền tảng công nghệ Học Máy, Học Sâu để thực hiện phân loại tài liệu, trích xuất dữ liệu và kiểm soát chất lượng áp dụng cho nhiều loại tài liệu khác nhau.

DIGI-XTRACT hỗ trợ nhiều loại tài liệu và có thể tùy chỉnh để tương ứng với yêu cầu và ngôn ngữ kinh doanh của khách hàng. Dịch vụ này có thể được lưu trữ từ xa và đảm bảo an toàn tại Trung tâm Dữ liệu của DIGI-TEXX hoặc hoàn toàn có thể triển khai ngay tại trụ sở của khách hàng với các công nghệ thuộc loại tiên tiến bậc nhất.

Các loại hồ sơ được hỗ trợ:

 • Các tài liệu có cấu trúc: Đơn đăng ký, CMND/hộ chiếu, giấy khai sinh, sao kê ngân hàng, báo cáo tài chính, phiếu lương, hóa đơn, biên lai, hóa đơn thuế, hóa đơn, đơn đặt hàng, báo giá, phiếu giao hàng, v.v
 • Các tài liệu bán cấu trúc: Bệnh sử bệnh nhân, biên bản kiểm tra hiện trường, hợp đồng lao động, báo cáo sự cố, giấy phép lao động, thư xác nhận, v.v
 • Các tài liệu phi cấu trúc: Thư viết tay, ghi chú cá nhân, nhật ký cá nhân, nghiên cứu viết tay, tài liệu cổ viết tay, phiếu thi, danh mục, sổ đăng ký đất đai, bản vẽ xây dựng và kiến trúc, v.v.

CÁC TÁC VỤ CỦA DIGI-XTRACT

Các tác vụ sau có thể được sử dụng riêng lẻ mà không cần triển khai toàn bộ giải pháp.

01 AUTOMATION DATA EXTRACTION

TỰ ĐỘNG PHÂN LOẠI (AUTO CLASSIFY )

DIGI-XTRACT sẽ tự động nhận diện và phân loại những loại tài liệu khác nhau bằng tác vụ Auto Classify. Nó có thể phát hiện chính xác các loại tài liệu dựa trên vector hóa. Sau đó, hệ thống định tuyến tài liệu đến tác vụ Trích xuất tự động để trích xuất dữ liệu nhằm đạt được tỷ lệ chính xác được tối ưu hóa.

Tác vụ Phân loại Tự động sẽ phân loại chất lượng của hình ảnh đầu vào, sau đó DIGI-XTRACT sẽ định tuyến các hình ảnh đã phân loại đến đến tác vụ Cải Thiện Chất Lượng Hình Ảnh

02 DATA PROCESSING VERIFICATION

TRÍCH XUẤT TỰ ĐỘNG (AUTO EXTRACT)

Trích xuất tự động bao gồm Xác định vùng trích xuất & Trích xuất văn bản.

Với các trường dữ liệu được xác định trước, thành phần Phát hiện trường sẽ chọn trường dữ liệu chính xác từ hình ảnh và xử lý trích xuất một cách an toàn dựa trên hình ảnh được cắt.

Sau khi Xác định vùng trích xuất, tùy thuộc vào loại trường của một phần thông tin, một công cụ trích xuất dữ liệu tương ứng sẽ được sử dụng để trích xuất văn bản ra khỏi hình ảnh được cắt.

Với phương pháp này, thông tin đầy đủ về tài liệu của khách hàng sẽ không bị bên thứ ba nào nhìn thấy hoặc chia sẻ.

Auto Extract sẽ xác định điểm tin cậy cho từng trường dữ liệu. Sau đó, điểm số có thể dùng để xác định chất lượng trích xuất theo bộ quy tắc của bộ phận Auto QC.

03 PRESCREENING CREDIT LOAN APPLICATION

KIỂM TRA CHẤT LƯỢNG TỰ ĐỘNG (AUTO QC)

Kiểm tra chất lượng tự động (Auto QC) sẽ tiến hành kiểm soát chất lượng của bản trích xuất dựa trên sự kết hợp của những tiêu chí chấm điểm phức tạp:

 • Các quy tắc phổ biến, chẳng hạn như các biểu mẫu Số IBAN, Thẻ CCCD, Mã bưu chính, Tuổi, Giới tính, Ngày/Giờ, v.v.
 • Quy tắc kinh doanh dựa trên tính chất của doanh nghiệp khách hàng
 • Các mối quan hệ trường dữ liệu như [tuổi, giới tính, bệnh tật], [chức danh, tiền lương, công việc kinh doanh], [bệnh viện, điều trị, tuổi, giới tính], v.v.
 • Phân tích chất lượng hình ảnh: rõ/không rõ, mờ, lệch, lật, méo, độ phân giải thấp

Với phương pháp kiểm soát chất lượng truyền thống, có những hệ phương pháp khác nhau cần đến sự tham gia của con người. Với Auto QC, quy trình được phân bổ thành các cấp độ dữ liệu và theo dõi nhờ siêu dữ liệu ở các bước khác nhau. AutoQC sẽ xem qua 100 phần trăm dữ liệu được xử lý và chỉ ra các lỗi tiềm ẩn của dữ liệu.

Với điểm số thu được, AutoQC có thể phát hiện lỗi tiềm ẩn và kiểm soát Tỉ lệ Đạt chuẩn (STR), để hệ thống có thể quyết định phê duyệt dữ liệu, hoặc chuyển dữ liệu sang bước hiệu chỉnh dữ liệu nhằm nâng cao chất lượng dữ liệu.

01 AUTOMATION DATA EXTRACTION

TỰ ĐỘNG PHÂN LOẠI (AUTO CLASSIFY )

DIGI-XTRACT sẽ tự động nhận diện và phân loại những loại tài liệu khác nhau bằng tác vụ Auto Classify. Nó có thể phát hiện chính xác các loại tài liệu dựa trên vector hóa. Sau đó, hệ thống định tuyến tài liệu đến tác vụ Trích xuất tự động để trích xuất dữ liệu nhằm đạt được tỷ lệ chính xác được tối ưu hóa.

Tác vụ Phân loại Tự động sẽ phân loại chất lượng của hình ảnh đầu vào, sau đó DIGI-XTRACT sẽ định tuyến các hình ảnh đã phân loại đến đến tác vụ Cải Thiện Chất Lượng Hình Ảnh

02 DATA PROCESSING VERIFICATION

TRÍCH XUẤT TỰ ĐỘNG (AUTO EXTRACT)

Trích xuất tự động bao gồm Xác định vùng trích xuất & Trích xuất văn bản.

Với các trường dữ liệu được xác định trước, thành phần Phát hiện trường sẽ chọn trường dữ liệu chính xác từ hình ảnh và xử lý trích xuất một cách an toàn dựa trên hình ảnh được cắt.

Sau khi Xác định vùng trích xuất, tùy thuộc vào loại trường của một phần thông tin, một công cụ trích xuất dữ liệu tương ứng sẽ được sử dụng để trích xuất văn bản ra khỏi hình ảnh được cắt.

Với phương pháp này, thông tin đầy đủ về tài liệu của khách hàng sẽ không bị bên thứ ba nào nhìn thấy hoặc chia sẻ.

Auto Extract sẽ xác định điểm tin cậy cho từng trường dữ liệu. Sau đó, điểm số có thể dùng để xác định chất lượng trích xuất theo bộ quy tắc của bộ phận Auto QC.

03 PRESCREENING CREDIT LOAN APPLICATION

KIỂM TRA CHẤT LƯỢNG TỰ ĐỘNG (AUTO QC)

Kiểm tra chất lượng tự động (Auto QC) sẽ tiến hành kiểm soát chất lượng của bản trích xuất dựa trên sự kết hợp của những tiêu chí chấm điểm phức tạp:

 • Các quy tắc phổ biến, chẳng hạn như các biểu mẫu Số IBAN, Thẻ CCCD, Mã bưu chính, Tuổi, Giới tính, Ngày/Giờ, v.v.
 • Quy tắc kinh doanh dựa trên tính chất của doanh nghiệp khách hàng
 • Các mối quan hệ trường dữ liệu như [tuổi, giới tính, bệnh tật], [chức danh, tiền lương, công việc kinh doanh], [bệnh viện, điều trị, tuổi, giới tính], v.v.
 • Phân tích chất lượng hình ảnh: rõ/không rõ, mờ, lệch, lật, méo, độ phân giải thấp

Với phương pháp kiểm soát chất lượng truyền thống, có những hệ phương pháp khác nhau cần đến sự tham gia của con người. Với Auto QC, quy trình được phân bổ thành các cấp độ dữ liệu và theo dõi nhờ siêu dữ liệu ở các bước khác nhau. AutoQC sẽ xem qua 100 phần trăm dữ liệu được xử lý và chỉ ra các lỗi tiềm ẩn của dữ liệu.

Với điểm số thu được, AutoQC có thể phát hiện lỗi tiềm ẩn và kiểm soát Tỉ lệ Đạt chuẩn (STR), để hệ thống có thể quyết định phê duyệt dữ liệu, hoặc chuyển dữ liệu sang bước hiệu chỉnh dữ liệu nhằm nâng cao chất lượng dữ liệu.

CÁC TÍNH NĂNG DIGI-XTRACT

Hinh01

Tự động trích xuất dữ liệu từ các biểu mẫu/tài liệu có cấu trúc/không cấu trúc/bán cấu trúc

Hinh03

Tích hợp cổng API

Nói không với nhập dữ liệu thủ công

Hinh04

Dịch vụ giám sát web với chức năng báo cáo tự động và theo dõi thời gian thực

Hinh05

Hiệu suất và chất lượng cao

Hinh06

Các hệ thống xử lý tầng sau mang hiệu lực cao

QUY TRÌNH SẢN PHẨM

QUY TRÌNH XỬ LÝ TRỰC TIẾP (STP)/ QUY TRÌNH TỰ ĐỘNG HÓA

Workfow Document 01

QUY TRÌNH ĐẢM BẢO/ QUY TRÌNH TỰ ĐỘNG HÓA VỚI TRẢI NGHIỆM THỰC TẾ

Workfow Document 02

TỶ LỆ CHÍNH XÁC

Tỷ lệ chính xác của DIGI-XTRACT được tính dựa trên điểm tin cậy của dữ liệu, vốn là số điểm đo lường mức độ tin cậy của dữ liệu được trích xuất từ ​​hình ảnh gốc. Tỷ lệ chính xác cao hơn, tùy thuộc vào chất lượng của tài liệu được đánh giá, mang lại chất lượng dữ liệu tốt hơn và hỗ trợ các mục đích phân tích.

To ensure top-notch quality for our clients, DIGI-XTRACT uses intelligent engines that automatically check and confirm the extracted data by comparing it with other databases or external sources. This leads to a great level of accuracy.

Tỷ lệ chính xác có thể được đo lường theo các đơn vị khác nhau như ký tự, từ, trường và dòng.

HỖ TRỢ KHÁCH HÀNG

DIGI-XTRACT được hỗ trợ và cung cấp bởi đội ngũ triển khai xuất sắc hợp tác với nhóm quản lý dịch vụ của chúng tôi.

Tất cả các dự án đều được Trung tâm điều hành mạng của chúng tôi giám sát 24/7, để có thể đảm bảo sự phục vụ tốt nhất.

DIGI-TEXX cung cấp trải nghiệm khách hàng toàn diện từ bước phân tích đầu tiên đến bước triển khai và nâng cao cuối cùng. Trên hết, đội ngũ quản lý dịch vụ sẽ đồng hành cùng khách hàng trong suốt giai đoạn vận hành để đảm bảo quá trình chuyển đổi suôn sẻ và giao hàng thành công.

LỢI ÍCH KHI SỬ DỤNG DỊCH VỤ

01

TỰ ĐỘNG HÓA DƯỚI SỰ GIÁM SÁT 24/7

Kết hợp giải pháp hoàn toàn tự động không có sự can thiệp của con người và một quy trình rõ ràng với Dịch vụ giám sát web, trạng thái dữ liệu ở từng bước một sẽ được cung cấp đầy đủ.

02

TÍCH HỢP DỄ DÀNG VÀ CÀI ĐẶT NHANH CHÓNG

Dựa trên yêu cầu của khách hàng, chúng tôi sẽ tuỳ chỉnh các phương thức truyền dữ liệu (Giao thức truyền tệp tin bảo mật – STP, API, Email) để phù hợp với hệ thống của khách hàng. Thời gian cài đặt (setup) từ 2-4 tuần.

03

ĐỊNH GIÁ LINH HOẠT

Chúng tôi cung cấp nhiều lựa chọn khác nhau cho phép khách hàng đáp ứng các phân khúc khác nhau và các yêu cầu cụ thể của họ. Mô hình định giá linh hoạt của chúng tôi bao gồm đăng ký, trả tiền theo mức sử dụng và gói.

DỰ ÁN TIÊU BIỂU

Data Extraction Solution For Customer Onboarding v6

Giải pháp Trích Xuất Dữ Liệu Tự Động Hỗ Trợ Quy Trình Onboarding Khách Hàng Trực Tuyến

Khách hàng của chúng tôi là công ty dịch vụ tài chính và bảo hiểm quốc tế hàng đầu với hơn 1,5 triệu khách hàng đang hoạt động tại Châu Á, Canada và Hoa Kỳ.
Xem thêm
INTELLIGENT DOCUMENT SCANNING 2

Giải pháp quét tài liệu thông minh

Giải pháp quét tài liệu thông minh được thiết kế cho phòng chăm sóc khách hàng tại các chi nhánh để xử lý tài liệu và phát hiện các loại tài liệu phù hợp,…
Xem thêm
c

Tự Động Hóa Quy Trình Tiếp Nhận Khách Hàng

Một giải pháp tự động giúp loại bỏ hoàn toàn cần các tác vụ thủ công nhằm thúc đẩy hiệu quả quy trình vận hành.
Xem thêm