DIGI-XTRACT

Giải pháp trích xuất dữ liệu hoàn toàn tự động.

DIGI-XTRACT là giải pháp Nhận dạng Ký tự Quang học (OCR) có thể thực hiện việc phân loại tài liệu, trích xuất dữ liệu và kiểm soát chất lượng đối với nhiều loại tài liệu khác nhau.

Xử lý các loại tài liệu như: Hóa đơn, đơn xin việc, tài liệu lịch sử, các tờ đơn viết tay, v.v.

Ngoài ra, DIGI-XTRACT còn hỗ trợ nhiều loại tài liệu khác và có thể tùy chỉnh để hỗ trợ cả những loại tài liệu đặc biệt hơn, tương ứng với ngôn ngữ kinh doanh của khách hàng. Dịch vụ này có thể được lưu trữ từ xa và đảm bảo an toàn tại Trung tâm Dữ liệu của DIGI-TEXX hoặc hoàn toàn có thể triển khai ngay tại trụ sở của khách hàng với các công nghệ thuộc loại tiên tiến bậc nhất.

CÁC TÁC VỤ CỦA DIGI-XTRACT

TỰ ĐỘNG PHÂN LOẠI (AUTO CLASSIFY )

DIGI-XTRACT sẽ tự động nhận diện và phân loại những loại tài liệu khác nhau bằng tác vụ Auto Classify. Khi thực hiện tác vụ này, hệ thống có thể phát hiện chính xác các loại tài liệu dựa trên việc vector hóa và các phân tích dữ liệu lớn. Sau đó, hệ thống sẽ định tuyến tài liệu đến bộ phận AutoExtract, để trích xuất dữ liệu nhằm đạt được tỷ lệ chính xác cao.

Các loại tài liệu/hồ sơ phổ biến được dùng bởi các cá nhân/tổ chức bao gồm:

 • Đơn Xin việc, Giấy chứng nhận (Giấy kết hôn, Giấy chứng tử,..)
 • Giấy tờ Nhận dạng: Căn cước công dân, Hộ chiếu, Giấy khai sinh
 • Hồ sơ Tuyển dụng: Hợp đồng lao động, Giấy phép lao động, Thư xác nhận
 • Hồ sơ Thu nhập: Sao kê ngân hàng, Phiếu lương
 • Hồ sơ Tài chính Kế toán: Hóa đơn, Hợp đồng, Báo cáo tài chính,..
 • Các loại tài liệu/hồ sơ khác: Phiếu kiểm kê, Sách catalog, Sổ đăng ký đất đai

TRÍCH XUẤT TỰ ĐỘNG (AUTO EXTRACT)

Với các trường dữ liệu được định trước, tác vụ AutoExtract sẽ chọn trường dữ liệu chính xác trên hình ảnh và xử lý quá trình trích xuất, đảm bảo an toàn dựa trên hình ảnh được cắt. Do vậy, toàn bộ thông tin trên tài liệu/hồ sơ của khách hàng sẽ được giữ kín, cũng như không được chia sẻ với bất kỳ một bên thứ ba nào.

Auto Extract sẽ xác định điểm tin cậy cho từng trường dữ liệu. Sau đó, điểm số có thể dùng để xác định chất lượng trích xuất theo bộ quy tắc của bộ phận Auto QC.

KIỂM TRA CHẤT LƯỢNG TỰ ĐỘNG (AUTO QC)

Kiểm tra chất lượng tự động (Auto QC) sẽ tiến hành kiểm soát chất lượng của bản trích xuất dựa trên sự kết hợp của những tiêu chí chấm điểm phức tạp:

 • Các quy tắc phổ biến, chẳng hạn như các biểu mẫu Số IBAN, Thẻ CCCD, Mã bưu chính, Tuổi, Giới tính, Ngày/Giờ, v.v.
 • Quy tắc kinh doanh dựa trên phạm vi kinh doanh của khách hàng
 • Các mối liên kết trong trường dữ liệu, chẳng hạn {tuổi, giới tính, bệnh}, {chức vụ, lương, công ty}, {bệnh viện, điều trị, tuổi, giới tính}, v.v.
 • Phân tích chất lượng hình ảnh: rõ/không rõ, mờ, lệch, lật, méo, độ phân giải thấp

Với phương pháp kiểm soát chất lượng truyền thống, có những hệ phương pháp khác nhau cần đến sự tham gia của con người. Với Auto QC, quy trình được phân bổ thành các cấp độ dữ liệu và theo dõi nhờ siêu dữ liệu ở các bước khác nhau. AutoQC sẽ xem qua 100 phần trăm dữ liệu được xử lý và chỉ ra các lỗi tiềm ẩn của dữ liệu.

Với điểm số thu được, AutoQC có thể phát hiện lỗi tiềm ẩn và kiểm soát Tỉ lệ Đạt chuẩn (STR), để hệ thống có thể quyết định phê duyệt dữ liệu, hoặc chuyển dữ liệu sang bước hiệu chỉnh dữ liệu nhằm nâng cao chất lượng dữ liệu.

TỰ ĐỘNG PHÂN LOẠI (AUTO CLASSIFY )

DIGI-XTRACT sẽ tự động nhận diện và phân loại những loại tài liệu khác nhau bằng tác vụ Auto Classify. Khi thực hiện tác vụ này, hệ thống có thể phát hiện chính xác các loại tài liệu dựa trên việc vector hóa và các phân tích dữ liệu lớn. Sau đó, hệ thống sẽ định tuyến tài liệu đến bộ phận AutoExtract, để trích xuất dữ liệu nhằm đạt được tỷ lệ chính xác cao.

Các loại tài liệu/hồ sơ phổ biến được dùng bởi các cá nhân/tổ chức bao gồm:

 • Đơn Xin việc, Giấy chứng nhận (Giấy kết hôn, Giấy chứng tử,..)
 • Giấy tờ Nhận dạng: Căn cước công dân, Hộ chiếu, Giấy khai sinh
 • Hồ sơ Tuyển dụng: Hợp đồng lao động, Giấy phép lao động, Thư xác nhận
 • Hồ sơ Thu nhập: Sao kê ngân hàng, Phiếu lương
 • Hồ sơ Tài chính Kế toán: Hóa đơn, Hợp đồng, Báo cáo tài chính,..
 • Các loại tài liệu/hồ sơ khác: Phiếu kiểm kê, Sách catalog, Sổ đăng ký đất đai

TRÍCH XUẤT TỰ ĐỘNG (AUTO EXTRACT)

Với các trường dữ liệu được định trước, tác vụ AutoExtract sẽ chọn trường dữ liệu chính xác trên hình ảnh và xử lý quá trình trích xuất, đảm bảo an toàn dựa trên hình ảnh được cắt. Do vậy, toàn bộ thông tin trên tài liệu/hồ sơ của khách hàng sẽ được giữ kín, cũng như không được chia sẻ với bất kỳ một bên thứ ba nào.

Auto Extract sẽ xác định điểm tin cậy cho từng trường dữ liệu. Sau đó, điểm số có thể dùng để xác định chất lượng trích xuất theo bộ quy tắc của bộ phận Auto QC.

KIỂM TRA CHẤT LƯỢNG TỰ ĐỘNG (AUTO QC)

Kiểm tra chất lượng tự động (Auto QC) sẽ tiến hành kiểm soát chất lượng của bản trích xuất dựa trên sự kết hợp của những tiêu chí chấm điểm phức tạp:

 • Các quy tắc phổ biến, chẳng hạn như các biểu mẫu Số IBAN, Thẻ CCCD, Mã bưu chính, Tuổi, Giới tính, Ngày/Giờ, v.v.
 • Quy tắc kinh doanh dựa trên phạm vi kinh doanh của khách hàng
 • Các mối liên kết trong trường dữ liệu, chẳng hạn {tuổi, giới tính, bệnh}, {chức vụ, lương, công ty}, {bệnh viện, điều trị, tuổi, giới tính}, v.v.
 • Phân tích chất lượng hình ảnh: rõ/không rõ, mờ, lệch, lật, méo, độ phân giải thấp

Với phương pháp kiểm soát chất lượng truyền thống, có những hệ phương pháp khác nhau cần đến sự tham gia của con người. Với Auto QC, quy trình được phân bổ thành các cấp độ dữ liệu và theo dõi nhờ siêu dữ liệu ở các bước khác nhau. AutoQC sẽ xem qua 100 phần trăm dữ liệu được xử lý và chỉ ra các lỗi tiềm ẩn của dữ liệu.

Với điểm số thu được, AutoQC có thể phát hiện lỗi tiềm ẩn và kiểm soát Tỉ lệ Đạt chuẩn (STR), để hệ thống có thể quyết định phê duyệt dữ liệu, hoặc chuyển dữ liệu sang bước hiệu chỉnh dữ liệu nhằm nâng cao chất lượng dữ liệu.

CÁC TÍNH NĂNG DIGI-XTRACT

Tự động trích xuất dữ liệu phi cấu trúc/bán cấu trúc

Nói không với nhập dữ liệu thủ công

Tích hợp cổng API

Dịch vụ giám sát web với chức năng báo cáo tự động và theo dõi thời gian thực

Hiệu suất và chất lượng cao

Các hệ thống xử lý tầng sau mang hiệu lực cao

QUY TRÌNH SẢN PHẨM

QUY TRÌNH XỬ LÝ TRỰC TIẾP (STP)/ QUY TRÌNH TỰ ĐỘNG HÓA

QUY TRÌNH ĐẢM BẢO/ QUY TRÌNH TỰ ĐỘNG HÓA VỚI TRẢI NGHIỆM THỰC TẾ

TỶ LỆ CHÍNH XÁC

Tỷ lệ chính xác của DIGI-XTRACT được tính dựa trên điểm tin cậy của dữ liệu, vốn là số điểm đo lường mức độ tin cậy của dữ liệu được trích xuất từ ​​hình ảnh gốc. Tỷ lệ chính xác cao hơn – phụ thuộc vào chất lượng của tài liệu đang được đánh giá – sẽ mang lại chất lượng dữ liệu tốt hơn, và giúp ích cho mục đích phân tích dữ liệu về sau.

Với DIGI-XTRACT, tỷ lệ chính xác được tính dựa trên các thuật toán thông minh nhằm đáp ứng được những mong đợi từ quý khách hàng.

Tỷ lệ chính xác có thể được đo lường theo các đơn vị khác nhau như ký tự, từ, trường và dòng.

HỖ TRỢ KHÁCH HÀNG

DIGI-XTRACT được triển khai và vận hành bởi đội ngũ lập trình chuyên nghiệp và có kinh nghiệm, ngoài ra, khách hàng sẽ còn nhận được sự hỗ trợ của đội ngũ trải nghiệm khách hàng.

Tất cả các dự án đều được Trung tâm điều hành mạng của chúng tôi giám sát 24/7, để có thể đảm bảo sự phục vụ tốt nhất.

DIGI-TEXX sẽ cung cấp cho khách hàng một trải nghiệm hoàn chỉnh, từ bước phân tích đầu tiên cho đến bước cuối cùng là thực hiện và nâng cao chất lượng. Ngoài ra, đội ngũ chăm sóc khách hàng sẽ đồng hành cùng khách hàng xuyên suốt thời gian vận hành dự án để đảm bảo suôn sẻ trong chuyển giao và thành công trong bàn giao.

ƯU ĐIỂM CỦA DIGI-XTRACT

01

TỰ ĐỘNG HÓA DƯỚI SỰ GIÁM SÁT 24/7

Kết hợp giải pháp hoàn toàn tự động không có sự can thiệp của con người và một quy trình rõ ràng với Dịch vụ giám sát web, trạng thái dữ liệu ở từng bước một sẽ được cung cấp đầy đủ.

02

TÍCH HỢP DỄ DÀNG VÀ CÀI ĐẶT NHANH CHÓNG

Dựa trên yêu cầu của khách hàng, chúng tôi sẽ tuỳ chỉnh các phương thức truyền dữ liệu (Giao thức truyền tệp tin bảo mật – STP, API, Email) để phù hợp với hệ thống của khách hàng. Thời gian cài đặt (setup) từ 2-4 tuần.

03

MỨC GIÁ LINH ĐỘNG

Chúng tôi cung cấp mô hình định giá hấp dẫn dựa trên giao dịch, gói đăng ký và khối lượng công việc cố định để đáp ứng mọi nhu cầu của khách hàng.

DỰ ÁN THÀNH CÔNG

Tự Động Hóa Quy Trình Tiếp Nhận Khách Hàng

Một giải pháp tự động giúp loại bỏ hoàn toàn cần các tác vụ thủ công nhằm thúc đẩy hiệu quả quy trình vận hành.
Xem thêm
Automated Insurance Claims Background

Automated Insurance Claims

Intelligent automation solution to reduce complex claims document processing time from days to minutes.
Xem thêm
Digital Inspection System Background

Digital Inspection System

Spend less time collecting data from paperwork and more time improving your inspection performance.
Xem thêm