DIGI-XTRACT
Giải pháp trích xuất dữ liệu hoàn toàn tự động.
DIGI-XTRACT là giải pháp xử lý tài liệu và hồ sơ được xây dựng trên nền tảng công nghệ Học Máy, Học Sâu để thực hiện phân loại tài liệu, trích xuất dữ liệu và kiểm soát chất lượng áp dụng cho nhiều loại tài liệu khác nhau.
DIGI-XTRACT hỗ trợ nhiều loại tài liệu và có thể tùy chỉnh để tương ứng với yêu cầu và ngôn ngữ kinh doanh của khách hàng. Dịch vụ này có thể được lưu trữ từ xa và đảm bảo an toàn tại Trung tâm Dữ liệu của DIGI-TEXX hoặc hoàn toàn có thể triển khai ngay tại trụ sở của khách hàng với các công nghệ thuộc loại tiên tiến bậc nhất.
Các loại hồ sơ được hỗ trợ:
- Các tài liệu có cấu trúc: Đơn đăng ký, CMND/hộ chiếu, giấy khai sinh, sao kê ngân hàng, báo cáo tài chính, phiếu lương, hóa đơn, biên lai, hóa đơn thuế, hóa đơn, đơn đặt hàng, báo giá, phiếu giao hàng, v.v
- Các tài liệu bán cấu trúc: Bệnh sử bệnh nhân, biên bản kiểm tra hiện trường, hợp đồng lao động, báo cáo sự cố, giấy phép lao động, thư xác nhận, v.v
- Các tài liệu phi cấu trúc: Thư viết tay, ghi chú cá nhân, nhật ký cá nhân, nghiên cứu viết tay, tài liệu cổ viết tay, phiếu thi, danh mục, sổ đăng ký đất đai, bản vẽ xây dựng và kiến trúc, v.v.
CÁC TÁC VỤ CỦA DIGI-XTRACT
Các tác vụ sau có thể được sử dụng riêng lẻ mà không cần triển khai toàn bộ giải pháp.
TỰ ĐỘNG PHÂN LOẠI (AUTO CLASSIFY )
DIGI-XTRACT sẽ tự động nhận diện và phân loại những loại tài liệu khác nhau bằng tác vụ Auto Classify. Nó có thể phát hiện chính xác các loại tài liệu dựa trên vector hóa. Sau đó, hệ thống định tuyến tài liệu đến tác vụ Trích xuất tự động để trích xuất dữ liệu nhằm đạt được tỷ lệ chính xác được tối ưu hóa.
Tác vụ Phân loại Tự động sẽ phân loại chất lượng của hình ảnh đầu vào, sau đó DIGI-XTRACT sẽ định tuyến các hình ảnh đã phân loại đến đến tác vụ Cải Thiện Chất Lượng Hình Ảnh
TRÍCH XUẤT TỰ ĐỘNG (AUTO EXTRACT)
Trích xuất tự động bao gồm Xác định vùng trích xuất & Trích xuất văn bản.
Với các trường dữ liệu được xác định trước, tính năng nhận diện trường sẽ chọn trường dữ liệu chính xác từ hình ảnh và xử lý trích xuất một cách đầy đủ dựa trên hình ảnh được cắt.
Sau khi xác định vùng trích xuất, tùy thuộc vào loại trường của thông tin, một công cụ trích xuất dữ liệu tương ứng sẽ được sử dụng để trích xuất văn bản ra khỏi hình ảnh được cắt.
Với phương pháp này, thông tin đầy đủ về tài liệu của khách hàng sẽ không bị bên thứ ba nào nhìn thấy hoặc chia sẻ.
Auto Extract sẽ xác định điểm tin cậy cho từng trường dữ liệu. Sau đó, điểm số có thể dùng để xác định chất lượng trích xuất theo bộ quy tắc của bộ phận Auto QC.
KIỂM TRA CHẤT LƯỢNG TỰ ĐỘNG (AUTO QC)
Kiểm tra chất lượng tự động (Auto QC) sẽ tiến hành kiểm soát chất lượng của bản trích xuất dựa trên sự kết hợp của những tiêu chí chấm điểm phức tạp:
- Các quy tắc phổ biến, chẳng hạn như các biểu mẫu Số IBAN, Thẻ CCCD, Mã bưu chính, Tuổi, Giới tính, Ngày/Giờ, v.v.
- Quy tắc kinh doanh dựa trên tính chất của doanh nghiệp khách hàng
- Các mối quan hệ trường dữ liệu như [tuổi, giới tính, bệnh tật], [chức danh, tiền lương, công việc kinh doanh], [bệnh viện, điều trị, tuổi, giới tính], v.v.
- Phân tích chất lượng hình ảnh: rõ/không rõ, mờ, lệch, lật, méo, độ phân giải thấp
CÁC TÍNH NĂNG DIGI-XTRACT
Tự động trích xuất dữ liệu từ các biểu mẫu/tài liệu có cấu trúc/không cấu trúc/bán cấu trúc
Cải Thiện Chất Lượng Hình Ảnh trước khi xử lý
Tích hợp cổng API
Nói không với nhập dữ liệu thủ công
Dịch vụ giám sát web với chức năng báo cáo tự động và theo dõi thời gian thực
Hiệu suất và chất lượng cao
Các hệ thống xử lý tầng sau mang hiệu lực cao
QUY TRÌNH SẢN PHẨM
QUY TRÌNH XỬ LÝ TRỰC TIẾP (STP)/ QUY TRÌNH TỰ ĐỘNG HÓA
QUY TRÌNH ĐẢM BẢO/ QUY TRÌNH TỰ ĐỘNG HÓA VỚI TRẢI NGHIỆM THỰC TẾ
TỶ LỆ CHÍNH XÁC
Tỷ lệ chính xác của DIGI-XTRACT được tính dựa trên điểm tin cậy của dữ liệu, vốn là số điểm đo lường mức độ tin cậy của dữ liệu được trích xuất từ hình ảnh gốc. Tỷ lệ chính xác cao hơn, tùy thuộc vào chất lượng của tài liệu được đánh giá, mang lại chất lượng dữ liệu tốt hơn và hỗ trợ các mục đích phân tích.
To ensure top-notch quality for our clients, DIGI-XTRACT uses intelligent engines that automatically check and confirm the extracted data by comparing it with other databases or external sources. This leads to a great level of accuracy.
Tỷ lệ chính xác có thể được đo lường theo các đơn vị khác nhau như ký tự, từ, trường và dòng.
HỖ TRỢ KHÁCH HÀNG
DIGI-XTRACT được hỗ trợ và cung cấp bởi đội ngũ triển khai xuất sắc hợp tác với nhóm quản lý dịch vụ của chúng tôi.
Tất cả các dự án đều được Trung tâm điều hành mạng của chúng tôi giám sát 24/7, để có thể đảm bảo sự phục vụ tốt nhất.
DIGI-TEXX cung cấp trải nghiệm khách hàng toàn diện từ bước phân tích đầu tiên đến bước triển khai và nâng cao cuối cùng. Trên hết, đội ngũ quản lý dịch vụ sẽ đồng hành cùng khách hàng trong suốt giai đoạn vận hành để đảm bảo quá trình chuyển đổi suôn sẻ và giao hàng thành công.
LỢI ÍCH KHI SỬ DỤNG DỊCH VỤ
01
TỰ ĐỘNG HÓA DƯỚI SỰ GIÁM SÁT 24/7
Kết hợp giải pháp hoàn toàn tự động không có sự can thiệp của con người và một quy trình rõ ràng với Dịch vụ giám sát web, trạng thái dữ liệu ở từng bước một sẽ được cung cấp đầy đủ.
02
TÍCH HỢP DỄ DÀNG VÀ CÀI ĐẶT NHANH CHÓNG
Dựa trên yêu cầu của khách hàng, chúng tôi sẽ tuỳ chỉnh các phương thức truyền dữ liệu (Giao thức truyền tệp tin bảo mật – STP, API, Email) để phù hợp với hệ thống của khách hàng. Thời gian cài đặt (setup) từ 2-4 tuần.
03
ĐỊNH GIÁ LINH HOẠT
Chúng tôi cung cấp nhiều lựa chọn khác nhau cho phép khách hàng đáp ứng các phân khúc khác nhau và các yêu cầu cụ thể của họ. Mô hình định giá linh hoạt của chúng tôi bao gồm đăng ký, trả tiền theo mức sử dụng và gói.