図書館における史料デジタル化サービス

DIGI-TEXXのお客様は、ドイツで最も長い歴史を持つ伝統的な図書館のひとつです。

SERVICE OFFERS: デジタル化サービス

図書館における史料デジタル化サービス

ビジネス課題

お客様について

DIGI-TEXXのお客様は、ドイツで最も長い歴史を持つ伝統的な図書館のひとつです。 何世紀にもわたって、人類の文明の豊かさと文化の多様性を反映した印象的な書籍の数々を保存しています。 その上、お客様は14世紀からの貴重な写本や歴史的記録の保護でも有名です。

課題

お客様の書庫には600万冊以上の印刷物があり、学術雑誌、原稿、地図など、何世紀にもわたる学術の発展を反映した幅広いコレクションがあります。 これらの重要な文書は、管理を改善し、世界中の読者や研究者がアクセスしやすいプラットフォームを開くためにデジタル化する必要があります。

デジタル・トランスフォーメーションの旅において、お客様が解決すべき課題にはいくつかあります:

  • 大量の歴史的記録を効率的に処理し、デジタル化するための人材不足
  • 大量の手書き古代文字を正確に抽出する必要がある
  • 処理済みの文書をMARC21形式で出力できるサービスプロバイダーが限られている

対象範囲

文字、句読点、スペース、数字などを含む古代文字の認定と抽出します

文書の種類(印刷物と手書き):

  • マンションやビルの国勢調査情報(氏名、住所、職業、建物情報など)
  • 建築物やインフラに関する情報(従業員名、設立年、年齢、城情報など)
  • 調査情報
  • Fraktur(ラテンアルファベットの西洋書道スタイル)で書かれている文章

言語:古フランス語、古ドイツ語

ボリューム: 1プロジェクトで1000万字以上の古代文字

歴史的記録のデジタル化サービス

提供するサービス

  • 機械学習(ML)と深層学習(DL)技術をベースに構築された文書処理ソリューションというDIGI-XTRACTを適用したデータ処理ワークフローが文字および印刷された歴史的記録の分類、検出、抽出を行います。
  • 古代文字、特に古いドイツ語を検証する経験豊富な労働力

履歴データ処理ワークフロー

図表-デジタル化-ワークフロー 歴史的記録

DIGI-TEXXのシステムはスキャンされた文書を受け取る

DIGI-XTRACTを適用する:

  • 入力データの品質を分類する
  • 必須フィールドの検出 
  • データを抽出 

抽出された各文字の正確さを確認するための人間による検証

画像とメタデータを含む出力を抽出

お客様システムへデータを転送

ビジネス成果

  • 高い精度で古代文字を抽出: 98%
  • 240.000の古代文字を1日で処理
  • 歴史的文書のアーカイブと管理のための構造化データを取得
  • 一般ユーザーが史料を閲覧・研究できるよう、アクセス可能なデジタルプラットフォームを展開
歴史資料図書館 事業の成果

関連プロジェクト

Historical Obituary Data Collection With Web Scraping Solution

Online Historical Obituary Data Collection With Web Scraping Solution

A web scraping solution to automate collecting and processing historical obituary data across public digital newspaper archives and open-source sites.

Data Extraction Solution For Customer Onboarding v6

Data Extraction Solution for Customer Onboarding Straight-Through Process

We serve a leading international insurance and financial services company with over 1.5 million customers operating in Asia, Canada, and the United States.

あなたの課題を共有しましょう。