ビジネス課題
お客様について
DIGI-TEXXのお客様は、ドイツで最も長い歴史を持つ伝統的な図書館のひとつです。 何世紀にもわたって、人類の文明の豊かさと文化の多様性を反映した印象的な書籍の数々を保存しています。 その上、お客様は14世紀からの貴重な写本や歴史的記録の保護でも有名です。
課題
お客様の書庫には600万冊以上の印刷物があり、学術雑誌、原稿、地図など、何世紀にもわたる学術の発展を反映した幅広いコレクションがあります。 これらの重要な文書は、管理を改善し、世界中の読者や研究者がアクセスしやすいプラットフォームを開くためにデジタル化する必要があります。
デジタル・トランスフォーメーションの旅において、お客様が解決すべき課題にはいくつかあります:
- 大量の歴史的記録を効率的に処理し、デジタル化するための人材不足
- 大量の手書き古代文字を正確に抽出する必要がある
- 処理済みの文書をMARC21形式で出力できるサービスプロバイダーが限られている
対象範囲
文字、句読点、スペース、数字などを含む古代文字の認定と抽出します
文書の種類(印刷物と手書き):
- マンションやビルの国勢調査情報(氏名、住所、職業、建物情報など)
- 建築物やインフラに関する情報(従業員名、設立年、年齢、城情報など)
- 調査情報
- Fraktur(ラテンアルファベットの西洋書道スタイル)で書かれている文章
言語:古フランス語、古ドイツ語
ボリューム: 1プロジェクトで1000万字以上の古代文字
歴史的記録のデジタル化サービス
提供するサービス
- 機械学習(ML)と深層学習(DL)技術をベースに構築された文書処理ソリューションというDIGI-XTRACTを適用したデータ処理ワークフローが文字および印刷された歴史的記録の分類、検出、抽出を行います。
- 古代文字、特に古いドイツ語を検証する経験豊富な労働力
履歴データ処理ワークフロー
DIGI-TEXXのシステムはスキャンされた文書を受け取る
DIGI-XTRACTを適用する:
抽出された各文字の正確さを確認するための人間による検証
画像とメタデータを含む出力を抽出
お客様システムへデータを転送
ビジネス成果
- 高い精度で古代文字を抽出: 98%
- 240.000の古代文字を1日で処理
- 歴史的文書のアーカイブと管理のための構造化データを取得
- 一般ユーザーが史料を閲覧・研究できるよう、アクセス可能なデジタルプラットフォームを展開