コージェントラボは2021年10月26日、ドキュメントの処理を自動化するサービス「SmartRead」を発表しました。AIを使ってドキュメントを分類します。2021年12月より提供を開始します。
ペーパーレス化が加速し、社内にドキュメントが蓄積することによる管理負荷増大が懸念されています。こうした課題を抱える企業の利用を想定するのが「SmartRead」です。これは、AIを利用してさまざまなドキュメントから情報の抽出とデータ化を自動実施するもの。同社が2017年8月より提供するAI OCRサービス「Tegaki」の機能を包含し、情報抽出・確認修正、管理などの機能を強化しています。
via www.cogent.co.jp
主な特徴は次の3つです。
・独自開発のAIによる高い文字認識・文書仕分け精度
「Tegaki」に搭載する文字認識エンジンを踏襲します。JIS非漢字を新たにサポートするなど、文字認識対象を増やしています。文書仕分け機能も装備し、ドキュメントのレイアウトの微妙な違いを識別することも可能です。 ・さまざまななタイプのドキュメントから情報抽出を実現
従来の定型文書に加え、OCRを使って新たにドキュメント中の全ての文字を読み取るようにしました。ドキュメントから検索可能なPDFを出力する機能も備えます。活手書き文字も高精度に認識するため、各種メモや図面などに追記した手書きメモも検索可能です。 ・使い勝手の良いユーザインターフェイス、管理機能の強化
「タスク」と呼ぶ機能を追加しました。業務ごとにドキュメントの仕分けからOCR、出力までの一連の流れをワークフロー(タスク)として設定し、実行できます。そのほか、部署単位でドキュメントの利用を制限するグループ・管理権限機能、RPAなどの他アプリケーションと連携するAPIを用意します。 同社は今後、文書レイアウトが異なるが抽出したい項目が同じとなる準定型文書や、複雑な表構造を持つ文書からの情報抽出機能を強化する予定です。短期的には、特定の準定型文書への対応を開始するとともに、次の段階では、顧客が抽出したい項目・情報を簡単に指定できる機能や、ドキュメント処理を自動化するのに必要な機能も順次強化する考えです。オンプレミス版の提供も予定します。
・独自開発のAIによる高い文字認識・文書仕分け精度
「Tegaki」に搭載する文字認識エンジンを踏襲します。JIS非漢字を新たにサポートするなど、文字認識対象を増やしています。文書仕分け機能も装備し、ドキュメントのレイアウトの微妙な違いを識別することも可能です。 ・さまざまななタイプのドキュメントから情報抽出を実現
従来の定型文書に加え、OCRを使って新たにドキュメント中の全ての文字を読み取るようにしました。ドキュメントから検索可能なPDFを出力する機能も備えます。活手書き文字も高精度に認識するため、各種メモや図面などに追記した手書きメモも検索可能です。 ・使い勝手の良いユーザインターフェイス、管理機能の強化
「タスク」と呼ぶ機能を追加しました。業務ごとにドキュメントの仕分けからOCR、出力までの一連の流れをワークフロー(タスク)として設定し、実行できます。そのほか、部署単位でドキュメントの利用を制限するグループ・管理権限機能、RPAなどの他アプリケーションと連携するAPIを用意します。 同社は今後、文書レイアウトが異なるが抽出したい項目が同じとなる準定型文書や、複雑な表構造を持つ文書からの情報抽出機能を強化する予定です。短期的には、特定の準定型文書への対応を開始するとともに、次の段階では、顧客が抽出したい項目・情報を簡単に指定できる機能や、ドキュメント処理を自動化するのに必要な機能も順次強化する考えです。オンプレミス版の提供も予定します。