ビュー:

動作:
Intelligent Indexingは文書のすべての領域を認識しないので、いくつかの索引語を手動で入力しなければならない。

解決方法
設定されたすべてのインデックス用語をIntelligent Indexingが認識し、インデックスフィールドをその用語で埋めるためには、文書上の関連領域が機械可読で十分な品質を持っていなければなりません。
文書の特定の領域がIntelligent Indexingで読み取れない場合、元の文書(PDF)にはその領域のテキストショットがありません。
これらの領域をIntelligent Indexingで使用できるようにするには、OCRがその文書の新しいテキストショットを生成し、完全な文書をフルテキストとIntelligent Indexingで使用できるようにする必要があります。

クラウドシステムでは、これはインポートジョブを介して実装することができます。インポートジョブ中に新しいテキストショットを強制的に作成するには、1つのファイルだけを適合させる必要があります。

ファイル「...﹑DocuWareDesktop﹑DocuWare.DesktopService.exe.config」で、<appSettings>セクションに次のキーを追加します。
<add key="UseOcrForNativePdf" value="true"/>。
その後、DocuWare Desktop Serviceを再起動します。

オンプレミスシステムでは、メールボックスにドラッグ&ドロップした場合など、一般的に新しいテキストショットを強制的に作成することができます。
。これを行うには、∕DocuWareCommonImaging∕ディレクトリーにある "DocuWare.Imaging.Worker.exe.config "ファイルに以下の値を追加/変更します。

以前:
<TextExtractionMethods>.
<add fileType="Raster" method="Ocr"/>
</TextExtractionMethods>.

後に
<TextExtractionMethods>
<add fileType="Raster" method="Ocr"/>

<add fileType="Pdf" method="ToOcr"/>
</TextExtractionMethods>

どちらの変更も、OCRが新しいテキストショットを作成する時間が必要なため、ドキュメントの処理時間が若干長くなるという効果があります。

 

ご注意:この記事は英語からの翻訳です。この記事に含まれる情報は、オリジナルの英語版製品に基づくものです。翻訳版の記事で使用されている文法などには、細かい誤りがある場合があります。翻訳の正確さを完全に保証することは出来かねますが、ほとんどの場合、十分な情報が得られると思われます。万が一、疑問が生じた場合は、英語版の記事に切り替えてご覧ください。