Comportement :
Intelligent Indexing ne reconnaît pas toutes les zones du document, de sorte que certains termes d'indexation doivent être saisis manuellement.
Solution :
Pour que l'indexation intelligente reconnaisse tous les termes d'indexation configurés et remplisse les champs d'indexation avec ceux-ci, les zones concernées du document doivent être lisibles par la machine et avoir une qualité suffisante.
Si certaines zones d'un document ne peuvent pas être lues par l'indexation intelligente, il n'y a pas de prise de texte pour ces zones dans le document original (PDF).
Afin de rendre ces zones utilisables pour l'indexation intelligente, l'OCR doit générer une nouvelle prise de texte pour le document, de sorte que le document complet soit mis à disposition pour le texte intégral et pour l'Intelligent Indexing.
Dans les systèmes en nuage, cela peut être mis en œuvre par le biais d'un travail d'importation. Pour forcer la création d'un nouveau plan de texte pendant la tâche d'importation, un seul fichier doit être adapté.
Dans le fichier "...\DocuWare\Desktop\DocuWare.DesktopService.exe.config", ajoutez la clé suivante à la section <appSettings> :
<add key="UseOcrForNativePdf" value="true"/>.
Redémarrez ensuite le DocuWare Desktop Service.
Pour les systèmes Sur site, vous pouvez forcer la création d'un nouveau texte en général, par exemple lors d'un glisser-déposer dans la boîte aux lettres.
Pour ce faire, ajoutez/modifiez la valeur suivante dans le fichier "DocuWare.Imaging.Worker.exe.config" dans le répertoire \DocuWare\Common\Imaging\.
Auparavant :
<TextExtractionMethods>.
<add fileType="Raster" method="Ocr"/>
</TextExtractionMethods>.
Après :
<TextExtractionMethods>
<add fileType="Raster" method="Ocr"/>
<add fileType="Pdf" method="ToOcr"/>
</TextExtractionMethods>
Ces deux modifications ont pour effet d'augmenter légèrement le temps de traitement des documents, car l'OCR a besoin de temps pour créer le nouveau plan de texte.
