Ansichten:

Verhalten:
Intelligent Indexing liest nicht alle Bereiche des Dokumentes aus, weshalb manche Indexbegriffe manuell eingetragen werden müssen.

Lösung:
Damit Intelligent Indexing alle konfigurierten Indexbegriffe erkennen und die Indexfelder damit befüllen kann, müssen die relevanten Bereiche auf dem Dokument maschinell auslesbar sein und über eine ausreichende Qualität verfügen.

Sind bestimmte Bereiche eines Dokumentes von Intelligent Indexing nicht auslesbar, liegt für diese Bereiche kein text shot im Originaldokument (PDF) vor.
Um diese Bereiche für Intelligent Indexing nutzbar zu machen, muss die OCR einen neuen text shot für das Dokument erzeugen, damit das komplette Dokument für den Volltext und somit auch für Intelligent Indexing verfügbar gemacht wird.

Bei Cloud Systemen kann dies über einen Import Job umgesetzt werden. Um die Erstellung eines neuen text shot während des Import-Jobs zu erzwingen, muss lediglich eine Datei angepasst werden.

Fügen Sie in der Datei "...\DocuWare\Desktop\DocuWare.DesktopService.exe.config", in die Sektion <appSettings> folgenden Key hinzu:
<add key="UseOcrForNativePdf" value="true"/>
Starten Sie anschließend den DocuWare Desktop Dienst neu

Bei On Premises Systemen kann die Erstellung eines neuen text shots generell, also zum Beispiel auch bei Drag-and-drop in den Briefkorb erzwungen werden
Dazu muss in der "DocuWare.Imaging.Worker.exe.config" Datei im Verzeichnis \DocuWare\Common\Imaging\ folgender Wert hinzufügt/geändert werden. 


Vorher:
    <TextExtractionMethods>
      <add fileType="Raster" method="Ocr"/>
    </TextExtractionMethods>

Nachher:
    <TextExtractionMethods> 
      <add fileType="Raster" method="Ocr"/>
 
     <add fileType="Pdf" method="ToOcr"/> 
    </TextExtractionMethods> 

Beide Änderungen haben zur Folge, dass die Verarbeitungszeit der Dokumente etwas zunimmt, da die OCR Zeit benötigt, um den neuen text shot zu erstellen.

Kommentare (0)