Question :
Comment fonctionne le traitement Fulltext ?
Réponse :
Après avoir stocké un document dans une armoire avec le support Fulltext activé, l'indexation Fulltext de ce document commence immédiatement.
Les tâches d'OCR et d'indexation Fulltext sont générées dans le tableau dwsystem.dbo.DWTASKS avec les TASK_TYPEs 0 et 2 respectivement, et sont ensuite traitées par le Background Process Service.
Le serveur Fulltext lui-même n'est responsable que de la recherche plein texte et n'effectue pas d'indexation plein texte.
Il doit cependant être en cours d'exécution pour recevoir des données en texte intégral pendant l'indexation en texte intégral.
Aperçu des TASK_TYPEs en texte intégral dans la table dwsystem.dbo.DWTASKS :
TASK_TYPE 0 : OCR
TASK_TYPE 1 : Intelligent Indexing textshot creation
TASK_TYPE 2 : L'index Fulltext est mis à jour dans la base de données et exporté vers le noyau du SOLR afin que le serveur Fulltext y ait accès
TASK_TYPE 3 : Nettoyage du SOLR après la suppression d'un document
TASK_TYPE 4 : Tâche de mise à niveau à partir d'une ancienne version de DocuWare (n'est plus utilisée depuis DocuWare 7 ; supprimez cette tâche manuellement si vous la rencontrez)
TASK_TYPE 5 : Tâche de réinitialisation du texte intégral (vérifiez la colonne des paramètres pour connaître l'état actuel ; les documents sont traités du plus grand au plus petit dwdocid)
Les données de texte intégral sont écrites dans les tables _PAG et _PGT d'une armoire.
Ces données peuvent être supprimées en toute sécurité si nécessaire, à condition que vous les supprimiez des tables _PGT et _PAG.
Vous devrez procéder à une réinitialisation du texte intégral si vous souhaitez générer à nouveau vos données d'indexation en texte intégral par la suite.
Contrairement à DocuWare 6, la table _SEC ne contient PAS de données en texte intégral !Ne supprimez JAMAIS les lignes des documents existants dans la table _SEC !
Lorsqu'un document est entièrement indexé du côté de la base de données, l'index Fulltext est transféré au noyau SOLR.
Ces noyaux se trouvent dans l'emplacement de stockage de l'index Fulltext défini dans votre connexion Fulltext (configurée dans l'outil d'administration -> connexions de données).
Les noyaux sont nommés d'après le GUID d'une armoire de fichiers. Ce GUID peut être vérifié dans la partie configuration de l'armoire de fichiers de la configuration web sous général -> plus d'options.
Aperçu des valeurs STATUS dans la table _PGT :
0 = Nouveau
1 = Chanson de texte créée avec succès
2 = Erreur lors de la création de la chanson de texte
3 = Chanson de texte transférée avec succès au SOLR
4 = Erreur lors du transfert au SOLR
Ce n'est que lorsque les données de texte intégral d'un document ont été entièrement transférées au SOLR que vous pourrez trouver le document par le biais de la recherche plein texte.
Voir aussi :
Fulltext et SOLR : KBA-35311
Check Fulltext textshot of a document : KBA-34944
Veuillez noter : Cet article est une traduction de l'anglais. Les informations contenues dans cet article sont basées sur la ou les versions originales des produits en langue anglaise. Il peut y avoir des erreurs mineures, notamment dans la grammaire utilisée dans la version traduite de nos articles. Bien que nous ne puissions pas garantir l'exactitude complète de la traduction, dans la plupart des cas, vous la trouverez suffisamment informative. En cas de doute, veuillez revenir à la version anglaise de cet article.
Vues :
Cet article est valable pour les versions DocuWare: 7 | fulltext #FAQID_3827
