Cet exemple réel, utilisé dans le domaine juridique, explique l'apport d'un moteur de recherche sémantique venant en complément d'un système de GED (base documentaire) classique.
La GED propose classiquement des fonctions d'archivage et de recherche plein texte, dite syntaxique. Le complément, développé par PIKKO, s'intègre à cet existant, et fournit des fonctionnalités améliorées de recherche et de navigation dans l'information.
Le moteur de recherche sémantique PIKKO exploite pour ce faire une base lexicale (à savoir un vocabulaire ou "ontologie" du domaine : i.e. l'ensemble de la terminologie du domaine voire aussi les relations entre les différents concepts : synonymies p.ex.), véritable clé de voûte sémantique du système.
La précision apportée via l'ontologie par la connaissance du domaine permet
de naviguer dans le système de GED par catégories ou classes de documents (dossiers juridiques dans notre cas)
de fournir une aide à la recherche en cas de réponses négatives, ou une aide à préciser la recherche en cas d'excès de réponses
Description
La technologie PIKKO s'articule suivant l'architecture suivante:
un moteur d'indexation. Il explore les documents du système documentaire et les indexe automatiquement dans sa propre base de données. L'indexation s'effectue surtout en fonction des mots-clés que ces documents renferment.
En même temps, des données supplémentaires (appelées métadonnées) sont ajoutées dans la base : elles pourront concerner la date, l'auteur du document, la catégorie dans laquelle le document rentre.
La notion de catégorie est spécifique à l'activité de l'organisation cible: elle doit être élaborée avec un expert du domaine, et cette élaboration rejoint celle de l'ontologie.
un moteur de recherche proprement dit. Il s'agit du programme qui cherche dans la base de données spécialisée les documents ou dossiers qui correspondent aux mots-clés soumis par l'utilisateur et qui les classe dans l'ordre qui lui semble le plus pertinent (score de pertinence, qui dépend entre autres de la fréquence d'occurrence des mots-clés, et d'autres mesures à définir).
Des composants de cartographie de l'information :
ils offrent une vision synthétique des regroupements de documents ou de dossiers, et permettent la navigation suivant des hiérarchies définies par l'utilisateur. Ils vont en complément du système de recherche classique, par mots-clés.