J'ai
un collègue fort prolifique en liens, aujourd'hui. Il vient de me signaler ce
panorama des outils de recherche. Voilà leur présentation :
Ce panorama fait le point sur les solutions de recherche les plus utilisées en France qu'elles ciblent des problématiques intranet, telles que la gestion documentaire, ou des enjeux extranet ou Internet. Il classe ces technologies en cinq catégories.
> Les moteurs de recherche sémantiques
Les moteurs dits sémantiques tentent d'intégrer le sens du langage au processus de recherche. A cette fin, ils s'appuient sur des dictionnaires, voire des thésaurus spécialisés pour le traitement de thématiques particulières.
> Les moteurs de recherche statistiques
En s'adossant sur des méthodes statistiques, ce type de moteur répond à une requête en fonction de la fréquence d'apparition des concepts demandés et de leur répétition au sein de chaque document. Sa principale force : son autonomie.
> Les moteurs de recherche multi-dimensionnels
Il s'agit sans doute des produits les plus avancés. Leur technique s'inspire de celle des systèmes d'analyse décisionnels. Objectif : affiner la catégorisation des documents, ainsi que les procédés de requêtes croisées.
> Les assistants de requêtes
Ces applications apportent une première réponse à la problématique des requêtes en langage naturel. Reposant sur des fonctions d'analyse linguistique, elles interprètent la requête dans des langages propres aux outils de recherche (booléen, etc.).
> Les moteurs Open Source
Tout comme l'univers de la gestion de contenu, le champs de la recherche a également été investi par les développeurs Open Source. Nous vous proposons ici une sélection d'outils sur ce terrain.