Relativité - Spécification d'une architecture émergente fondée sur le raisonnement par analogie. Application aux références bibliographiques.

Ce titre alambiqué (il m'a été soufflé -voire un peu imposé- par mon directeur de thèse, j'aurais bien fait plus simple, mais du coup je n'y ai jamais vraiment réfléchi) est celui de la thèse que j'ai soutenue en 1998. Je me propose d'expliquer en des termes un peu plus simples en quoi elle a consisté.

Avant d'oublier, je vous donne l'adresse où vous pouvez la lire (en HTML, en PDF, en PostScript). Au fait : je l'avais écrite en La Te X.

C'est mon premier article dans la rubrique IA, mais ce n'était pas ma première expérience d'Intelligence Artificielle (j'ai fait un stage de DEA d'informatique à Supélec-Metz, sur la programmation d'un PerceptronMulticouches sur une architecture parallèle). En fait, c'est ma seconde expérience. Elle m'a fait découvrir DouglasHofstadter, un grand bonhomme qui a beaucoup d'idées dans le domaine (entre autres) des SciencesCognitives.

Son but était de modéliser le fonctionnement du cerveau humain, à un niveau moins fin que les réseaux de neurones, qui ne traitent que des informations brutes (un signal électrique). Il s'est attaché à un niveau symbolique plus macroscopique.

Faisant ma thèse dans une équipe de reconnaissance de l'écriture et d'analyse de documents, j'ai décidé (merci à YannickLallement pour son aide) d'appliquer l'architecture exposée par DouglasHofstadter et MelanieMitchell (dans CopyCat) à la reconnaissance automatique de la structure des références bibliographiques à la fin des articles scientifiques.

Dans CopyCat, on traitait un micromonde, avec un problème (relativement) simple: faire des analogies entre chaînes de caractères. Quant à moi, j'allais l'appliquer à un problème réel, autrement plus complexe (j'ai d'ailleurs découvert sa complexité au fur et à mesure de mes tentatives de résolution).

Une des innovations de ma thèse est que je construisais automatiquement la base de connaissances à utiliser (alors que dans CopyCat, elle était entièrement créée à la main, et d'une taille restreinte).

Comme je ne vais pas réécrire ici ma thèse (cf. supra pour la lire), je dirai simplement que lors de la rédaction des perspectives, j'ai dégagé deux applications éventuelles de l'architecture BAsCET (qui est l'acronyme de Blackboard, AgentS, Concepts, Exemples et Température) : l'une à la recherche "intelligente" de références dans une base bibliographique, et l'autre à la génération de phrases en fonction de concepts "activés" par l'entrée de phrases d'un ou de plusieurs utilisateurs (en bref, d'un simulateur de conversation, ou Bot Parlant).

Mais l'histoire du Bot Parlant est une autre histoire...

Autres pages qui parlent de ma thèse :