Ce titre alambiqué (il m'a été soufflé -voire un peu imposé- par mon directeur de thèse, j'aurais bien fait plus simple, mais du coup je n'y ai jamais vraiment réfléchi) est celui de la thèse que j'ai soutenue en 1998. Je me propose d'expliquer en des termes un peu plus simples en quoi elle a consisté.
Avant d'oublier, je vous donne
l'adresse où vous pouvez la lire (en HTML, en PDF, en
PostScript). Au fait : je l'avais écrite en
La Te X.
C'est mon premier article dans la rubrique IA, mais ce n'était pas ma première expérience d'
Intelligence Artificielle (j'ai fait un stage de DEA d'informatique à Supélec-Metz, sur la programmation d'un
PerceptronMulticouches sur une architecture parallèle). En fait, c'est ma seconde expérience. Elle m'a fait découvrir
DouglasHofstadter, un grand bonhomme qui a beaucoup d'idées dans le domaine (entre autres) des
SciencesCognitives.
Son but était de modéliser le fonctionnement du cerveau humain, à un niveau moins fin que les réseaux de neurones, qui ne traitent que des informations brutes (un signal électrique). Il s'est attaché à un niveau symbolique plus macroscopique.
Faisant ma thèse dans une équipe de reconnaissance de l'écriture et d'analyse de documents, j'ai décidé (merci à
YannickLallement pour son aide) d'appliquer l'architecture exposée par
DouglasHofstadter et
MelanieMitchell (dans
CopyCat) à la reconnaissance automatique de la structure des références bibliographiques à la fin des articles scientifiques.
Dans
CopyCat, on traitait un micromonde, avec un problème (relativement) simple: faire des analogies entre chaînes de caractères. Quant à moi, j'allais l'appliquer à un problème réel, autrement plus complexe (j'ai d'ailleurs découvert sa complexité au fur et à mesure de mes tentatives de résolution).
Une des innovations de ma thèse est que je construisais automatiquement la base de connaissances à utiliser (alors que dans
CopyCat, elle était entièrement créée à la main, et d'une taille restreinte).
Comme je ne vais pas réécrire ici ma thèse (cf. supra pour la lire), je dirai simplement que lors de la rédaction des perspectives, j'ai dégagé deux applications éventuelles de l'architecture BAsCET (qui est l'acronyme de Blackboard, AgentS, Concepts, Exemples et Température) : l'une à la recherche "intelligente" de références dans une base bibliographique, et l'autre à la génération de phrases en fonction de concepts "activés" par l'entrée de phrases d'un ou de plusieurs utilisateurs (en bref, d'un simulateur de conversation, ou
Bot Parlant).
Mais l'histoire du
Bot Parlant est une autre histoire...
Autres pages qui parlent de ma thèse :