logo Essonne

Trouver sa route sur le web

Chercher une information dans les méandres d’Internet est parfois fastidieux. Des logiciels se proposent de mener la traque à notre place : en utilisant les systèmes de questions-réponses. Au croisement de la linguistique et de l’informatique, ils dénichent eux-mêmes la réponse aux questions que l’utilisateur leur pose en langage courant. L’avenir des moteurs de recherche est en marche.

Trouver sa route sur le web© Stefanos

Vous cherchez la taille de la tour Eiffel sur un moteur de recherche comme Yahoo, Google ou Exalead ? Très bien, vous l’aurez en deux clics. En revanche, si vous souhaitez connaître la couleur de la robe que portait la reine d'Angleterre lors de son sacre, vous risquez la tendinite ! Une fois sur deux, les utilisateurs finiraient par baisser les bras devant l’échec de leur recherche. Pendant des années, Google et ses concurrents ont ferraillé sur le nombre de pages référencées (ils en indexeraient plus de dix milliards) et sur la pertinence des résultats. Ce combat est désormais dépassé : seule une avancée technologique majeure permettra aux moteurs d’accélérer les requêtes, voire simplement d’y répondre.

Cette avancée pourrait bien être les systèmes de questions-réponses (SQR). Au carrefour de la linguistique et de l’informatique, ces programmes sont capables d’analyser une question formulée en langage naturel, comme "Quelle est la population de la Hongrie ?", et d’aller chercher la réponse sur Internet ou dans des documents stockés sur le disque dur de l'utilisateur. Et ça marche : le champion en la matière, développé par l’université du Texas, affiche 90 % de bonnes réponses !

Même si l’un des auteurs de ce logiciel, Marcus Pasca, a rejoint l’équipe de Google il y a deux ans, le moteur de recherche américain n’a pour l’instant implémenté dans sa version anglophone qu’un équivalent rudimentaire de ces systèmes. En fait, il se pourrait bien que la France dame le pion au géant de l’Internet et fournisse le premier vrai couple "moteur de recherche/système de questions-réponses". Une équipe du Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur (Limsi) emmenée par Brigitte Grau et une société toulousaine, Synapse, collaborent en effet pour produire le système de questions-réponses du futur moteur de recherche français, "Quaero".

Comment ces logiciels sont-ils nés ? Sur quelle technologie reposent-ils ? Sont-ils tout puissants ? Réponses d’un humain, avant qu’une machine ne le remplace un jour...

01.Naissance des systèmes de questions-réponses : la grande désillusion

La machine EnigmaEnigma, machine considérée comme un des premiers ordinateurs. Elle a été inventée pour décrypter les codes de communications militaires des allemands lors de la Seconde Guerre Mondiale.
© Courtesy of the National Security Agency
Nous sommes au début des années cinquante. La guerre froide s’installe et avec elle le besoin