Depuis quelques temps, de drôles de résultats commencent à fleurir sur Google quand des questions précises lui sont posées.


En effet, il semblerait que Google arrive à comprendre et à interpréter les requêtes qu’on lui soumet à partir du moment où celles-ci traitent de dates, de liens de parenté ou de lieux.


En exemple, une recherche sur « Quelle est la capitale de la France ? » nous donne…

Capitale de la France ?

Capitale de la France ?

… dans le mille: Une réponse toute faite par Google, et non un lien vers un site !


Idem avec « Qui est le président de la France ?« 

Qui est le président de la france ?

Qui est le président de la France ?


Bon pour le français, c’est assez limité, mais en anglais on a le droit à des choses un peu plus évoluées comme :

« Who is Britney Spears mother ?« 

Who is Britney Spears mother ?

Who is Britney Spears mother ?


…ou plus sérieusement:          « Who was Marlene Dietrich’s husband ?« 

Who was Marlene Dietrich's husband ?

Who was Marlene Dietrich


Là où la nouvelle est surprenante c’est que les informations n’apparaissent pas de manière structurées aux yeux de Google, mais celui-ci se charge de les assimiler, les comprendre et de les retranscrire de manière à répondre au mieux à la question posée.


Là où c’est encore plus surprenant, c’est que cette fonctionnalité a coûté la modique somme d’un million de dollars lors du rachat de Power par Microsoft, et encore seules les informations issues de Wikipedia sont analysées… On est loin de la quantité d’informations traitées par Google!


Pour pouvoir mesurer la portée de cette avancée, encore faut-il connaître le réel potentiel de Google. Cette problématique est très bien exposée par les propos de Bruno Haid, de la startup sémantique Australienne System One :

“Ce qui est intéressant c’est que, bien que les données concernant la mère de Justin Timberlake, parmi d’autres, soient issues de http://www.celebritywonder.com/html/justintimberlake.html, il n’y a aucune donnée structurée de façon sémantique qui permet d’identifier Lynne comme étant la mère de Britney Spears. Donc soit Google utilise une source d’information structurée qu’il ne révèle pas dans ses résultats, soit ils arrivent réellement à extraire cette information du texte non structuré qu’ils affichent comme source (http://ububu.com/BritneySpears.html). Si c’est la cas, c’est énorme.« 

 

 

Bien sûr cette fonctionnalité a ses limites, mais est-ce le début du web sémantique, principale caractéristique de ce qui est maintenant appelé le Web 3.0 ?