Ok

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies. Ces derniers assurent le bon fonctionnement de nos services. En savoir plus.

Wolfram vs Google : bientôt la guerre ?

wolframalpha.jpgFaire des recherches sur la Toile est devenu aujourd'hui incontournable et d'une assez remarquable simplicité. Les formats de documents sont divers ainsi que leur contenu. De la recette de cuisine à l'article scientifique en passant par les photos du dernier né, les recherches sont innombrables et l'impératif sous-jacent c'est celui de trouver le plus rapidement possible ce que l'on cherche.

Deux stratégies principales de recherches peuvent s'affronter. Celle de Google dont l'efficacité n'est plus à prouver, basée sur la recherches de mots-clés et le page-rank qui est la mesure de l'indice  de popularité du lien et celle de Wolfram qui est à construire, que l'on appelle la recherche sémantique qui vise à répondre à la question posée de la façon la plus pertinente possible.

Wolfram a annoncé la sortie de son moteur de recherche sémantique pour mai 2009, il s'appelle WolframAlpha et nous y sommes. Alors Wolfram et Google vont-ils s'affronter violemment, dans un avenir très proche sur le terrain de la recherche de contenu sur la toile ? Est-ce un simple effet d'annonce pour une technologie qui est encore loin d'être au point?

 

tafiti tree

Photo: rMen

Moteur de recherche: Tafiti

Dans les années 90, l'idée était de taper des mots clés pour obtenir la liste des documents les contenant. Cependant, quelques limites  à la pertinence des résultats apparurent très vite. D'une part la liste pouvait être très longue, et même très très longue et la réponse aux requêtes devait être immédiate, le calcul devait donc se faire rapidement et ne pouvait pas inclure tous les documents. D'autre part, sans critère de classement la liste ne présentait qu'un faible intérêt. C'est à la fin de années 90, en 98 exactemment, que l'idée du Page Rank s'est concrétisée dans la tête de deux doctorants, Sergey Brin et Lawrence Page, pour le plus grand succès de Google, ce qui permettait de claser les pages par ordre d'importance avec un algorithme itératif suffisamment simple et efficace pour qu'il renvoie les résultats que l'on connait aujourd'hui de façon instantanée. Comment fonctionne Google ? est un très bon article de Michael Esermann qui nous fait entrer dans la mécanique des matrices stockastiques et du calcul du Page Rank.

On pourra trouver ICI, une petite histoire des moteurs de recherches.

Depuis cette date, de nombreux moteurs de recherche on vu le jour, présentant les résultats sous des formes très différentes mais la plupart utilisent la technologie de classement Google. J'en ai répertorié quelques uns sur le blog. Certains plantent des arbres comme Ethicle, et le dernier en date est LastGoogle qui renvoie les résultats dans l'ordre inverse de ceux de Google! Pour quel intérêt ?

Cependant lorsque l'on fait une recherche sur le Web, c'est bien souvent la réponse à une question que l'on se pose que l'on veur obtenir, comme par exemple " Qui a été élu président de la France en 1981?" et là, si l'on souhaite trouver " François Mitterrand", nous ne sommes plus dans la recherche par mots clés puisque les pages cherchées ne doivent pas afficher de façon préférentielle les mots de la requête mais le nom du président de l'époque. Cette recherche est appelée sémantique. D'ailleurs les premières pages renvoyées par Google à cette question sont celles qui traitent de Coluche.

Wolfram, le célèbre créateur du logiciel Mathematica, s'est attelé à cette tâche titanesque de vouloir réorganiser, reclasser le Web de façon sémantique. La tâche n'est pas mince!

Nova Spivack, directeur de Radar Networks, qui dans le passé avait développé le logiciel Twine, affirme que Wolfram Alpha pourrait être aussi "important pour le Web (et le monde) que Google malgré un mode d'utilisation différent". Ses premières impressions du projet Wolfram Alpha font suite à une conversation et un éssai de deux heures avec Wolfram. "Se connecter au programme Wolfram Alpha est comme entrer dans un vaste cerveau électronique. Il fournit des réponses impressionnantes et extrêmement minutieuses sur un vaste panel de questions, et celles-ci peuvent être posées de différentes manières; il calcule les réponses et ne se contente pas simplement de consulter une base de donnée. De cette façon il apparaît beaucoup plus intelligent que Google; Google retrouve simplement les documents basés sur une recherche de mots clés et n'est pas capable de comprendre la question ou la réponse". Le programme serait également doté d'une interface capable de traiter le langage naturel et compatible avec certaines formes d'abréviation. L'intégralité de l'article sur Bulletins Electroniques.

Cependant , l'enthousiasme initial peut facilement être modéré en prudence et même en scepticisme, comme le souligne cet article de 20 minutes.fr. Wolfram pourrait plus devenir un concurrent de Wikipédia que de Google et entre l'idée du Web Sémantique et sa réalisation, il y a un gouffre qui peut laisser penser que l'idée de Wolfram est un peu "tarte à la crême".

Le Web Sémantique c'est aussi l'idée de maîtriser son identité sur Internet et de pouvoir l'utiliser pour cibler ses recherches. On trouvera des informations plus poussées sur le sujet que l'on soit novice, confirmé ou expert: ICI dans une présentation Pearltrees réalisée par Nicolas Cinober qui parle d'ailleurs de ce sujet sur son blog et qui a eu la très bonne idée de  faire une présentation pour "La chanson du dimanche" dans laquelle on trouvera   "Bac ABCD" que j'adore !

Alors coup de Buzz de Wolfram ou véritable info qui va bouleverser le monde du Web ? La réponse avant la fin de ce mois...

Dans tous les cas, le Web Sémantique ne sera qu'une étape intermédiaire dans ce qui sera la longue histoire de la recherche d'informations et de connaissances. Il reste difficile aujourd'hui d'effectuer des recherches dans une partie d'un document et de se voir renvoyer seulement la partie du document qui traite du sujet. Ce type de recherches sur la toile est à l'étude dans un laboratoire d'Amsterdam. Le groupe de recherche cherche à mettre au point un mécanisme standard pour pointer automatiquement sur n'importe quelle partie d'un fichier multimédia. Il est au préalable cependant nécessaire d'indexer les contenus. L'intégralité de l'article sur L'Atelier.

Histoires à suivre...

Ajout du 17 mai : What Is Google Squared? It Is How Google Will Crush Wolfram Alpha (Exclusive Video) TechCrunch

Les commentaires sont fermés.