Quelle est la différence entre Google et Wolfram|Alpha?
Google est un moteur absolu, il répond indépendamment des caractéristiques de l'utilisateur.
Lorsqu'on demande à Google le temps qu'il fait ou qu'il fera demain, il répond en renvoyant les notes contenant les mots "temps" et "demain". Pour toutes les requêtes: "temps demain", Google renverra invariablement la même page uniquement paramétrée par le pagerank des différentes pages ou sites. C'est donc un moteur dont le point de vue est absolu. Toutes les requêtes du monde donneront la même réponse, quelque soit où et quand la demande est formulée.
Wolfram|Alpha est un moteur relatif, il intègre les informations de l'utilisateur. Lorsque je lui demande le temps qu'il fait, non seulement il répond à la question mais il géolocalise l'adresse IP de mon ordinateur et répond à la question que je lui pose, sous-entendu, quel temps fait-il pour moi? Il y aura donc autant de réponses à la requête "weather" qu'il y aura d'adresses IP donnant lieu à des données différentes, c'est à dire qu'en ce qui me concerne, Wolfram|Alpha me donnera le temps qu'il fait à Orléans et pour vous, celui qu'il fait chez vous, où que vous soyez dans le monde. A une requête donnée peut donc correspondre plusieurs réponses incluant des données qui sont relatives à l'utilisateur. Il en est de même pour les dates puisque hier et demain deviennent relatifs par rapport à la date d'aujourd'hui. Ainsi donc, si j'envoie tous les jours la requête "weather tomorrow", Wolfram|Alpha me renverra la réponse en fonction de mon lieu géographique et du jour auquel je suis alors que Google renverra toujours la même page.
Google est un moteur passif, il ne peut pas traiter l'information car il ne la connaît pas. Il est transparent à la mise en forme de cette information car il ne la digère pas. Si par exemple on demande à Google de renvoyer le nom du président français lorsque Gandhi avait 13 ans, il ne peut le faire qu'à la condition que quelqu'un se soit déjà posé cette question sur le web, et ai laissé les mots clés de la question exactement formulée ainsi, ce qui à une probabilité infime d'être réalisée.
Wolfram|Alpha est un moteur actif, il va chercher l'information, la digère et la traite. Si on lui pose la même question, il va chercher dans la biographie de Gandhi sa date de naissance, il lui ajoute 13, il va chercher dans la table des présidents français celui qui est en exercice à la date en question et renvoie la réponse. L'information disponible est donc utilisée par le moteur pour assurer la pertinence de la réponse. Wolfram|Alpha donne la réponse exacte à la requête : "president of france when gandhi was 13".
On pourra bien sûr trouver des questions non comprises, non traitées par Wolfram|Alpha puisqu'il doit l'interpréter et trouver l'information avant d'y répondre, ce que ne doit pas faire Google qui renvoie une réponse inconditionnelle associée aux diffrérents mots clé, mais on doit noter l'approche totalement différente de ces deux moteurs de recherche. Il y a fort à parier que ces deux visions différentes de recherches mettront un peu de temps avant de se rencontrer et d'accoucher de moteurs hybrides. Attendons patiemment les évolutions.
Commentaires
http://www.lemondeinformatique.fr/actualites/lire-wolframalpha-ouvert-a-tous-et-a-toutes-les-requetes-pointues-28612.html
Savoir faire des calculs complexes est une chose. Savoir scaler ce même service service en est une autre.
Wolframalpha est inutilisable à l'heure où j'écris ce commentaire... Google a tué les Altavista et autres dinosaures de la recherche car il a su offrir plus rapidement un résultat et de meilleure qualité.
Pour battre Google il faudra offrir un résultat encore meilleur, et dans des temps toujours plus faibles.
Merci beaucoup pour cet article extrêmement intéressant. Il me semble que Wolfram alpha a un potentiel gigantesque. Après, il va falloir bosser suffisamment pour profiter du buzz tant qu'il existe.
Je pense Benjamin, sans vouloir t'offusquer, que tu n'as pas tout à fait saisi ce qui est sous-jacent. Le problème n'est pas de savoir si Wolfram va tuer Google ou X éclater Y, c'est que deux aspects fondamentalement opposés de la recherche d'information viennent d'être établis, alors que jusque là un seul dominait du type recherche Google avec renvoi de listes triées ( il y en a certainement plus de 2 mais je pense que ce sont les principaux (j'ai pensé à la recherche apophatique mais celle-ci est à inventer, on pourrait aussi penser à une recherche analogique). Pour faire une comparaison on pourrait donner l'aspect corpusculaire et ondulatoire de la lumière. Ces deux formes de recherches sont duales, tout comme les algorithmes sous-jacents sont fondamentalement différents. En cela ils sont donc complémentaires comme le sont le bateau et l'avion pour traverser l'atlantique. Ce n'est pas parce que les tous premiers avions ont fauché les marguerites que les airbus A320 n'ont pas vu le jour ! Et à cette époque il n'y avait que des bateaux pour faire la traversée et imaginer la faire par avion relevait de la folie. Il ne faut donc pas se tromper sur le sujet. Ces deux moteurs recherchent une information qui n'est pas formulée avec la même demande. Les comparer revient à utiliser le plus efficace et ne sert à rien. Avec une recherche de type Google on pioche dans le stock le plus près possible de l'input, avec une recherche de type Wolfram on vise un ouput indéterminé en entrant l'input le plus adéquat et minimal. Weather est l'input minimal qui me permet de connaître le temps qu'il fait à Orléans. Google ne peut pas répondre à cette requête minimale: il lui faut au moins 3 mots clés : temps aujourd'hui orléans. Wolfram travaille à la minimalisation des inputs et Google à l'optimisation des outputs. Ce n'est pas le même coté de la lunette ! Le handicap de Google c'est qu'il donne une réponse très proche des inputs, la réponse est un peu contenue dans la question et le travail restant est à la charge de l'utilisateur. L'inconvénient de Wolfram c'est qu'il lui faut comprendre l'input qui peut être très lointain de l'output.
Google est une grande matrice de sites répertoriés selon leur pagerank dont l'algorithme d'actualisation est très simple et efficace. Les inputs sont tout simplement comme les coordonnées d'un vecteur qui permet d'obtenir par multiplication/projection/extraction les pages triées contenant ces mots coordonnées.
L'algorithme de Google est actif pour le classement des pages et passif pour le renvoi de ces pages. Il est adapté pour renvoyer sncf ( fort pagerank) quand on tape "train" et demande de préciser l'input si l'on veut des pages sur un sujet plus précis concernant les trains. L'algorithme de Wolfram est interne et vise à la minimisation des inputs par exemple pour comparer les caractéristiques des trains entre eux ou avec d'autres modes de transports, ce qu'il ne peut faire en l'état actuel des choses. C'est un peu comme si l'on avait demandé aux premiers ordinateurs de faire un calcul météo! La difficulté principale que va rencontrer cet algorithme est l'extraction de l'information existante. Il faudra certainement imposer des normes pour permettre à de tels algorithmes de fonctionner.