Interview de Sébastien Blondeel et Dov Rueff

La révolution Google : c'est quoi pour vous ?

Photo de l'auteur

Traducteurs du livre La révolution Google paru aux Éditions Eyrolles, Dov Rueff et Sébastien Blondeel nous présentent cet ouvrage et nous livrent leur point de vue sur l'avenir de la recherche Web.

Quelles sont les informations qui vous ont le plus marqué lors de la traduction de ce livre ?

Sébastien Blondeel : Je retiendrai :

  • La présentation détaillée, sans être inaccessible ou trop technique, du rapide processus de construction de cette entreprise en si peu d'années.
  • La succession de coups de chance et de situations favorables :
    • les bons hommes au bon moment,
    • le refus par les investisseurs contactés de racheter le projet pour une bouchée de pain,
    • la patience et la confiance des premiers investisseurs,
    • la synergie avec les idées innovantes sur la manière d'exploiter efficacement un trafic web important,
    • l'opportunisme et l'intelligence des premiers cadres.

Dov Rueff : En ce qui me concerne, c'est surtout le point suivant : Larry Page s'est attaqué au Web parce qu'il voulait résoudre un problème personnel, à savoir qui parlait de lui, en établissant un lien avec sa page sur Internet. Le "Pagerank" que tout le monde traduit par "rang de la page" est en réalité le "rang selon Page".
Il paraît parfois de plus en plus difficile, voire impossible, aux individus de lutter à armes égales et de terrasser de grandes sociétés.
Alors qu'en moins de dix ans une idée soit passée d'une poignée de cerveaux universitaires à une domination quasi monopolistique mondiale, c'est pour moi une véritable ode à l'accueil triomphal que le libéralisme fait parfois à l'innovation.

Quels sont les différents types de systèmes de recherche Web aujourd'hui ?

S.B. : Il en existe deux grands types, que La révolution Google évoque.

Les annuaires et systèmes reposant sur une relecture et valorisation des documents par une équipe salariée s'opposent aux entreprises faisant le choix d'une automatisation poussée. Cette deuxième solution, si l'on maîtrise les algorithmes et dispose de programmeurs suffisamment nombreux, doués et bien organisés, passe beaucoup plus facilement à l'échelle.
Dans tous les cas, c'est l'humain qui à la base qualifie l'information. Google a su s'appuyer sur le produit du temps de travail rendu disponible sur le Web par les milliards de pages disponibles, et distribuer un maximum ses charges en les faisant, en quelque sorte, réaliser par le grand public.

Dans la partie "Google aujourd'hui, Google demain", de La révolution Google, John Battelle analyse les différences des systèmes de recherche de Google et de Yahoo. Cette comparaison se fait sur la recherche du terme "usher". Il en ressort que Google base tout sur le non humain, c'est-à-dire essentiellement sur ses algorithmes de recherche, à la différence de Yahoo, dont le système repose également sur des choix éditoriaux. Pensez-vous que Google gagnerait à intégrer des conseils éditoriaux dans les résultats de recherche (au prix peut-être de la grande diversité des résultats) ?

S.B. : C'est en effet le choix de cette entreprise. L'avantage est que cela réduit les ressources humaines nécessaires au traitement d'une masse d'informations toujours plus importante. Google procède d'ailleurs de même pour la vente des publicités : tout est géré par des programmes, ce qui lui permet de dégager des profits gigantesques à partir de transactions très modestes, qui ne seraient pas rentables si elles devaient être traitées par des commerciaux.

Est-ce que le 100% automatique ne risque pas de se heurter un jour à des limites que seule une intervention humaine pourra dépasser ?

S.B. : Pour répondre à cette question, il est nécessaire de faire un point sur l'industrie du Web aujourd'hui.

Il y a une course incessante entre les tricheurs (qui recourent à une "optimisation pour moteurs de recherche") et les mesures de lutte contre eux : fermes de clics et autres procédés sont régulièrement contrecarrés. Le livre se fait l'écho de certains cas de figure...

Après une décennie où l'industrie du Web a montré qu'elle n'avait rien retenu des leçons de l'Histoire (dans les années 1970, Unix s'est imposé car il normalisait les systèmes d'exploitation, cf. http://www.linux-france.org/article/these/lastdino/lastdino-fr.html), chaque navigateur tentant de tirer la couverture à lui en développant des extensions et fonctionnalités volontairement incompatibles avec la concurrence dans une dérisoire tentative de conquérir des parts de marché, il semble que nous remontions la pente.
Les livres de design web mettent de plus en plus l'accent sur l'intérêt et les avantages d'un respect des normes, d'une organisation structurée des contenus, d'une séparation du fond de la forme pour une exploitation plus aisée dans différents contextes et par des utilisateurs aux profils divers. Cette évolution du Web devrait faciliter l'indexation des sites et la qualité des résultats rendus par les moteurs de recherche.

Par conséquent, le 100% automatique a encore de belles années devant lui.

Qu'est-ce que l'information, en définitive ? Cela se réduit à toute donnée décrivant une chose, n'importe quoi. Réduire cette notion à un document web, c'est faire preuve d'étroitesse d'esprit. Où se trouve votre trousseau de clés et sa balise GPS ? Combien coûte un paquet de Pampers dans ce commerce de la banlieue de Miami ? L'information peut prendre la forme de photos de mariage ou d'un flux vidéo présentant un tsunami déferlant en direct sur l'océan indien. Si l'on peut tirer un enseignement des premières années de l'ascension de Google vers le sommet, c'est bien celui-là : tout ce qui présente un intérêt se doit de figurer dans son index. Que se passera-t-il quand on y retrouvera le monde entier ? (extrait de La révolution Google, page 223).
Ce système de recherche idéal se rapproche de l'intelligence artificielle. Cela est-il vraiment possible ?

S.B. : À nouveau, Google adopte une approche très pragmatique à un problème ancien, ce qui est facilité par la jeunesse de l'entreprise, le grand contrôle qu'y conservent ses fondateurs, et les moyens financiers et humains incomparables dont elle dispose. L'intelligence artificielle progresse peu depuis plusieurs décennies ; certains pensent même qu'elle ne décollera jamais vraiment.

Prenons l'exemple de la traduction automatique. En somme, cela ne fonctionne pas, parce que les ordinateurs ne comprennent pas ce qu'ils doivent traduire.
La solution Google : au lieu de décomposer les phrases en groupes grammaticaux et en mots, on va tenter de retrouver des phrases voire des paragraphes proches, déjà traduits, et reprendre l'adaptation réalisée par un être humain.

Google sait justement exploiter au maximum le travail humain publiquement disponible et accessible. Ces données sont en grande quantité et à forte valeur ajoutée, car elles reposent au final sur l'intelligence "naturelle".
Pour répondre à votre question, le projet à long terme de Google d'indexer tout ce qui peut présenter un intérêt, mobilisera des ressources gigantesques en termes de mémoire et de puissance de calcul, mais ça ne fait pas peur à Google. Il en est de même pour la traduction automatique, projet dans lequel Google s'engage pour 10 ans et plus.

En conclusion, pouvez-vous nous dire ce qu'est pour vous "La" révolution Google ?

S.B. : Pour moi, la révolution Google c'est :

  • Savoir exploiter pragmatiquement et efficacement les informations partiellement qualifiées déjà disponibles ;
  • Valoriser les compétences et les savoir-faire mis en ligne ;
  • Éliminer les intermédiaires entre le vendeur et le client potentiel ;
  • Miser sur la publicité ciblée, 2 à 8 fois plus rentable pour une entreprise dans l'acquisition de nouveaux clients (un nouveau client coûte 8.50 USD au lieu de 20 à 70 pour les moyens traditionnels, cf. figure page 30) ;
  • Mettre en place un système distribué et robuste qui passe à l'échelle ;
  • Faire faire aux ordinateurs les tâches élémentaires et répétitives pour lesquelles ils sont imbattables.

Prenons l'exemple de Google Maps, cette carte du monde cliquable sur laquelle on peut facilement naviguer. La plupart des clichés sont repris de sources souvent publiques dans le cadre d'accords particuliers. Avant Google, personne ne pouvait ou savait faire l'effort d'unifier ces données et ces interfaces.
Aujourd'hui, le slogan, "Don't Be Evil" (ne pas faire le mal), et l'objectif "organize the world's information and make it universally accessible and useful" (organiser l'immense volume d'informations disponibles dans le monde pour le rendre universellement accessible et utile) de l'entreprise prennent tout leur sens.

D.R. : La révolution Google, pour moi, c'est la façon dont Sarah, ma nièce de 9 ans, exprime régulièrement sa reconnaissance pour le moteur qui lui permet d'en savoir plus sur ses passions. Pour signifier son ignorance à une question, elle se tape régulièrement le front en disant : "Eh, y a pas écrit Google, ici !".

Quelles seront, selon vous, "les" prochaines révolutions de la recherche Web ?

S.B. : Le livre fait déjà quelques ouvertures sur le sujet. Le Web évoluera et s'invitera hors des ordinateurs de bureau : mobiles, autres périphériques nomades, télévision, interconnexion avec les petits commerces, liaisons entre ordinateurs, systèmes vidéo...
Quelques scénarios sont évoqués (cf. l'anecdote sur la poussette et celle sur la bouteille de vin).

La recherche spécialisée dans des marchés de niche devrait elle aussi progresser, ainsi que la recherche de plus forte valeur ajoutée, capable de répondre à des questions plus pointues et industrielles. Cela fait l'objet de l'un des derniers chapitres de La révolution Google.

Google voit plus loin que le seul Web et innove de plus en plus vite et souvent, notamment avec ses outils pour développeurs permettant d'intégrer des services Google sur d'autres sites. On l'a vu récemment au Google Developer Day 2007 (http://code.google.com/events/developerday/). Cette entreprise fait aussi l'effort de rendre à la communauté ce que celle-ci lui a apporté notamment en finançant depuis plusieurs années le "Summer of Code" (http://code.google.com/soc/).

D.R. : J'aime bien la reconnaissance de formes, de visages dans les images ou les vidéos. Cette technique qui fonctionne déjà dans certains systèmes de vidéo sur veillance et certains dispositifs testables me paraît assez prometteuse.
Quand, en réponse à la question "Donne-moi une forme qui se rapproche de celle-ci", on se retrouve avec différentes sortes de clés, de la clé mécanique à la clé USB, par exemple, on perçoit les progrès à venir.
Avec des sources d'images de plus en plus nombreuses, avec les caméras branchées sur la vie réelle, il deviendra possible de considérer les actes et les objets de la vie quotidienne comme une nouvelle source d'informations.

Propos recueillis par Laetitia Maraninchi.

Recevez nos newsletters
Vous serez régulièrement informé(e) de toutes nos nouveautés. Inscription