Une lecture de Dominique Cardon « Dans l’esprit du Pagerank » de Google

L’analyse des algorithmes en sciences humaines est un projet à mener ; la classification automatisée des informations prenant une part importante dans la construction des processus de réalité et de représentations.

Dominique Cardon est sociologue, auteur de plusieurs ouvrages et s’est intéressé à une sorte d’ « anthropologie du Pagerank » dans le texte commenté ici (« Dans l’esprit du Pagerank; une enquête sur l’algorithme de Google, 2013). Dans la lignée de ce que décrit Lucien Sfez et les discours techniques fictionnels, le récit de Dominique Cardon peut apparaitre, à plus d’un égard, comme celui d’un thuriféraire et un apologiste. Pour autant, il a le mérite d’embrasser le sujet et la lecture de l’article (et donc son achat) est conseillée à ceux que Google questionne.

B8IA6q0CUAAY4Gh.jpg large

Il ne cache pas son admiration pour les inventeurs de Google, les qualifiant d’ « intrépides » ou « audacieux ». Lors d’une présentation (Séminaire SFdS) en mai 2014, il ira même jusqu’à avouer que l’autorité mesurée par Google est

à mon avis à conserver, enfin c’est un bien à chérir ; je pense qu’un jour on pleurera la disparition du Pagerank si Google se lance dans d’autres aventures.

Ce « bien à chérir » est décrit en résumé de son séminaire de mai 2012 comme une « utopie fondatrice » exaltant la « sagesse des foules » et le « miracle de l’agrégation« . Pagerank serait une « auto-organisation des jugements des internautes« . L’auto-organisation renvoie précisément ici à l’objet de la seconde cybernétique, déjà décrite en 1948 par Dominique Dubarle comme « machine à gouverner » (cybernétique, gouvernement, gouvernail) pour « le bonheur statistique des masses » grâce à « la manipulation mécanique des réactions humaines ».

Ainsi pour situer toujours, la méthode de Google pour mesurer l’importance d’une page web est présentée comme « élégante », « solution réaliste », « terriblement efficace ». Dont acte.

Réduction de la classification des documents au seul Pagerank

Faute de connaitre le fonctionnement réel de Google, la tentation est grande de réduire les critères de classement au seul Pagerank (dont l’article de 1998 montre le modèle mathématique). C’est précisément ce que s’offre le sociologue. Dominique Cardon déclare son ignorance (mais comme tout le monde) sur les véritables critères de classement d’une page web, car à juste titre Pagerank « n’est désormais qu’un signal parmi d’autres ».

Peu importe, pour le besoin de la cause, il sera postulé que « ce calcul joue toujours un rôle prépondérant dans le fonctionnement global de l’algorithme […] ». Il n’y a pourtant pas de correspondance stricte entre le classement (résultat de recherche) et la notation (Pagerank). Les problèmes de la complexité et de l’opacité sont ainsi évacués par le biais de la croyance qui fait entrer le lecteur dans un récit fictionnel, la partie vaudra pour le tout.

Dominique Cardon et le SEO

La morale et le marché, le marché moral

Dans une présentation de mai 2014, Dominique Cardon présente sa vision (objective) du SEO :

Tout le travail de Google contre les tricheurs, le marché du référencement, tous ceux qui cherchent à se faire applaudir eux-mêmes en créant eux-mêmes des liens hypertextes vers leurs sites, ce qui est un marché entier de l’univers d’internet, le Search Engine Optimization, donc de gens comme au théâtre qui paient la claque pour se faire applaudir et du coup truquer l’algorithme de Google.

google-wall

Donc le marché du référencement est un marché de « tricheurs », cherchant à « truquer l’algorithme». Dans une présentation votive de Pagerank et des intentions de Google, le SEO ne pouvait qu’être associé à une valeur morale négative, l’action de tromper. Il confère par là-même un statut anthropomorphique à l’algorithme, victime d’action dolosive.

L’auteur explique bien d’un côté que Google a attribué, avec Pagerank, une valeur d’échange au lien hypertexte, transformant ainsi le web en un vaste marché économique. Cette valeur d’échange octroyée à l’hypertexte n’appellerait aucun commentaire sous forme de publicité Adwords, mais deviendrait tromperie et tricherie lorsqu’elle concerne les hypertextes organiques. On opposerait ainsi les vertus morales du lien publicitaire à l’immoralité du lien organique. Un récit idéologique.

Cela consiste à se laisser guider aveuglément par l’algorithme et à lui conférer, comme le sociologue aime à le faire, une procéduralité inébranlable, « en explorant avec le plus de sympathie possible les justifications » de Google, ce qui serait pour lui « une méthode nécessaire ». Cette « sympathie » conduit l’auteur à répéter le message, par exemple, de Google, à savoir la séparation stricte entre résultat organique et publicité. C’est pourtant bien le contraire, tout repose sur la confusion entretenue entre publicité et information, même forme, même aspect, nonobstant la discrète mention « Annonce » partiellement présente.

Les acteurs du SEO

Les techniques d’intervention sur Pagerank sont circonscrites par Dominique Cardon aux seuls professionnels du SEO. Ainsi parle-t-il d’un « marché du référencement » dans lequel il décrit des « white hat » et des « black hat », « une véritable industrie », une « galaxie d’annuaire » et de « sites de CP », un « marché noir du lien », lien « factice » bien sûr, des « fermes de liens » et des « fermes de contenus » réalisées par des « truqueurs ».

 

Brooklyn Bridge October 7, 1914

Cet embouteillage de caricatures prête à sourire, a fortiori élaboré par un spécialiste du fait social. L’auteur aurait pu parler de rétro-ingénierie, d’analyses sémantiques, de conduite de projet, d’analyse de données, d’un métier essentiel pour nombre d’entreprises, qui n’ont d’autre choix pour survivre que d’obéir aux standards de Google. Mais cette impartialité aurait peut-être nui à l’objectif de l’article.

Dominique Cardon faisant l’impasse sur tous les autres critères que Pagerank, sa vision de la réalité en est donc largement biaisée. Le SEO ne se réduit en rien à l’hypertexte ou au Traitement Automatique du Langage bâclé, bien au contraire. Ce biais réductionniste et de nature morale, implique encore une dimension idéologique.

Son parti pris de l’unique Pagerank comme critère de classement « prépondérant » conduit ainsi l’auteur à quelques erreurs factuelles. Lorsqu’il écrit que « Le Pagerank a installé son ordre sur le web en domestiquant les techniques d’écriture des webmestres« , il confond les modèles mathématiques statistiques liés au texte et les modèles stochastiques liés à l’hypertexte. Ainsi ce qui relève pour lui de « la triche » s’étend à l’ensemble de l’écriture web, bien au-delà du simple hypertexte et du Pagerank.

Dans la logique de l’auteur, celle de la tromperie en vue de manipuler l’algorithme, il faudrait en premier lieu analyser l’écriture, journalistique par exemple, qui est adaptée intentionnellement aux critères statistiques du texte. Dans la logique de l’auteur toujours, l’optimisation des métadonnées à laquelle les journalistes sont dorénavant formés relèverait de la « triche » envers Google. La disparition des métaphores en balise title devrait aussi recevoir le jugement moral de Dominique Cardon…

Qui fait du SEO ?

Le sociologue raconte au lecteur une histoire pour le moins incomplète. Ainsi seuls les « professionnels » du SEO font du SEO. Mais la réalité est un peu différente. Que dire des grands sites marchands comme Cdiscount qui intègrent plusieurs salariés en SEO ? Que dire du site Pages Jaunes ? Et que dire de ces « black hat » comme lemonde.fr qui fournissent un maillage de liens totalement conçu pour « truquer » et « tromper » les résultats ? Que dire encore de ces sites d’information d’envergure nationale qui font commerce de liens et vendent l’autorité de leurs pages ?

Encore une fois, cette réduction du tout à la partie induit des inexactitudes invraisemblables et servent une rhétorique étrange. Il suffirait que le sociologue fasse un peu de sociologie pour s’apercevoir que la réalité du SEO est bien différente, plurielle, complexe, que ce à quoi il se plait à la grimacer.

White Hat et Black Hat

L’auteur s’attache à définir un rapport étonnant entre white hat – qui agit selon les règles de Google – et black hat « qui consiste à vendre de la réputation » (pense-t-il à VIP Réputation par exemple?). C’est accorder d’emblée à Google, la légitimité doctrinale de produire des normes morales, au seul motif de sa domination du capitalisme linguistique. Justifier ce qui est bien ou mal, en fonction d’une position économique dominante ne va pas de soi. Si l’on ne reconnait pas à Google, a priori, la légitimité de fixer la norme morale, cette binarité blanc/noir n’a pas de sens.

B8BkLHzIgAAMtVS

Quand l’auteur distingue deux types de SEO, white hat et black hat, il accorde à Google le pouvoir de la norme et de la morale. Ce transfert de pouvoir s’est déjà vu, quand par exemple l’Union Européenne a confié à Google de dire ce qui était légal ou non en matière de désindexation. Pour autant, la légitimité de ce transfert de pouvoir demeure à questionner. Google est au demeurant une entreprise capitaliste qui agit pour ses intérêts (par exemple à travers l’organisation de sa défiscalisation). Le contenu normatif de sa morale SEO protège ses intérêts particuliers.

Donc considérer a priori, que cette morale blanc/noir relève d’un intérêt général et supérieur valable pour tous est un choix idéologique de l’auteur. Il ne relève en rien de l’observation et la description des phénomènes, c’est un choix politique.

Quant à affirmer, comme il le fait, que Wikipédia ne distribue plus d’autorité depuis que Google a mis en place les balises « nofollow« … C’est une autre histoire n’est-ce pas ?

La crise du Pagerank ?

Après avoir fourni dans les premières parties, « L’invention du Pagerank » et « L’organique et le stratégique » les éléments participant à l’organisation d’une idéologie fictionnelle, Dominique Cardon conclut son propos par « La crise du Pagerank ».

Trois éléments selon lui montreraient cette « crise » du Pagerank :

  • L’effet concentrationnaire de l’autorité au bénéfice d’un graphe oligarchique
  • L’émergence concurrentielle des métriques sociales et « réputationnelles »
  • L’absence d’objectivité algorithmique due à l’intervention humaine

L’effet concentrationnaire de l’autorité au bénéfice d’un graphe oligarchique

Le premier consiste à constater l’évidence, que ce mode de classement scientométrique est le contraire de la « démocratie du web » vantée par ses promoteurs. Là réside fondamentalement « l’esprit du Pagerank » idéalisé par l’auteur. Cet aspect appartient moins à la « crise » qu’aux principes mêmes sur lesquels est construit l’algorithme. Autrement dit il y a là confusion entre la cause et l’effet.

Au-delà de Pagerank, oui, il existe une critique de la quantification scientométrique, qu’il s’agisse de Benchmarking (L’Etat sous pression statistique) et de Stat-activisme (Comment lutter avec des nombres) d’Isabelle Bruno et Emmanuel Didier ou de Derrière les grilles » (Sortons du tout-évaluation) de Barbarin Cassin (Grilles d’évaluation et Google-monde).

L’émergence concurrentielle des métriques sociales et « réputationnelles »

Le second est le résultat d’un déni. Celui consistant, au motif d’ignorer l’intégralité des critères de classement, de s’en remettre à l’unique Pagerank. Ayant a priori écarté tout autre critère de classement, il ne peut s’en connaitre aucun qui serait social puisque Pagerank ne l’est pas (comme si Google n’avait jamais assimilé ce type de métrique dans ses critères de classements…). Ce choix arbitraire ne peut conduire qu’à une « crise » strictement artificielle.

L’absence d’objectivité algorithmique due à l’intervention humaine

Et enfin le fantasme d’un âge d’or algorithmique. Google serait contraint, à cause des Etats, des ayants-droits et des tricheurs du SEO, d’intervenir manuellement, de pervertir la pureté mathématique de ses classements pour se transformer en « police du web« . Personne n’a jamais demandé à Google de définir ce qu’était la qualité éditoriale, à moins de vouloir en faire la victime de sa propre hégémonie, ce qui ferait sourire.

Si l’on considère le troisième point relativement à l’exécution de l’algorithme, cela relève du truisme. Mais sous l’angle de sa conception et des valeurs culturelles qui le fondent, il est strictement contradictoire avec la première « crise ». Comme l’écrit bien Dominique Cardon, un algorithme est un « système de valeur », un produit humain et culturel. Or ce dernier est simplement essentiel. Qu’y a-t-il derrière l’idée de la scientométrie ? D’où vient l’association consubstantielle de la subjectivité à l’erreur ? Et à l’inverse de la vérité dans l’objectivation mathématique ? De la quantification de la qualité pour exprimer une qualité supérieure ?

Pas un kilo-octet d’algorithme n’échappe à un schéma de pensée, de valeurs, de représentation du monde, de déterminants sociaux et culturels, d’impensé même, etc. L’algorithme demeure essentiellement humain. Confondre son exécution et sa conception ne mènera qu’à des « fictions instituantes ».

Comme l’écrit Matteo Pasquinelli dans « Google Pagerank : une machine de valorisation et d’exploitation de l’attention » (L’Economie de l’attention, nouvel horizon du capitalisme ?) :

L’attraction fatale des masses pour Google semble s’appuyer davantage sur son pouvoir mystique d’attribuer une valeur spectaculaire à n’importe quoi et n’importe qui, plutôt que sur la précision de ses résultats.

On pourrait attendre de l’homme de science, fut-elle humaine, d’analyser et décortiquer ce « pouvoir mystique » plutôt que de l’entretenir, et in fine de le servir.

Thomas Gibertie

4 réflexions au sujet de « Une lecture de Dominique Cardon « Dans l’esprit du Pagerank » de Google »

  1. Je ne vais pas me lancer dans un commentaire aussi long que ta prose, mais il y a plusieurs points qui me frappent dans la lecture qu’à Dominique Cardon du pagerank.

    Tout d’abord il y a un point technique. Bien sur il n’est sans doute pas nécessaire d’être algorithmicien pour avoir le droit de parler du pagerank, mais dans son article il rate quand même un point très important, qui est la définition du pagerank comme la probabilité d’un certain type de comportement d’une modélisation abstraite du comportement de l’internaute. A la base même de l’algorithme, on a donc quelque chose de non normatif : la capture la plus sincère possible du comportement de l’internaute. Avant d’être un indicateur d’autorité, le pagerank est un ersatz abstrait de la notion de popularité. D’ailleurs, Brin et Page le disent très bien dans l’article d’origine et dans mon souvenir ils ne mettent pas particulièrement l’emphase sur la notion de vote.

    Mon deuxième point est sur la notion d’objectivité et d’algorithme. Par construction, la chaîne de traitement utilisée par un moteur de recherche n’est pas un algorithme, mais un mécanisme, au sens de la théorie des jeux. Un mécanisme, c’est le « blob » que l’on construit lorsque l’on fabrique un monstre composé d’algorithmes en interface avec les humains. En oubliant les ajustements qu’il faut faire à cause des SEO, le simple choix des facteurs de pondération des différents critères de classement en fonction des retours utilisateurs par des méthodes d’apprentissage fait sortir le moteur de l’idéal de l’objectivité algorithmique.

    Il y a beaucoup à dire sur les bénéfices et les dangers de l’utilisation massive de mécanismes au sein de notre société, mais sans une vraie compréhension technique, la réflexion atteint assez vite un plateau, celui du café du commerce, et c’est dommage (et je parle bien du sociologue, pas de mon papy préféré).

  2. Oui c’est un peu long et merci pour ton commentaire éclairé et l’exigence de précision. Tu fais bien de rappeler que l’article fondateur parle de « surfeur aléatoire », autrement dit un comportement social. Mais c’est un point technique de la probabilité stationnaire d’une chaîne de Markov si j’ose le dire ainsi. L’auteur de l’article étudie davantage l’aspect anthropologique de la scientométrie. Ce serait intéressant de faire le pont.
    Tu fais bien d’employer le terme « monstre », car c’est bien de Léviathan dont il s’agit.

  3. Ce qui est surtout frappant à la lecture des citations, c’est de voir à quel point Google est parvenu à imposer un modèle dominant qui, en fait, pourrait se présenter comme une sorte d’impérialisme culturel sur le web – pour rester dans le domaine de la sociologie. Le SEO n’est pas apparu par hasard, il se nourrit des « failles » et des codes imposés par Google. La créature de Frankenstein en somme, pour faire un nouveau parallèle mythologique !

  4. C’est ce qu’on appelle parfois une « machine à penser », passant du « prêt-à-porter » au « prêt-à-comporter ». L’analogie est d’autant plus piquante que le principal promoteur du SEO, à ses débuts, n’est autre que Google en personne…

Les commentaires sont fermés.