L’ingrédient secret de Panda

Laurent Bourrelly [Panda s’est transformé en Godzilla]et Julien Berard [La qualité des contenus] viennent de lancer deux billets sur le nouvel animal de (la) compagnie Google: Panda.

Si on résume à la serpe… Le premier voit dans cette saillie algorithmique une atteinte à la liberté de commercer sur le web par des techniques arbitraires. Le second analyse la réaction du Moteur comme un geste d’auto-défense économique afin de conserver son leadership dans l’industrie de la recherche d’information.

Ces deux approches semblent révéler une contradiction globale autour de la recherche d’informations. C’est par son monopole qu’une société privée a le pouvoir de faire et défaire des modèles économiques sur internet, d’orienter la manière de se déployer sur le réseau, tout en se prétendant à la fois neutre [sinon conflits d’intérêts] et garante des critères de pertinence [police qualitative].

Mesurer la pertinence d’un contenu ou comme quantifier la qualité

Mécaniser l’appréhension de la qualité d’un texte n’est pas chose facile. A fortiori sans passer par une analyse sémantique. C’est même impossible.

Il est d’ailleurs piquant de voir qu’internet, qui constitue la plus vaste somme jamais écrite, n’est jamais classée qu’en chaines de caractères, tags, signatures et autres analyses plus ou moins syntaxiques. Autrement dit, Google se prévaut d’une pertinence dénuée de signification. L’industrie de l’information n’a pas les moyens de se payer du sens.

Aussi Panda n’est pas un exégète, un critique, ou un comparateur de qualité littéraire. En revanche, sa qualité est de demeurer mécanique. Et le plus à craindre de Google est d’élire le facteur social dans la pertinence des résultats sous la contrainte des réseaux sociaux.

Car laisser entrer des critères subjectifs pour trier les pertinences n’est pas l’apanage de la démocratie ; c’est une victoire de la grégarité tout autant que des fabricants d’opinion.

Les défauts de l’algorithme s’avèrent être ses qualités. Le classement mécanique, avec ses défauts et même avec Panda, sera toujours plus pertinent en restant illettré que des résultats issus de lectures soumises à la volatilité de l’opinion, des affects et des effets de mode.

Google ne serait pas Google, Panda ne serait Panda

Jusque là, avec une prise de risque syllogistique (très) limitée, c’est incontestable. La situation quasi monopolistique de Google implique l’impact de Panda et l’ampleur des réactions. C’est parce que Google se confond comme un Frigo et un réfrigérateur avec la recherche d’information que Panda pose problème.

Mais sinon. Chacun demeure libre d’utiliser Bing, Yahoo, Duck Duck Go, Blekko, Facebook, Baidu, Yandex, ou même Qwiki. Google vous dérange ?

Vous n’aimez pas Panda ? Allez voir ailleurs dans la plus pure logique des libertés individuelles.

Trop courte la liberté ? Revient comme un boomerang du succès l’abus de position dominante. Trop court encore. En quoi Google utilise-t-il son pouvoir de marché pour s’affranchir des conditions imposées par le marché ? Aucune, Panda est libre comme l’air, comme vous, comme nous.

Simplement encore faudrait-il pouvoir faire sans Google, alors que l’on ne vise qu’à générer une audience autour de quelques pages html.

« Je suis un résultat de recherche »

Ce qui dérange in fine, c’est qu’en réorganisant ses propres critères de résultats (c’est son problème), Google modifie le réseau : la manière d’éditer, de produire des pages et même d’y développer une activité économique.

Si Google change ses résultats de recherches, c’est internet qui change. Google éternue et internet s’enrhume. Mais si aujourd’hui un site marchand a besoin de Google pour être viable, est-ce la responsabilité de Google ?

Google n’aurait ainsi pas le droit de modifier son algorithme librement au prétexte que cela met en danger des modèles économiques qui prospèrent sur ses faiblesses ?

Légalement cette liberté est incontestable. Ce n’est que sur le plan moral que l’on peut faire remarquer à Google son hyper puissance.

Car légalement, aussi, Google n’a pas reçu compétence pour exercer une police sur le réseau. Or ses propres résultats de recherches se confondent avec l’organisation du réseau. Dans 85% des cas, la page de Google est le premier intermédiaire entre l’utilisateur et le réseau internet.

Le darwinisme exacerbé du capitalisme a conduit Google à l’ultra domination de la recherche d’information en ligne. C’est le résultat des choix faits par les demandeurs d’informations.

Plus puissant que la Nasa, c’est le plus important réseau informatique au monde avec une puissance de calcul supérieure à toute autre.

La « version béta permanente » que Google se dit vouloir être, implique donc pour ceux qui veulent jouir de son audience d’en faire de même. Cette règle étant posée, Panda n’est qu’un changement parmi d’autres, impliquant des changements parmi d’autres.

Du FAI au FAI

Les fournisseurs d’accès à internet sont en théorie tenus à une neutralité règlementée. Ils ne sont pas responsables de ce qui circule dans les tubes. S’ils influaient sur la rapidité de l’accès en fonction des contenus, ou même s’ils avaient un droit de regard sur ces derniers, c’est le concept même d’internet qui serait affecté, voire ébranlé. [Ce que prépare l’ACTA pourtant]

Du côté des fournisseurs d’accès à l’information c’est très différent. Nul ne s’acquitte d’un abonnement pour jouir du service de recherche d’information [financement indirect via la régie publicitaire]. Pourtant l’accès à l’information est corrélé à l’accès au réseau.

Dans l’accès au réseau il y a une dimension politique (règles posées par les Etats); dans l’accès à l’information, seules prévalent les règles économiques. [On exclut ce qui régit l’édition de contenu en ne parlant que de l’accès].

Google a tenté de faire croire qu’il était neutre, mécanique et qu’il n’influençait pas ses résultats en fonction de ses propres intérêts. On sait aujourd’hui que c’est faux.

Sa position monopolistique génère des conflits d’intérêts. Et ces derniers, au nom du respect de la neutralité d’accès à l’information, dépassent largement le cadre privé et les critères décidés par Google.

Dans le Far West des SERPs, nul état d’âme

Quadrature du cercle oblige. Tout le monde essaie de baiser Google, c’est le jeu. White Hat et Black Hat ont le même objectif : modifier les résultats de recherche en leur faveur.

On ne peut guère influer sur les fournisseurs d’accès à internet. A l’inverse Google est une proie permanente. C’est même un métier de le niquer.

Par définition cet accès à l’information est faussé, biaisé, manipulé. C’est une jungle non régulée par une autorité supérieure avec ses gardes fous.

Comble de l’ironie capitaliste, c’est la concurrence la plus libre qui a permis de générer ce vaste monopole, comme le fruit amère d’un Gosplan de l’époque soviétique.

Google est à la fois fournisseur d’accès et régulateur de cet accès : juge et partie. Sauf exception comme la Chine, les Etats ne veulent aucun droit de regard sur la recherche d’information ; ayant décidé qu’il s’agissait d’une sphère strictement privée (sauf quand la « base de données de nos intentions » intéresse de près les agence de renseignements).

Il n’y a donc aucun reproche de conflit d’intérêt à faire à Google dès lors que l’on considère que la neutralité d’accès à l’information est exclue de la sphère publique et politique.

En protégeant ses intérêts, (J. Berard), Google est liberticide (L. Bourrelly) ; parce qu’il s’avance toujours plus loin dans le paradoxe qui veut accoupler pertinence et neutralité à une stricte logique économique.

 

13 réflexions au sujet de « L’ingrédient secret de Panda »

  1. Mon article est véritablement résumé a la serpe tout de meme! J’ai l’impression que tout le monde a zappé la 1ere partie sur ce que c’est que le contenu de « qualité ».

    Sinon tu touche effectivement du doigt une partie du probleme que j’avais éludée qui est l’importance du role pris par GG dans la vie de l’internet. role que finalement « nous » (internautes) lui avons donné.

    Le fait effectivement aussi que GG prone une « pseudo » (certains sujets sont filtré sur Google) neutralité qui a effectivement du mal a exister avec le fait que GG soit une compagnie privée destinée a faire des bénéfices meme si elle est terriblement nécéssaire a GG dans son business model.

  2. Je n’avais pas du tout vu la problématique générée par Panda sous cet angle. Un Panda mécanique serait à tout prendre plus objectif qu’un filtre humain de la qualité des textes.
    Ce qui me gêne, c’est que les gens qui rédigent ce contenu prêt a lire qui est censé être visé par Google le fournisse en résultats, alors pourquoi vouloir les laminer.

  3. @Lejuge
    Je me suis appuyé sur vos angles de vues divergents, c’est ce que je trouvais le plus « fécond ». Pour la qualité des contenus, après, j’ai l’impression qu’il y a consensus.
    Le Skyblog de Kevin est une autre facette de la page Wikipédia sur la Société du spectacle et ni l’un ni l’autre n’ont à être séparés comme le grain de l’ivraie par une quelconque autorité auto-proclamée « police qualité internet ».
    Un bémol sur le critère, (ça vaudrait tout un billet), je ne suis pas certain que l’audience soit l’indice unique de la qualité.

  4. Le jour ou tu publies tout un billet sur la qualité du contenu (CF. Bemol sur le critere) préviens moi.. ca risque d’etre un débat bien soutenu

  5. En fait, mon propos est surtout de mettre en question la capacité du moteur à jauger la qualité d’un contenu et du site qui l’héberge. Ce sont les signaux utilisés qui me laissent perplexes.
    L’autre problème se réfère comme toujours à l’ultra domination de Google. Comme tu le suggères, il est possible d’aller voir ailleurs. Sauf que pas vraiment en fait. Tout du moins en attendant que Bing se bouge réellement le fion. Les résultats aux USA (30% des parts de marché apparemment) sont prometteurs, mais cela fait déjà des lustres que je bosse à m’éloigner du Diktat de Google en accumulant des vecteurs de trafic ailleurs.
    Ta conclusion est très juste et l’ironie capitaliste n’a pas fini de faire chier.

  6. Pour la première fois je lis un article qui parle du référencement en termes de philosophie politique. Félicitations pour votre recul interprétatif. Il y a beaucoup de choses qui sont bizarres dans cette domination et monopole de GG sur le web et une analyse comme la votre arrive à jeter UN regard éthique sur la question. Encore bravo !

    • Merci pour ce commentaire!
      Effectivement, « réduire » la question du référencement à du webmarketing, (SEO étant partie du SEM) est très anglo-saxon. La pratique du SEO est d’ailleurs souvent attachée au vieux fantasme de faire du fric plus ou moins facile sur le net. (Le paroxysme en la matière n’étant pas d’ailleurs un SEO mais Webmarketing Junkie je crois^^).
      Un vieil esprit européen n’aborde pas forcément la recherche d’information et son organisation comme une « mise en valeur payante ».
      La portée politique de l’organisation de l’information n’a pas moins d’impact que la production de l’information elle-même. On prépare d’ailleurs un billet sur cet impact politique de la visibilité de l’information, notamment sur la relation israélo-palestinienne dans les SERPs ou encore la stratégie SEO du Front National contre ses détracteurs. A suivre…

      • J’ai hâte de lire ce nouveau billet. Je dirais même que la production de l’information, mais aussi de richesses ^^, en bon foucaldien, est un effet du politique et de ses « agissements » incontrôlables par lui-même. Car GG est un effet de pouvoir comme tout autre instrument globalisant des USA : comme les marins en Afganistan ou Irak. Nous, et tant que webmarketeurs, on pense le « manipuler », mais de fait nous sommes manipulés et notre marge de manoeuvre est bien surveillé et dosé en Californie. Car s’il reste que de sites poubelle sur le net GG n’aurait pas de raisons de montrer leur volonté d’amélioration du web, qui n’est autre chose qu’une bonne vielle campagne de marketing « orienté client ».v

  7. Bonjour à tous, merci pour ce post très intéressant. Je débute dans le référencement avec mon site.

    Je suis novice dans la matière et j’ai une question :

    Est-ce que le content spining est aussi mal considéré lorsqu’il s’agit d’un seul et meme site ?

    Par exemple moi je vends de l’extension capillaire. Il y a 2 synonymes « rajout de cheveux » et « extensions de cheveux ». J’essaye de référencer le même produit avec (2 déclinaisons différentes sur des couleurs)
    Donc :
    page 1 on a : rajout de cheveux blond platine
    page 2 on a : extensions de cheveux noir
    La définition est la même avec ces kw qui changent.

    Le même texte de description avec les mots clés principaux changés. Le sens du texte est correct.

    A votre avis mieux vaut’il spinner son propre contenu et avoir des pages de la même catégories référencées sur différents mots clés. Ou avoir 40 pages de produits avec définition et mots clés similaires?

    Content spining ou duplicata de content ?

    Merci d’éclairer mes errements de novice !

  8. Bonjour,

    Bravo pour ce billet, qui apporte un angle de vue complémentaire aux réflexions que j’ai pu avoir sur Google Panda ici : http://crowdsourcing.media-internaute.com/post/2011/05/11/Webmaster-esclave-ou-webmaster-aveugle

    Réflexion et prise de recul sont les maîtres-mots qui doivent contrer les phénomènes d’immédiateté et d’immanence (course à l’actu., pas d’analyse ni vérification,prise en compte du seul caractère « originel » d’une info) actuels.

Les commentaires sont fermés.