Big Data (Mining), CIA et Google unis pour la liberté surveillée

Il s’agit ici de rassembler quelques notes et sources glanées au fil des jours. C’est moins un post en tant que tel que de la prise de note pour un travail ultérieur. Bien sûr, les commentaires ou compléments d’informations sont toujours les bienvenus.

Point de vue et angle d’observation

Tout d’abord l’exercice consiste à ne pas considérer Amazon comme un commerçant, Google comme un moteur de recherches ni Facebook comme un réseau social. Dans la problématique c’est marginal. Observons-les comme des vastes collecteurs de données (data) sur les individus (et la société par voie de conséquence).

Techniques marketing et sécuritaires, la passion des data

Les deux secteurs génétiquement centrés sur la surveillance des comportements sont la défense (sécurité) et le commerce (marketing). L’essor de la société data-centrique (terme emprunté à Pierre Lévy), rendu possible par le numérique, a permis au second de prendre de l’avance par rapport au premier ; cette période pourrait commencer symboliquement le 11 septembre 2001.

Les principaux services de sécurité des USA en ont pris la mesure. Ils bénéficient depuis 2001 du soutien inconditionnel du législateur. Non seulement avec les Patriot Act I et II, mais aussi avec le Stored Communications Act concernant le stockage des données électroniques. Cette loi permet à l’Etat d’obtenir copie de toute archive électronique sans passer par le cadre judiciaire (contournant ainsi le 4ème Amendement).

La notion d’archive semble frappée d’incomplétude alors que numériquement tout se joue en temps réel ou presque. Tout est question de kairos, de moment opportun. Le FBI peut s’appuyer sur le titre III de la loi Omnibus Crime Control and Safe Streets Act de 1968 pour intercepter une communication. Cela semble encore trop long.

Aussi l’institution fédérale veut-elle faire voter une loi lui ouvrant un accès immédiat à toute communication de type mail, VoIP, messagerie instantanée, etc. Il s’agirait alors de prendre connaissance de l’information à l’instant même où elle se forme.

Big Data, petite sœur obèse de Big Brother ?

Le vieux stockage de données à distance a été lifté par les marchands pour devenir il y a peu le Cloud (Ils sont trop forts ces voleurs 2.0…). Ca consiste à confier ses données à des entreprises qui mettent (parfois) à disposition des services de traitement de données (data mining).

Toute information stockée sur le sol américain est soumise à sa réglementation fédérale. C’est peu dire donc que la CIA avoue partager les mêmes enjeux que les firmes commerciales : Big Data is a Big Deal at the CIA, le service de renseignement recrute toute personne pouvant l’aider dans la fouille de données.

L’intérêt de la CIA pour le Big Data est transparent. Il suffit d’écouter Gus Hunt, CTO de l’agence. Il ne parle pas d’une réalité éclatée, hétérogène, éparpillée. Il parle d’une réalité formant pour lui une entité à maîtriser : le Big Data. L’enjeu est donc de contrôler la totalité des données produites sur le web. Il suffit d’écouter l’amiral John Poindexter :

« Notre objectif est de traiter toutes les bases de données éparpillées dans le monde comme un seul fichier ». 

A ce titre Gus Hunt le bien nommé rappelle la difficulté de mesurer le Big Data. En 2009/2010, Google stockait dans les 100 pétaoctets (Po), soit 1 000 000 000 000 000 octets de contenus html. Côté Youtube, (Google toujours), c’est d’après Gus Hunt plus d’un exaoctet, 124 milliards de tweets par an, ou 35% des photos mondiales stockées sur Facebook. Voir son intervention filmée.

C’est dans cette lignée que la CIA 2.0 semble avoir passé un accord de Cloud Computing avec Amazon pour un montant de 600 000 000 $ sur 10 ans. Amazon aiderait la CIA à construire un cloud privé afin de traiter Big Data et d’atteindre l’objectif fixé par Gus Hunt :

« Maintenant, le temps est proche où nous serons en mesure de traiter tous les types d’informations créées par l’homme »

La CIA sur ce point, partage avec les fondateurs de Google un dessein commun. Derrière le paravent orienté utilisateur, la franche collaboration entre marchands et services de défense US est une réalité plus crue bien que plus discrète.

Dans ce contexte de contrainte légale, l’EFF (Electronic Frontier Foundation) ne peut que déplorer sa propre impuissance, quand par exemple Google communique des échantillons de surveillance demandés par le FBI.

Internet of Everything, la prochaine ruée vers l’or (data)

Internet est en voie de disparition. Le réseau est de plus en plus centralisé sur quelques serveurs et personne ne dispose d’IP public sur un téléphone mobile. De son côté le web décline, remplacé peu à peu soit par des applications sur mobile, soit par des services web remplissant la même fonction comme Knowledge Graph ou Flight Search.

La prochaine question est l’extension du réseau à la connexion aux objets. La domotique connectée représente un marché gigantesque, totalement disruptif et fortement attractif. On le voit par exemple avec la Google Car ou les Google Glass (comme nouvel instrument de gouvernance ?). On aperçoit pour la première fois les contours d’un réseau post écran s’adaptant à toute surface, notamment tout ce qui sert à « voir au travers ».

Il s’agit des prémisses d’une humanité augmentée par des prothèses censées devenir intelligentes à terme. C’est une « transhumanité » embryonnaire (technologie BodyCom par exemple). Tout est réseau, le corps comme les objets.

On voit ainsi Cisco annoncer ses projets, comme de relier 50 milliards d’objets d’ici 2020 pour un marché estimé à 14,4 trillions $. Le slogan « Internet of everything » (acronyme IoE) se suffit à lui-même, il est simplement total, absolu.

Mais que deviendraient les données de ce nouveau réseau ? On sait déjà tout ce qui peut être fait à partir d’un « simple » web. La société de défense Raytheon commercialise par exemple son logiciel RIOT (Rapid Information Overlay Technology) qui offre un service prédictif du comportement d’un individu fiché sur les réseaux sociaux.

Ce qui serait donc nommé expansion d’internet aux objets serait aussi (et peut-être surtout) une extension du plus vaste réseau de surveillance jamais réalisé.

La convergence entre l’intérêt de l’Etat sur le plan sécuritaire et le commerce en ligne, est trop forte pour n’être pas mise à plat. Et en particulier l’Etat américain, qui récolte aujourd’hui les dividendes de son investissement à travers la DARPADefense Advanced Research Projects Agency) et ARPANET (1962), qui a abouti au réseau Internet avec le concours de l’ingénierie civile.

Le web n’offre qu’une liberté surveillée; tous coupables, mais de quoi ?

En général, la notion de « liberté surveillée » est diminuée par rapport à la notion simple et fondamentale de « liberté », règle première des démocraties occidentales en théorie. Il s’agit d’une mesure coercitive ordonnée par décision judiciaire pour surveiller un individu condamné, mais n’ayant pas vocation à une privation totale de sa liberté : l’enfermement.

En France la surveillance électronique mobile (PSEM) est visée par la loi de décembre 2005 sur la récidive des infractions pénales. Le bracelet électronique est muni d’une puce, un tracker, (une sorte de cookie en somme), qui permet de connaitre les déplacements. La finalité est évidement coercitive.

Mais d’un point de vue commercial, quelle différence avec la navigation sur le web. L’IP est bien enregistré, stocké et les « déplacements » sur le web sont trackés et analysés. Mon IP a bien quelque point commun avec ce bracelet électronique.

Et pourtant sans condamnation, sans violation de la loi, et sans procès. L’internaute est soumis à un régime de liberté surveillée, comme s’il avait commis une infraction pénale. Il est bien libre d’aller sur les pages html qu’il veut ; pour autant, elles sont enregistrées et analysées pour connaitre son profil comportemental. Ce dernier servira à pousser vers lui, le consommateur, des offres d’achat sur mesure, à plus forte probabilité transactionnelle.

Si d’un côté internet a bien permis une forme d’émancipation par l’accès de l’écrit public à tout un chacun, le partage de connaissances, la facilité de rencontres et de dialogues, de l’autre, qu’en est-il ?

De quoi donc serions-nous coupables pour que nos déplacements web soient par défaut, enregistrés et dépouillés ? Pourquoi un salarié californien saurait-il tout de mes goûts et de mes désirs, sans le moindre consentement éclairé de ma part ? Quelle faute originelle aurais-je pu commettre pour être ainsi surveillé dans les rues du réseau ?

Je serai ainsi condamné, par défaut et sans tribunal, à une semi-liberté. Pour moitié je vais où je veux. Pour l’autre une tierce personne que je ne connais pas, sait partout où je vais, ce que je fais, ce que je dis et ce que je désire.

Voilà devenu le prix exorbitant de la liberté sur internet, sauf à posséder un niveau assez avancé pour espérer contourner le dispositif de surveillance.

Il suffit d’extrapoler et d’exporter ce modèle à l’internet des objets pour dessiner une société de plus en plus ambiguë sur la préservation des libertés fondamentales. Car de ce modèle ne demeure qu’une illusion de liberté. A chacun de vouloir ou non s’en contenter, mais au moins, en toute connaissance de cause.

 

 

 

7 réflexions au sujet de « Big Data (Mining), CIA et Google unis pour la liberté surveillée »

  1. A noter que les questions de vie privée et de big data (et donc de traitement très fortement statistique des bases de données) donnent du travail au chercheur que je suis. Une sous-discipline nouvelle en informatique est la « differential privacy ». Il s’agit de mettre en place des mécanismes de big data qui garantissent que l’on ne puisse pas « deviner » les données atomiques (=les données privées des personnes) à partir des données statistiques qui en découlent. Par exemple, on ne doit pas pouvoir deviner les données d’une personne en regardant les statistiques de la base avec et sans ces données. Inutile de dire que le domaine est nouveau et que les problèmes associés sont difficiles tant théoriquement que techniquement.

    • Merci beaucoup pour cette info sur le « differential privacy ». Je la vois apparaître dès juillet 2006 chez Microsoft (?). Sylvain tu sembles évoquer les moyens. Ils permettraient de séparer la source de connexion de l’individu (si je comprends sommairement). Mais qu’en est-il de la finalité ? Entre nous, de la fin dernière de ces collecteurs de données ?

      • Oui, c’est une chercheuse d’un labo de microsoft qui en parle pour la première fois. J’en profite d’ailleurs pour dire que microsoft a une approche beaucoup plus saine de la R&D, avec des labos vraiment plus libres et sans arrières pensées.
        Je ne suis pas sur de comprendre ta question sur la finalité. La finalité du differential privacy est de fournir des outils pour éviter le flicage tout en gardant le « bénéfice » de l’approche statistique pour la société.
        Si on parle de la finalité de l’approche big data chez les big players (entreprise ou état), je pense que le concept de dérive totalitaire et celui de l’alinéation de la société par elle-même sont ceux qui conviennent le mieux pour décrire ce que j’en pense.

        • Oui c’est ce que je demandais justement sur cette finalité. Collecter des données sans atteinte à la vie privée. Je ne comprends pas bien comment cela serait possible. Il faudrait décrire plus précisément le process à l’occasion ce serait intéressant. Pour la vision plus vaste oui, je partage aussi cette approche de l’aliénation par soi-même (entendu société). Mais j’y mets un bémol quand cette organisation est fondée sur l’ignorance et surtout l’entretien de cette ignorance. On peut dire que l’individu manque de curiosité, d’implication et sacrifie volontiers son confort à sa liberté. Cela étant l’affaire de Free a fait exploser les téléchargements d’Adblock par exemple et moins de la moitié des utilisateurs font la différence entre des Ads et l’organique. Il y a une réelle volonté de masquer la vérité en faisant confondre les deux types de résultats. Tout un débat en somme… Pour la dérive totalitaire je serais plus « diplomate » en parlant de dérive « totalisante » mais c’est de la nuance 😉

          Au fait comment as-tu accueilli la nomination de Gérard Berry au Collège de France à la chaire « Algorithmes, machines et langages » ?

  2. On se croirai vraiment dans un roman d’anticipation de mauvais gout, c’est assez effrayant tout ça quand même! Que faudra donc-t-il faire pour ne pas subir tout ça, se déconnecter totalement? Facile à dire, mais trop dur à faire…

  3. De toute façon, quoi qu’on fasse on est fliqué, même si t’es tranquille en train d’élever des chèvres en Ardèche, Google Maps viendra te photographier, et quand ton chien ira se baigner et laissera des traces d’eau sur un ponton, tout le monde dira que c’est une scène de crime qui a été photographiée par Google Maps (histoire véridique au Pays-bas!)

  4. Passionnant et effrayant. Mais il est vrai que tout cela est mis progressivement en place depuis quelque temps. A se demander parfois si l’incitation perpétuelle à se connecter pour un oui ou pour un non n’a pas été faite pour accélérer la collecte des données, en plus des histoires des gros sous : la mise en place de la 4G par exemple sans études sanitaires (ou le mépris de celles qui ne vont pas dans le bon sens) en est un exemple. On met la charrue avant les boeufs histoire de ne plus pouvoir reculer une fois que tout le monde est accroc. D’ailleurs à ce sujet, combien envisagent encore de n’avoir aucun accès au net ne serait-ce que pendant une semaine? La surveillance est banalisée (ça a commencé avec la multiplication des caméras de surveillance) et la réflexion se limite souvent à « je n’ai rien à me reprocher » ou « si c’est autorisé c’est que c’est sans danger » (pour la 3/4G)… Les Googleglass annoncent l’horreur absolue sans beaucoup émouvoir …
    Enfin, concernant l’exploitation des données, il n’est pas sûr en plus qu’une récolte exponentielle favorise l’interprétation de données sensibles (au moins en terme de « sécurité » (commercialement, c’est autre chose). On l’a vu avec échelon. Les « délinquants » et autres « terroristes » qui servent d’alibi à cette surenchère de flicage utilisent/utiiseront d’autres moyens pour communiquer.

Les commentaires sont fermés.