Vulgarisation web2.0 : portabilité des données, la bataille idéologique

7 11 2008

L’idéologie se situe en fait au sein de toutes les autres ‘batailles’ ou interrogations autour de la portabilité des données, qu’il s’agisse de savoir s’il est correct de gagner de l’argent sur les informations fournies par les internautes sans que ceux-ci ne sachent vraiment ce qui est fait de ces données, qu’il s’agisse de s’interroger sur la légitimité de tel ou tel acteur ou sur ses vues de domination, de questionner l’avenir de la protection des données personnelles ou de s’interroger sur la notion d’identité digitale. Si les usages déterminent les services, les questions d’idéologie, de morale et de savoir-vivre conditionnent et bornent ces usages.

S’il est un nom qui est sur toutes les lèvres depuis quelques années c’est bien ‘Google’, l’hégémonie de cette entreprise est telle qu’elle en ferait presque oublier le géant Microsoft, qui passe pour être l’outsider le plus notable dans l’écosystème du web. Hubert Guillaud relate sur InternetActu un article de Nicolas Carr faisant état d’un concept tout à fait intéressant, connu mais à qui il donne un nom : le web centripète. S’appuyant sur la définition du terme centripète par Isaac Newton (« La force centripète est celle par laquelle un corps est attiré ou poussé vers un point quelconque considéré comme un centre ») , celui-ci détaille la manière dont Google a su se hisser au rang de super-puissance numérique en jouant presque naturellement le rôle de centre de-facto du web mondial grâce à la multitude de services qu’il propose, tous intégrés les uns aux autres.

En laissant le choix aux utilisateurs mais en n’ayant de cesse de leur rappeler furtivement qu’il est là, le mastodonte a réussi le tour de force d’être le chef d’orchestre de la popularité numérique via le fonctionnement de son moteur de recherche qui transcende le lien hypertexte (plus un site est populaire plus il le deviendra et inversement) en générant une force de convergence inéluctable là où le web se voulait à l’origine plat et divergent. Google est le centre de la popularité, de loin le plus puissant moteur de publicité du monde, ses services Google Mail, Google Reader, Google Desktop ou Youtube sont dans leur domaine les outils les plus globalement plebiscités, Google Maps est de loin l’API la plus utilisée par les milliers de mashups créées aussi bien par les développeurs indépendants que par les autres services web et même le marché des navigateurs web commence à frissonner devant la sortie de Google Chrome. Google nous tient. Les APIs Google Friend Connect, OpenSocial ou SocialGraph sont utilisées afin de créer des greffons universels, ramener l’ensemble des informations de réseau social vers leur éditeur, découvrir où sont cachées les données des utilisateurs afin de mieux les centraliser. Le roi du monde ne serait-il bientôt plus le président des Etats-Unis, mais le CEO de Google ?

Si Google centralise les données, il décentralise le réseau social : n’ayant pas vu venir à temps la vague (son service Orkut, relativement absent en Amérique du nord, en Europe, en Asie et en Afrique est cependant de loin le premier réseau social d’Amérique du sud), il tente tout de même de garder une main sur ces précieuses informations avec Google Friend Connect. Facebook a le fonctionnement inverse puisqu’il centralise le graphe social en autorisant la décentralisation des données, mais puisqu’il les aggrège sur son service il garde tout de même un œil intéressé dessus. Les deux travaillent à la centralisation de l’identité. La portabilité des données, elle, aimerait décentraliser le graphe social, les données, et l’identité au profit des utilisateurs, soucieux de reprendre le contrôle de leur vie digitale, surtout lorsque l’on relève que 80% d’entre eux prétendent n’avoir jamais diffusé d’informations personnelles en ligne alors que le constat est tout autre (source : Orange Business blog sécurité).

L’importance de savoir qui, demain, contrôlera nos données, de quelle manière et ce qu’il en fait est d’autant plus fondamentale que les informations extraites avec ou sans notre consentement se multiplient de manière vertigineuse. Le web connait notre identité, nos amis, nos centres d’intérêts, nos habitudes de navigation, de lecture, là où nous intervenons, ce que nous consommons et la manière dont nous le faisons. Notre mobile, via l’opérateur ou le constructeur c’est selon, qui fait de plus en partie intégrante de notre accès au web, peut déterminer d’après notre facture téléphonique le type de relations que nous entretenons avec notre carnet d’adresse, qu’il connaît par ailleurs parfaitement, il peut nous localiser et il va le faire de plus en plus, connaissant plus que notre position géographique il est capable de savoir ce qu’il y a en face de nous, avec qui nous marchons dans la rue et quels sont nos trajets quotidiens. Les possibilités offertes semblent autant sources d’ébahissement que d’appréhension parfaitement légitime.

Le prospectiviste américain Howard Rheingold affirmait déjà en 2005 sur LeMonde.fr, et on veut bien le croire, que « Dans dix ans, la notion de vie privée telle que nous la définissons n’existera plus. », il est encore temps de trouver des solutions pour qu’elle reste un minimum sous contrôle.





Vulgarisation web2.0 : les origines de la portabilité des données

6 11 2008

Le graphique ci-dessous (voir ici pour une version lisible), créé d’après une matrice Excel, un script Perl et l’outil GraphViz, représente les principaux flux d’informations au sein de mon réseau de services web, n’y sont représentés que les services que j’utilise le plus souvent, au moins une fois par semaine, on y distingue en turquoise les nœuds que je mets moi-même à jour soit directement (ex : flickr) soit indirectement par mon utilisation du service (ex : last.fm), sous forme d’octogones les nœuds recevant plus de 5 flux (aggrégateurs, concentrateurs) et en contour gras les nœuds n’émettant pas de données (récepteurs), un nœud spécifique nommé ‘RSS feeds’ représente à lui seul l’ensemble des flux d’informations externes que je lis quotidiennement :

out

Figure Les flux d’information de mon réseau de services web

Ce paquet de nouilles n’est pas exhaustif mais permet déjà de se rendre compte de l’éparpillement et du nombre de services que j’utilise presque au quotidien en étant certes un utilisateur avancé mais non compulsif et peu prolifique. Je suis symbolisé par le nœud le plus haut et les deux nœuds les plus bas représentent d’une part le public, la communauté, l’ensemble des internautes potentiellement intéressés par mes informations et mes données et d’autre part mes amis, ma communauté privée qui revêt en fait un caractère multiple selon les services.

Je possède un compte utilisateur par service, généralement un avatar, j’ai ajouté un certain nombre d’informations personnelles, de liens et de références sur chacun de ces sites, j’ai téléchargé des photos, mis à jour des textes, posté des vidéos et des commentaires, déposé mes avis et envoyé des dizaines de messages, créé presque autant de réseaux sociaux dédiés que de nœuds présents sur ce graphe. Je suis pourtant dans l’incapacité presque totale de lister mes contributions, mes données et mes médias, je n’ai quasiment aucun contrôle sur mes données, leur référencement ni sur l’utilisation qui est en faite.

Si un service venait à fermer, disons Facebook, je perdrais tous les contacts que j’ai accumulés au cours du temps, toutes les informations que j’ai échangées avec ce réseau d’amis, je perdrais peut-être même de vue certaines personnes avec lesquelles je ne possède qu’un lien très mince, mais qui m’importe, au travers de ce réseau. Si je change d’avis à propos d’une opinion quelconque, ce qui m’arrive sans arrêt, par exemple concernant un article déposé sur mon blog que je ne souhaiterais plus voir lu, je pourrais certes le supprimer de mon blog mais il aura entre temps été dupliqué, échangé, diffusé, référencé et archivé à de multiples endroits sans que j’en sois informé et sans que je n’ai aucun contrôle (ou presque) sur sa longévité.

J’ai redécouvert aujourd’hui, en écrivant, le service Twine permettant d’indexer sémantiquement et de partager tout type d’information du web, j’ai réactivé mon compte et commencé à manipuler un peu le service, mais ce que je souhaiterais à présent c’est partager ces informations, échanger avec mon réseau, avec mes amis, mes contacts, mes collègues, il faut alors que j’envoie une palanquée d’invitations, soit en me souvenant de leur adresse mail, soit en me loguant depuis Twine sur mes quatre ou cinq comptes mail, bref il me faut reconstruire un nouveau réseau social sur Twine au risque d’ennuyer ces amis à qui j’envoie régulièrement ce genre d’invitations, entrer à nouveau mes informations personnelles après m’être créé un compte supplémentaire, charger un nouvel avatar et recommencer à approvisionner mon espace utilisateur avec des données que j’aurais parfois sans doute déjà sauvegardées sur del.icio.us ou Google Reader…

Lorsque j’étais adolescent j’avais écrit un certain nombre d’articles, de poêmes, j’avais rédigé des commentaires, diffusé des photos de moi en soirée ou exprimé des opinions avec lesquelles je suis à présent en désaccord et cet ensemble d’informations pourrait très bien s’avérer néfaste si je recherche un nouveau poste et que mon employeur commence à fouiller dans les archives du web, et pourtant à l’époque le web ne ressemblait pas à ce qu’il est aujourd’hui avec la profusion de services et l’exposition de soi que l’on constate actuellement. En me mettant à la place d’un adolescent d’aujourd’hui, qui cultive son réseau sur Myspace, qui écrit sa rebellion au système, diffame ses professeurs ou diffuse des photos et des vidéos de lui-même, j’imagine l’inconfort qui pourra être le sien dans quelques années lorsqu’il recherchera du travail et que tous les employeurs auront pris l’habitude de fouiller un peu sur Google… Mais même sa vie privée digitale pourra s’en trouvée compliquée, peut-être n’a-t’il pas envie que ses anciens amis de Myspace le retrouvent sur Facebook, autre époque autres amis…

Le concept de portabilité des données et les efforts autour du web sémantique essaient de trouver des solutions à toutes ces problématiques, en tentant de décentraliser le réseau social, le rendant indépendant du service mais gérable depuis n’importe lequel d’entre eux, en essayant de rendre les données échangeables et manipulables de n’importe quel endroit du réseau, en proposant une gestion centralisée de l’identité et des données tout en décentralisant le contenu et les médias eux-mêmes. Bref en oeuvrant pour rendre à l’utilisateur le contrôle total de ses données et de son identité.