Vulgarisation web2.0 : portabilité des données, la bataille idéologique

7 11 2008

L’idéologie se situe en fait au sein de toutes les autres ‘batailles’ ou interrogations autour de la portabilité des données, qu’il s’agisse de savoir s’il est correct de gagner de l’argent sur les informations fournies par les internautes sans que ceux-ci ne sachent vraiment ce qui est fait de ces données, qu’il s’agisse de s’interroger sur la légitimité de tel ou tel acteur ou sur ses vues de domination, de questionner l’avenir de la protection des données personnelles ou de s’interroger sur la notion d’identité digitale. Si les usages déterminent les services, les questions d’idéologie, de morale et de savoir-vivre conditionnent et bornent ces usages.

S’il est un nom qui est sur toutes les lèvres depuis quelques années c’est bien ‘Google’, l’hégémonie de cette entreprise est telle qu’elle en ferait presque oublier le géant Microsoft, qui passe pour être l’outsider le plus notable dans l’écosystème du web. Hubert Guillaud relate sur InternetActu un article de Nicolas Carr faisant état d’un concept tout à fait intéressant, connu mais à qui il donne un nom : le web centripète. S’appuyant sur la définition du terme centripète par Isaac Newton (« La force centripète est celle par laquelle un corps est attiré ou poussé vers un point quelconque considéré comme un centre ») , celui-ci détaille la manière dont Google a su se hisser au rang de super-puissance numérique en jouant presque naturellement le rôle de centre de-facto du web mondial grâce à la multitude de services qu’il propose, tous intégrés les uns aux autres.

En laissant le choix aux utilisateurs mais en n’ayant de cesse de leur rappeler furtivement qu’il est là, le mastodonte a réussi le tour de force d’être le chef d’orchestre de la popularité numérique via le fonctionnement de son moteur de recherche qui transcende le lien hypertexte (plus un site est populaire plus il le deviendra et inversement) en générant une force de convergence inéluctable là où le web se voulait à l’origine plat et divergent. Google est le centre de la popularité, de loin le plus puissant moteur de publicité du monde, ses services Google Mail, Google Reader, Google Desktop ou Youtube sont dans leur domaine les outils les plus globalement plebiscités, Google Maps est de loin l’API la plus utilisée par les milliers de mashups créées aussi bien par les développeurs indépendants que par les autres services web et même le marché des navigateurs web commence à frissonner devant la sortie de Google Chrome. Google nous tient. Les APIs Google Friend Connect, OpenSocial ou SocialGraph sont utilisées afin de créer des greffons universels, ramener l’ensemble des informations de réseau social vers leur éditeur, découvrir où sont cachées les données des utilisateurs afin de mieux les centraliser. Le roi du monde ne serait-il bientôt plus le président des Etats-Unis, mais le CEO de Google ?

Si Google centralise les données, il décentralise le réseau social : n’ayant pas vu venir à temps la vague (son service Orkut, relativement absent en Amérique du nord, en Europe, en Asie et en Afrique est cependant de loin le premier réseau social d’Amérique du sud), il tente tout de même de garder une main sur ces précieuses informations avec Google Friend Connect. Facebook a le fonctionnement inverse puisqu’il centralise le graphe social en autorisant la décentralisation des données, mais puisqu’il les aggrège sur son service il garde tout de même un œil intéressé dessus. Les deux travaillent à la centralisation de l’identité. La portabilité des données, elle, aimerait décentraliser le graphe social, les données, et l’identité au profit des utilisateurs, soucieux de reprendre le contrôle de leur vie digitale, surtout lorsque l’on relève que 80% d’entre eux prétendent n’avoir jamais diffusé d’informations personnelles en ligne alors que le constat est tout autre (source : Orange Business blog sécurité).

L’importance de savoir qui, demain, contrôlera nos données, de quelle manière et ce qu’il en fait est d’autant plus fondamentale que les informations extraites avec ou sans notre consentement se multiplient de manière vertigineuse. Le web connait notre identité, nos amis, nos centres d’intérêts, nos habitudes de navigation, de lecture, là où nous intervenons, ce que nous consommons et la manière dont nous le faisons. Notre mobile, via l’opérateur ou le constructeur c’est selon, qui fait de plus en partie intégrante de notre accès au web, peut déterminer d’après notre facture téléphonique le type de relations que nous entretenons avec notre carnet d’adresse, qu’il connaît par ailleurs parfaitement, il peut nous localiser et il va le faire de plus en plus, connaissant plus que notre position géographique il est capable de savoir ce qu’il y a en face de nous, avec qui nous marchons dans la rue et quels sont nos trajets quotidiens. Les possibilités offertes semblent autant sources d’ébahissement que d’appréhension parfaitement légitime.

Le prospectiviste américain Howard Rheingold affirmait déjà en 2005 sur LeMonde.fr, et on veut bien le croire, que « Dans dix ans, la notion de vie privée telle que nous la définissons n’existera plus. », il est encore temps de trouver des solutions pour qu’elle reste un minimum sous contrôle.





Vulgarisation web2.0 : la guerre des données aura-t’elle lieu ?

7 11 2008

D’après Google Insights, le terme ‘Dataportability’ existe depuis le début du mois de décembre 2007, mais le début de sa réelle légitimité se situe plus vraisemblablement le 4 janvier 2008, lorsque Google, Plaxo et Facebook rejoignent officiellement le groupe Dataportability.org fondé par Chris SAAD quelques semaines auparavant. Il seront bientôt rejoints par LinkedIn, Twitter, Flickr, Microsoft, Digg, Six Apart, Seesmic, Myspace et d’autres. Les objectifs de ce groupe de travail, fondé par des entrepreneurs indépendants du ‘web2.0’, pour leur grande majorité issus de la côté ouest des Etats-Unis, ne sont pas d’inventer de nouveaux standards mais de travailler à concevoir et mettre en œuvre un ‘blueprint’, un canevas dédié aux services désireux de rejoindre le mouvement et leur permettant d’afficher leur compatibilité à la vision véhiculée par la portabilité des données sur le web. Cette vision est mise en œuvre à l’aide de technologies ouvertes existantes comme FOAF (réseau social distribué), les microformats (première mise en œuvre du web sémantique), OpenID (Identification centralisée), XFN (description des relations sociales), OAuth (Authentification), RDF (technologie support du web sémantique), APML (partage de l’ « attention » : échange des goûts et intérêts) ou encore XMPP (protocole libre de messagerie). Le groupe de travail édite des guides de conduite à tenir pour un service voulant participer et s’affirmer portable.

La vision principale de la portabilité des données véhiculée par le groupe de travail de Chris SAAD est de rendre à l’utilisateur le contrôle de ses données, comme expliqué par son leader lorsqu’il a fondé le mouvement, nous avons besoin d’un serveur DHCP (configuration automatique) pour gérer la notion d’identité et d’un système de fichiers distribué pour gérer les données, leur localisation et leur stockage et cela ne sera rendu possible que si au moins deux fonctionnalités existent : un système d’auto-découverte des services et des identités de l’utilisateur et un catalogue de services. Cette vision créé le besoin d’un ‘serveur de profils’ utilisé par des ‘applications sociales’. Le serveur de profils, qui peut lui-même être une application sociale, un service web, contient par exemple les données d’attention, de recommandations, le graphe social de l’utilisateur, ses identités et enfin, et non des moindres, les politiques d’accès aux données.

D’autres initiatives, plus techniques, essaient déjà de faire bouger les choses à l’image de DiSO. Il s’agit d’un jeune projet paravent qui tente d’implémenter certains des concepts du réseautage social décentralisé et de la portabilité des données autour de l’information, de l’identité et de l’intéraction en utilisant les microformats, des APIs standards et des logiciels open-source. Fondée par deux ténors du millieu, Chris Messina et Will Noris, travaillant à présent pour la société Vidoop spécialisée dans la gestion de l’identité centralisée (OpenID), l’initiative s’est fixée comme premières étapes d’implémenter les technologies des microformats, d’OpenID et de OAuth comme greffons à la plate-forme de blogs WordPress autorisant l’extraction automatisée d’informations facilement interprétables par les machines et ajoutant des capacitées de réseau social distribué aux blogs personnels de millions d’internautes.

Sur fond de web sémantique et de monétisation des services web s’ouvre la grande ‘guerre‘ des données dans le monde digital, elle aura lieu sur trois fronts interdépendants, celui de l’idéologie, d’une certaine conception du monde et des usages, celui de l’économie numérique où nos données ont une valeur qui peut amener un élément de réponse dans la recherche du busines plan idéal mais dont l’utilisation devra savoir rester humble et respectueuse de ses utilisateurs et celui de la technologie qui ouvre un peu plus tous les jours l’étendue des possibilités offertes aux entreprises comme aux particuliers mais dont la tâche, fondamentale, semble tout aussi passionnante que titanesque.





Vulgarisation web2.0 : les origines de la portabilité des données

6 11 2008

Le graphique ci-dessous (voir ici pour une version lisible), créé d’après une matrice Excel, un script Perl et l’outil GraphViz, représente les principaux flux d’informations au sein de mon réseau de services web, n’y sont représentés que les services que j’utilise le plus souvent, au moins une fois par semaine, on y distingue en turquoise les nœuds que je mets moi-même à jour soit directement (ex : flickr) soit indirectement par mon utilisation du service (ex : last.fm), sous forme d’octogones les nœuds recevant plus de 5 flux (aggrégateurs, concentrateurs) et en contour gras les nœuds n’émettant pas de données (récepteurs), un nœud spécifique nommé ‘RSS feeds’ représente à lui seul l’ensemble des flux d’informations externes que je lis quotidiennement :

out

Figure Les flux d’information de mon réseau de services web

Ce paquet de nouilles n’est pas exhaustif mais permet déjà de se rendre compte de l’éparpillement et du nombre de services que j’utilise presque au quotidien en étant certes un utilisateur avancé mais non compulsif et peu prolifique. Je suis symbolisé par le nœud le plus haut et les deux nœuds les plus bas représentent d’une part le public, la communauté, l’ensemble des internautes potentiellement intéressés par mes informations et mes données et d’autre part mes amis, ma communauté privée qui revêt en fait un caractère multiple selon les services.

Je possède un compte utilisateur par service, généralement un avatar, j’ai ajouté un certain nombre d’informations personnelles, de liens et de références sur chacun de ces sites, j’ai téléchargé des photos, mis à jour des textes, posté des vidéos et des commentaires, déposé mes avis et envoyé des dizaines de messages, créé presque autant de réseaux sociaux dédiés que de nœuds présents sur ce graphe. Je suis pourtant dans l’incapacité presque totale de lister mes contributions, mes données et mes médias, je n’ai quasiment aucun contrôle sur mes données, leur référencement ni sur l’utilisation qui est en faite.

Si un service venait à fermer, disons Facebook, je perdrais tous les contacts que j’ai accumulés au cours du temps, toutes les informations que j’ai échangées avec ce réseau d’amis, je perdrais peut-être même de vue certaines personnes avec lesquelles je ne possède qu’un lien très mince, mais qui m’importe, au travers de ce réseau. Si je change d’avis à propos d’une opinion quelconque, ce qui m’arrive sans arrêt, par exemple concernant un article déposé sur mon blog que je ne souhaiterais plus voir lu, je pourrais certes le supprimer de mon blog mais il aura entre temps été dupliqué, échangé, diffusé, référencé et archivé à de multiples endroits sans que j’en sois informé et sans que je n’ai aucun contrôle (ou presque) sur sa longévité.

J’ai redécouvert aujourd’hui, en écrivant, le service Twine permettant d’indexer sémantiquement et de partager tout type d’information du web, j’ai réactivé mon compte et commencé à manipuler un peu le service, mais ce que je souhaiterais à présent c’est partager ces informations, échanger avec mon réseau, avec mes amis, mes contacts, mes collègues, il faut alors que j’envoie une palanquée d’invitations, soit en me souvenant de leur adresse mail, soit en me loguant depuis Twine sur mes quatre ou cinq comptes mail, bref il me faut reconstruire un nouveau réseau social sur Twine au risque d’ennuyer ces amis à qui j’envoie régulièrement ce genre d’invitations, entrer à nouveau mes informations personnelles après m’être créé un compte supplémentaire, charger un nouvel avatar et recommencer à approvisionner mon espace utilisateur avec des données que j’aurais parfois sans doute déjà sauvegardées sur del.icio.us ou Google Reader…

Lorsque j’étais adolescent j’avais écrit un certain nombre d’articles, de poêmes, j’avais rédigé des commentaires, diffusé des photos de moi en soirée ou exprimé des opinions avec lesquelles je suis à présent en désaccord et cet ensemble d’informations pourrait très bien s’avérer néfaste si je recherche un nouveau poste et que mon employeur commence à fouiller dans les archives du web, et pourtant à l’époque le web ne ressemblait pas à ce qu’il est aujourd’hui avec la profusion de services et l’exposition de soi que l’on constate actuellement. En me mettant à la place d’un adolescent d’aujourd’hui, qui cultive son réseau sur Myspace, qui écrit sa rebellion au système, diffame ses professeurs ou diffuse des photos et des vidéos de lui-même, j’imagine l’inconfort qui pourra être le sien dans quelques années lorsqu’il recherchera du travail et que tous les employeurs auront pris l’habitude de fouiller un peu sur Google… Mais même sa vie privée digitale pourra s’en trouvée compliquée, peut-être n’a-t’il pas envie que ses anciens amis de Myspace le retrouvent sur Facebook, autre époque autres amis…

Le concept de portabilité des données et les efforts autour du web sémantique essaient de trouver des solutions à toutes ces problématiques, en tentant de décentraliser le réseau social, le rendant indépendant du service mais gérable depuis n’importe lequel d’entre eux, en essayant de rendre les données échangeables et manipulables de n’importe quel endroit du réseau, en proposant une gestion centralisée de l’identité et des données tout en décentralisant le contenu et les médias eux-mêmes. Bref en oeuvrant pour rendre à l’utilisateur le contrôle total de ses données et de son identité.





FOAFDrive : Générateur Friend Of A Friend

14 08 2008

FOAF smileys LOGO

J’ai passé une petite semaine d’autiste fin juillet comme j’aime à le faire une fois par an, n’ayant plus trop l’occasion de coder, et j’ai créé cette année FOAFDrive : http://www.foafdrive.com.

Une fois que j’aurais passé en revue divers sujets de b-a-ba du web2.0 j’aborderais un sujet de plus en plus en vogue ces derniers temps et qui est loin de se tarir : la portabilité des données (http://www.dataportability.org) et je parlerais alors plus en détail de FOAF.

Le principe de FOAF, dans ses grandes largeurs, est la création d’un réseau social décentralisé à la taille de l’Internet : en effet, pourquoi s’enregistrer sur une multitude de réseaux sociaux séparés les uns des autres alors que le seul, l’unique est finalement et simplement l’Internet lui-même.. ?

FOAFDrive vous aide, de manière, je l’espère, didactique, à créer votre propre fichier FOAF (cf http://www.foaf-project.org), il est entièrement (+95%) développé en Javascript et XML, il s’agit donc plus d’une application cliente tournant sur votre navigateur que d’un site Internet à proprement parler… Le formulaire principal est généré directement par analyse de la description FOAF RDF officielle et est donc à priori aisément évolutif et adaptable.

Le code est disponible au téléchargement, sous licence GPL, ainsi que le fichier de traduction si vous vous sentez l’âme traductrice.. ;) (Disponible en Français et en Anglais pour le moment)

Désolé pour le survol du sujet, ce post s’adresse principalement aux personnes qui connaissent déjà FOAF, ou tout du moins qui sont suffisamment motivées pour aller en chercher un peu plus sur le net, je reviendrais plus profondément sur le sujet plus tard.

N’hésitez pas à me faire vos commentaires, ils sont les bienvenus ! FOAFDrive va évoluer tout au long de cette année, doucement, avec des fonctionnalités intéressantes je pense.