Vulgarisation web2.0 : la guerre des données aura-t’elle lieu ?

7 11 2008

D’après Google Insights, le terme ‘Dataportability’ existe depuis le début du mois de décembre 2007, mais le début de sa réelle légitimité se situe plus vraisemblablement le 4 janvier 2008, lorsque Google, Plaxo et Facebook rejoignent officiellement le groupe Dataportability.org fondé par Chris SAAD quelques semaines auparavant. Il seront bientôt rejoints par LinkedIn, Twitter, Flickr, Microsoft, Digg, Six Apart, Seesmic, Myspace et d’autres. Les objectifs de ce groupe de travail, fondé par des entrepreneurs indépendants du ‘web2.0’, pour leur grande majorité issus de la côté ouest des Etats-Unis, ne sont pas d’inventer de nouveaux standards mais de travailler à concevoir et mettre en œuvre un ‘blueprint’, un canevas dédié aux services désireux de rejoindre le mouvement et leur permettant d’afficher leur compatibilité à la vision véhiculée par la portabilité des données sur le web. Cette vision est mise en œuvre à l’aide de technologies ouvertes existantes comme FOAF (réseau social distribué), les microformats (première mise en œuvre du web sémantique), OpenID (Identification centralisée), XFN (description des relations sociales), OAuth (Authentification), RDF (technologie support du web sémantique), APML (partage de l’ « attention » : échange des goûts et intérêts) ou encore XMPP (protocole libre de messagerie). Le groupe de travail édite des guides de conduite à tenir pour un service voulant participer et s’affirmer portable.

La vision principale de la portabilité des données véhiculée par le groupe de travail de Chris SAAD est de rendre à l’utilisateur le contrôle de ses données, comme expliqué par son leader lorsqu’il a fondé le mouvement, nous avons besoin d’un serveur DHCP (configuration automatique) pour gérer la notion d’identité et d’un système de fichiers distribué pour gérer les données, leur localisation et leur stockage et cela ne sera rendu possible que si au moins deux fonctionnalités existent : un système d’auto-découverte des services et des identités de l’utilisateur et un catalogue de services. Cette vision créé le besoin d’un ‘serveur de profils’ utilisé par des ‘applications sociales’. Le serveur de profils, qui peut lui-même être une application sociale, un service web, contient par exemple les données d’attention, de recommandations, le graphe social de l’utilisateur, ses identités et enfin, et non des moindres, les politiques d’accès aux données.

D’autres initiatives, plus techniques, essaient déjà de faire bouger les choses à l’image de DiSO. Il s’agit d’un jeune projet paravent qui tente d’implémenter certains des concepts du réseautage social décentralisé et de la portabilité des données autour de l’information, de l’identité et de l’intéraction en utilisant les microformats, des APIs standards et des logiciels open-source. Fondée par deux ténors du millieu, Chris Messina et Will Noris, travaillant à présent pour la société Vidoop spécialisée dans la gestion de l’identité centralisée (OpenID), l’initiative s’est fixée comme premières étapes d’implémenter les technologies des microformats, d’OpenID et de OAuth comme greffons à la plate-forme de blogs WordPress autorisant l’extraction automatisée d’informations facilement interprétables par les machines et ajoutant des capacitées de réseau social distribué aux blogs personnels de millions d’internautes.

Sur fond de web sémantique et de monétisation des services web s’ouvre la grande ‘guerre‘ des données dans le monde digital, elle aura lieu sur trois fronts interdépendants, celui de l’idéologie, d’une certaine conception du monde et des usages, celui de l’économie numérique où nos données ont une valeur qui peut amener un élément de réponse dans la recherche du busines plan idéal mais dont l’utilisation devra savoir rester humble et respectueuse de ses utilisateurs et celui de la technologie qui ouvre un peu plus tous les jours l’étendue des possibilités offertes aux entreprises comme aux particuliers mais dont la tâche, fondamentale, semble tout aussi passionnante que titanesque.





Vulgarisation web2.0 : les origines de la portabilité des données

6 11 2008

Le graphique ci-dessous (voir ici pour une version lisible), créé d’après une matrice Excel, un script Perl et l’outil GraphViz, représente les principaux flux d’informations au sein de mon réseau de services web, n’y sont représentés que les services que j’utilise le plus souvent, au moins une fois par semaine, on y distingue en turquoise les nœuds que je mets moi-même à jour soit directement (ex : flickr) soit indirectement par mon utilisation du service (ex : last.fm), sous forme d’octogones les nœuds recevant plus de 5 flux (aggrégateurs, concentrateurs) et en contour gras les nœuds n’émettant pas de données (récepteurs), un nœud spécifique nommé ‘RSS feeds’ représente à lui seul l’ensemble des flux d’informations externes que je lis quotidiennement :

out

Figure Les flux d’information de mon réseau de services web

Ce paquet de nouilles n’est pas exhaustif mais permet déjà de se rendre compte de l’éparpillement et du nombre de services que j’utilise presque au quotidien en étant certes un utilisateur avancé mais non compulsif et peu prolifique. Je suis symbolisé par le nœud le plus haut et les deux nœuds les plus bas représentent d’une part le public, la communauté, l’ensemble des internautes potentiellement intéressés par mes informations et mes données et d’autre part mes amis, ma communauté privée qui revêt en fait un caractère multiple selon les services.

Je possède un compte utilisateur par service, généralement un avatar, j’ai ajouté un certain nombre d’informations personnelles, de liens et de références sur chacun de ces sites, j’ai téléchargé des photos, mis à jour des textes, posté des vidéos et des commentaires, déposé mes avis et envoyé des dizaines de messages, créé presque autant de réseaux sociaux dédiés que de nœuds présents sur ce graphe. Je suis pourtant dans l’incapacité presque totale de lister mes contributions, mes données et mes médias, je n’ai quasiment aucun contrôle sur mes données, leur référencement ni sur l’utilisation qui est en faite.

Si un service venait à fermer, disons Facebook, je perdrais tous les contacts que j’ai accumulés au cours du temps, toutes les informations que j’ai échangées avec ce réseau d’amis, je perdrais peut-être même de vue certaines personnes avec lesquelles je ne possède qu’un lien très mince, mais qui m’importe, au travers de ce réseau. Si je change d’avis à propos d’une opinion quelconque, ce qui m’arrive sans arrêt, par exemple concernant un article déposé sur mon blog que je ne souhaiterais plus voir lu, je pourrais certes le supprimer de mon blog mais il aura entre temps été dupliqué, échangé, diffusé, référencé et archivé à de multiples endroits sans que j’en sois informé et sans que je n’ai aucun contrôle (ou presque) sur sa longévité.

J’ai redécouvert aujourd’hui, en écrivant, le service Twine permettant d’indexer sémantiquement et de partager tout type d’information du web, j’ai réactivé mon compte et commencé à manipuler un peu le service, mais ce que je souhaiterais à présent c’est partager ces informations, échanger avec mon réseau, avec mes amis, mes contacts, mes collègues, il faut alors que j’envoie une palanquée d’invitations, soit en me souvenant de leur adresse mail, soit en me loguant depuis Twine sur mes quatre ou cinq comptes mail, bref il me faut reconstruire un nouveau réseau social sur Twine au risque d’ennuyer ces amis à qui j’envoie régulièrement ce genre d’invitations, entrer à nouveau mes informations personnelles après m’être créé un compte supplémentaire, charger un nouvel avatar et recommencer à approvisionner mon espace utilisateur avec des données que j’aurais parfois sans doute déjà sauvegardées sur del.icio.us ou Google Reader…

Lorsque j’étais adolescent j’avais écrit un certain nombre d’articles, de poêmes, j’avais rédigé des commentaires, diffusé des photos de moi en soirée ou exprimé des opinions avec lesquelles je suis à présent en désaccord et cet ensemble d’informations pourrait très bien s’avérer néfaste si je recherche un nouveau poste et que mon employeur commence à fouiller dans les archives du web, et pourtant à l’époque le web ne ressemblait pas à ce qu’il est aujourd’hui avec la profusion de services et l’exposition de soi que l’on constate actuellement. En me mettant à la place d’un adolescent d’aujourd’hui, qui cultive son réseau sur Myspace, qui écrit sa rebellion au système, diffame ses professeurs ou diffuse des photos et des vidéos de lui-même, j’imagine l’inconfort qui pourra être le sien dans quelques années lorsqu’il recherchera du travail et que tous les employeurs auront pris l’habitude de fouiller un peu sur Google… Mais même sa vie privée digitale pourra s’en trouvée compliquée, peut-être n’a-t’il pas envie que ses anciens amis de Myspace le retrouvent sur Facebook, autre époque autres amis…

Le concept de portabilité des données et les efforts autour du web sémantique essaient de trouver des solutions à toutes ces problématiques, en tentant de décentraliser le réseau social, le rendant indépendant du service mais gérable depuis n’importe lequel d’entre eux, en essayant de rendre les données échangeables et manipulables de n’importe quel endroit du réseau, en proposant une gestion centralisée de l’identité et des données tout en décentralisant le contenu et les médias eux-mêmes. Bref en oeuvrant pour rendre à l’utilisateur le contrôle total de ses données et de son identité.





Tagzeo : Balisez votre blog

18 08 2008

Une idée originale : tagzeo.com : créez un tag pour votre blog et diffusez l’url à vos contacts ou vos lecteurs afin de gagner des points. Ces points permettrons alors de personnaliser votre tag : taille, couleur, etc..

Si vous voulez me faire gagner des points vous pouvez cliquer sur les deux liens ci-dessous :)

http://www.tagzeo.com/Mglcel

http://www.tagzeo.com/FOAF





FOAFDrive : Générateur Friend Of A Friend

14 08 2008

FOAF smileys LOGO

J’ai passé une petite semaine d’autiste fin juillet comme j’aime à le faire une fois par an, n’ayant plus trop l’occasion de coder, et j’ai créé cette année FOAFDrive : http://www.foafdrive.com.

Une fois que j’aurais passé en revue divers sujets de b-a-ba du web2.0 j’aborderais un sujet de plus en plus en vogue ces derniers temps et qui est loin de se tarir : la portabilité des données (http://www.dataportability.org) et je parlerais alors plus en détail de FOAF.

Le principe de FOAF, dans ses grandes largeurs, est la création d’un réseau social décentralisé à la taille de l’Internet : en effet, pourquoi s’enregistrer sur une multitude de réseaux sociaux séparés les uns des autres alors que le seul, l’unique est finalement et simplement l’Internet lui-même.. ?

FOAFDrive vous aide, de manière, je l’espère, didactique, à créer votre propre fichier FOAF (cf http://www.foaf-project.org), il est entièrement (+95%) développé en Javascript et XML, il s’agit donc plus d’une application cliente tournant sur votre navigateur que d’un site Internet à proprement parler… Le formulaire principal est généré directement par analyse de la description FOAF RDF officielle et est donc à priori aisément évolutif et adaptable.

Le code est disponible au téléchargement, sous licence GPL, ainsi que le fichier de traduction si vous vous sentez l’âme traductrice.. ;) (Disponible en Français et en Anglais pour le moment)

Désolé pour le survol du sujet, ce post s’adresse principalement aux personnes qui connaissent déjà FOAF, ou tout du moins qui sont suffisamment motivées pour aller en chercher un peu plus sur le net, je reviendrais plus profondément sur le sujet plus tard.

N’hésitez pas à me faire vos commentaires, ils sont les bienvenus ! FOAFDrive va évoluer tout au long de cette année, doucement, avec des fonctionnalités intéressantes je pense.