Vulgarisation web2.0 : portabilité des données, la bataille idéologique

7 11 2008

L’idéologie se situe en fait au sein de toutes les autres ‘batailles’ ou interrogations autour de la portabilité des données, qu’il s’agisse de savoir s’il est correct de gagner de l’argent sur les informations fournies par les internautes sans que ceux-ci ne sachent vraiment ce qui est fait de ces données, qu’il s’agisse de s’interroger sur la légitimité de tel ou tel acteur ou sur ses vues de domination, de questionner l’avenir de la protection des données personnelles ou de s’interroger sur la notion d’identité digitale. Si les usages déterminent les services, les questions d’idéologie, de morale et de savoir-vivre conditionnent et bornent ces usages.

S’il est un nom qui est sur toutes les lèvres depuis quelques années c’est bien ‘Google’, l’hégémonie de cette entreprise est telle qu’elle en ferait presque oublier le géant Microsoft, qui passe pour être l’outsider le plus notable dans l’écosystème du web. Hubert Guillaud relate sur InternetActu un article de Nicolas Carr faisant état d’un concept tout à fait intéressant, connu mais à qui il donne un nom : le web centripète. S’appuyant sur la définition du terme centripète par Isaac Newton (« La force centripète est celle par laquelle un corps est attiré ou poussé vers un point quelconque considéré comme un centre ») , celui-ci détaille la manière dont Google a su se hisser au rang de super-puissance numérique en jouant presque naturellement le rôle de centre de-facto du web mondial grâce à la multitude de services qu’il propose, tous intégrés les uns aux autres.

En laissant le choix aux utilisateurs mais en n’ayant de cesse de leur rappeler furtivement qu’il est là, le mastodonte a réussi le tour de force d’être le chef d’orchestre de la popularité numérique via le fonctionnement de son moteur de recherche qui transcende le lien hypertexte (plus un site est populaire plus il le deviendra et inversement) en générant une force de convergence inéluctable là où le web se voulait à l’origine plat et divergent. Google est le centre de la popularité, de loin le plus puissant moteur de publicité du monde, ses services Google Mail, Google Reader, Google Desktop ou Youtube sont dans leur domaine les outils les plus globalement plebiscités, Google Maps est de loin l’API la plus utilisée par les milliers de mashups créées aussi bien par les développeurs indépendants que par les autres services web et même le marché des navigateurs web commence à frissonner devant la sortie de Google Chrome. Google nous tient. Les APIs Google Friend Connect, OpenSocial ou SocialGraph sont utilisées afin de créer des greffons universels, ramener l’ensemble des informations de réseau social vers leur éditeur, découvrir où sont cachées les données des utilisateurs afin de mieux les centraliser. Le roi du monde ne serait-il bientôt plus le président des Etats-Unis, mais le CEO de Google ?

Si Google centralise les données, il décentralise le réseau social : n’ayant pas vu venir à temps la vague (son service Orkut, relativement absent en Amérique du nord, en Europe, en Asie et en Afrique est cependant de loin le premier réseau social d’Amérique du sud), il tente tout de même de garder une main sur ces précieuses informations avec Google Friend Connect. Facebook a le fonctionnement inverse puisqu’il centralise le graphe social en autorisant la décentralisation des données, mais puisqu’il les aggrège sur son service il garde tout de même un œil intéressé dessus. Les deux travaillent à la centralisation de l’identité. La portabilité des données, elle, aimerait décentraliser le graphe social, les données, et l’identité au profit des utilisateurs, soucieux de reprendre le contrôle de leur vie digitale, surtout lorsque l’on relève que 80% d’entre eux prétendent n’avoir jamais diffusé d’informations personnelles en ligne alors que le constat est tout autre (source : Orange Business blog sécurité).

L’importance de savoir qui, demain, contrôlera nos données, de quelle manière et ce qu’il en fait est d’autant plus fondamentale que les informations extraites avec ou sans notre consentement se multiplient de manière vertigineuse. Le web connait notre identité, nos amis, nos centres d’intérêts, nos habitudes de navigation, de lecture, là où nous intervenons, ce que nous consommons et la manière dont nous le faisons. Notre mobile, via l’opérateur ou le constructeur c’est selon, qui fait de plus en partie intégrante de notre accès au web, peut déterminer d’après notre facture téléphonique le type de relations que nous entretenons avec notre carnet d’adresse, qu’il connaît par ailleurs parfaitement, il peut nous localiser et il va le faire de plus en plus, connaissant plus que notre position géographique il est capable de savoir ce qu’il y a en face de nous, avec qui nous marchons dans la rue et quels sont nos trajets quotidiens. Les possibilités offertes semblent autant sources d’ébahissement que d’appréhension parfaitement légitime.

Le prospectiviste américain Howard Rheingold affirmait déjà en 2005 sur LeMonde.fr, et on veut bien le croire, que « Dans dix ans, la notion de vie privée telle que nous la définissons n’existera plus. », il est encore temps de trouver des solutions pour qu’elle reste un minimum sous contrôle.





Vulgarisation web2.0 : la guerre des données aura-t’elle lieu ?

7 11 2008

D’après Google Insights, le terme ‘Dataportability’ existe depuis le début du mois de décembre 2007, mais le début de sa réelle légitimité se situe plus vraisemblablement le 4 janvier 2008, lorsque Google, Plaxo et Facebook rejoignent officiellement le groupe Dataportability.org fondé par Chris SAAD quelques semaines auparavant. Il seront bientôt rejoints par LinkedIn, Twitter, Flickr, Microsoft, Digg, Six Apart, Seesmic, Myspace et d’autres. Les objectifs de ce groupe de travail, fondé par des entrepreneurs indépendants du ‘web2.0’, pour leur grande majorité issus de la côté ouest des Etats-Unis, ne sont pas d’inventer de nouveaux standards mais de travailler à concevoir et mettre en œuvre un ‘blueprint’, un canevas dédié aux services désireux de rejoindre le mouvement et leur permettant d’afficher leur compatibilité à la vision véhiculée par la portabilité des données sur le web. Cette vision est mise en œuvre à l’aide de technologies ouvertes existantes comme FOAF (réseau social distribué), les microformats (première mise en œuvre du web sémantique), OpenID (Identification centralisée), XFN (description des relations sociales), OAuth (Authentification), RDF (technologie support du web sémantique), APML (partage de l’ « attention » : échange des goûts et intérêts) ou encore XMPP (protocole libre de messagerie). Le groupe de travail édite des guides de conduite à tenir pour un service voulant participer et s’affirmer portable.

La vision principale de la portabilité des données véhiculée par le groupe de travail de Chris SAAD est de rendre à l’utilisateur le contrôle de ses données, comme expliqué par son leader lorsqu’il a fondé le mouvement, nous avons besoin d’un serveur DHCP (configuration automatique) pour gérer la notion d’identité et d’un système de fichiers distribué pour gérer les données, leur localisation et leur stockage et cela ne sera rendu possible que si au moins deux fonctionnalités existent : un système d’auto-découverte des services et des identités de l’utilisateur et un catalogue de services. Cette vision créé le besoin d’un ‘serveur de profils’ utilisé par des ‘applications sociales’. Le serveur de profils, qui peut lui-même être une application sociale, un service web, contient par exemple les données d’attention, de recommandations, le graphe social de l’utilisateur, ses identités et enfin, et non des moindres, les politiques d’accès aux données.

D’autres initiatives, plus techniques, essaient déjà de faire bouger les choses à l’image de DiSO. Il s’agit d’un jeune projet paravent qui tente d’implémenter certains des concepts du réseautage social décentralisé et de la portabilité des données autour de l’information, de l’identité et de l’intéraction en utilisant les microformats, des APIs standards et des logiciels open-source. Fondée par deux ténors du millieu, Chris Messina et Will Noris, travaillant à présent pour la société Vidoop spécialisée dans la gestion de l’identité centralisée (OpenID), l’initiative s’est fixée comme premières étapes d’implémenter les technologies des microformats, d’OpenID et de OAuth comme greffons à la plate-forme de blogs WordPress autorisant l’extraction automatisée d’informations facilement interprétables par les machines et ajoutant des capacitées de réseau social distribué aux blogs personnels de millions d’internautes.

Sur fond de web sémantique et de monétisation des services web s’ouvre la grande ‘guerre‘ des données dans le monde digital, elle aura lieu sur trois fronts interdépendants, celui de l’idéologie, d’une certaine conception du monde et des usages, celui de l’économie numérique où nos données ont une valeur qui peut amener un élément de réponse dans la recherche du busines plan idéal mais dont l’utilisation devra savoir rester humble et respectueuse de ses utilisateurs et celui de la technologie qui ouvre un peu plus tous les jours l’étendue des possibilités offertes aux entreprises comme aux particuliers mais dont la tâche, fondamentale, semble tout aussi passionnante que titanesque.





Vulgarisation web2.0 : la syndication

12 07 2008


La syndication web est un procédé utilisé par les services leur permettant de partager l’information avec d’autres sites ou vers des utilisateurs. L’utilisation la plus commune est la lecture de journaux, lemonde.fr, lefigaro.fr par exemple. Il s’agit d’un flux xml (Adresse internet générant un contenu sous forme de fichier XML), d’un format défini (RSS ou ATOM) lisible par tout lecteur compatible.

Les flux de syndication peuvent être lus depuis des applications dédiées appelés lecteurs ou aggrégateurs de flux de syndication, il peut s’agir de logiciels PC (Firefox, SharpReader, FeedReader, …) ou d’applications web (Google Reader, NetVibes, RSS feed, …). Leur présentation ressemble généralement à ce que l’on peut trouver sur les lecteurs de mails, les flux souscrits sont présentés dans un panneau, la liste des articles d’un flux est ensuite disponible comme une liste de mails, un clic sur l’un deux fait apparaître son contenu.

L’accès à l’information est facilité puisque vous disposez dans une seule application de toutes les sources vous intéressant, des derniers articles de vos journaux favoris, aux derniers articles des blogs de vos amis en passant par leurs dernières photos téléchargées.

On apprends vite à repérer un logo de flux de syndication et l’ajout à votre liste est extrêment simple, facilitée par leur reconnaissance immédiate de la part de votre navigateur internet :

L’exemple ci-dessus illustre l’abonnement flash à une liste de notification Facebook. Firefox connaît mes préférences de syndication et sur reconnaissance d’un flux RSS fait appel immédiatement à Google qui me propose de lui ajouter ce nouveau flux soit sur ma page d’accueil iGoogle soit dans mon espace GoogleReader. Ainsi plutôt que de m’authentifier sur facebook afin de voir ce que mes contacts ont fait de nouveau je pourrais le savoir directement en lisant les dernières actualités depuis GoogleReader.

Maintenant que vous avez une première idée de ce à quoi peut bien servir la syndication web, il ne vous reste plus qu’à créer un compte gratuit GoogleReader et à apprendre à identifier les flux de syndication sur vos sites favoris !





Vulgarisation web2.0 : technologies et briques communes

10 07 2008

Si le paradigme web2.0 ne constitue pas une révolution technique en soi il repose cependant sur une couche technique qu’il convient d’appréhender avant de se lancer dans le grand bain.

La plupart des technologies qui sont utilisées sont bien connues et datent d’avant l’invention du terme web2.0, ce qu’il est intéressant de constater c’est l’utilisation qui en est faite, à vrai dire l’utilisation intégrée et simultanée qui en est faite.

Cette vision du web, orientée autour du l’humain, laissant entendre en sourdine que c’est bien l’utilisateur qui reprend le contrôle du réseau a quelque peu été encouragée par les ténors de l’open source, les idées cultivées par un Richard Stallmann ou un Ian Murdock sont bien proches lorsqu’ils militent pour la libéralisation des codes source, la possibilité pour tout un chacun pour peu qu’il en ai les compétences de modifier lui-même ses logiciels afin de les rendre tout à fait adapté à ses besoins et surtout l’idée que ces modifications ne peuvent être redistribuées que sous le même régime de droit : l’utilisateur reprend ses droits sur ses applications, il n’est plus simple possesseur d’une licence d’utilisation lourdement payée, il possède toutes les données pour adapter le logiciel à ses besoins si l’envie lui prend. Je tiens tout de même à préciser en guise de parenthèse pour les néophytes que le fait qu’un logiciel soit libre n’induit pas sa gratuité, rien ne vous empêche de vendre un logiciel libre tant que vous garantissez à l’utilisateur qu’il conserve les droits du logiciel d’origine.

Il est donc normal qu’une écrasante majorité de technologies utilisées par les services du web2.0 soient issues de la communauté du logiciel libre. Nous parlions précédemment des logiciels serveurs et des logiciels client, il est intéressant de noter afin d’illustrer les propos ci-dessus que le principal logiciel équipant les serveurs web de l’Internet est le logiciel Apache, digne représentant de cette communauté du libre et il est tout aussi représentatif d’indiquer que le principal navigateur web incluant toutes les évolutions du web2.0 est le logiciel libre Firefox 3.0, lointain descendant du plus célèbre des navigateurs de son époque : Netscape, assasiné sous les coups de boutoir de son rival Internet Explorer.

Un ensemble de concepts, de pratiques et d’outils caractérisent donc le web2.0 (je ne prétend pas être exhaustif) :

  • Le Blog (ou Weblog, journal web) qui est un peu la transposition numérique et surtout publique du journal intime, permettant d’adresser ses réflexions, ses émois et ses avis à la communauté.
  • Les commentaires : les contenus doivent pouvoir être commentés, débattus, directement sur la page qui le présente et non plus dans un espace de forum annexe. Tout se commente.
  • Le wiki, né bien avant l’avènement du web2.0 mais qui lui est depuis associé décrit un site internet ou un espace dédié d’un site internet où le contenu est directement éditable par les visiteurs, modéré (les modifications sont validées par un modérateur avant diffusion) ou non. Chacun contribue à l’information, le site le plus emblématique est sans conteste wikipedia, véritable encyclopédie participative en ligne.
  • La syndication (flux RSS, ATOM) est le véritable liant de l’espace web2.0 : le partage du contenu est la raison d’être du mouvement, cette utilisation de la technologie xml permets de diffuser l’information de manière extrêmement portable et légère. Il s’agit de petits fichiers organisés téléchargeables sur les serveurs web décrivant des informations : articles, photos, liens, … Ils sont destinés à être lus par des automates : des clients pc dédiés, des sites d’aggrégation (Google Reader par ex) ou d’autres sites de contenu permettant ainsi de partager l’information et d’augmenter sa visiblité.
  • Les nuages d’étiquettes (ou tags) sont au premier abord une manière de présenter l’information sous forme de mots-clés. Chaque information est accompagnée de mots-clefs la décrivant, il est donc possible de retrouver ainsi tous les contenus d’un site web étant attachés à ce mot-clef. Mais plus qu’une présentation il s’agit surtout d’une nouvelle méthode de recherche, la folksonomy, il devient en fin de compte presque inutile de classer l’information par catégories et sous-catégories car l’information est souvent multiple et le contenu pourrait appartenir à plusieurs catégories, chacun possède sa manière de ranger l’information dans des dossiers et retrouver ainsi l’information classée revient à essayer d’imaginer la manière dont l’auteur a pu vouloir organiser la sienne. Plutôt que de rechercher la catégorie on va donc à présent rechercher des mots-clefs qui pourraient être attachés à l’information recherchée.
  • Les APIs (Application Programming Interface), terme largement utilisé dans le monde du développement logiciel depuis de nombreuses années est utilisé sur le web simplement pour ce qu’elles sont : des interfaces d’accès aux données ou de récupération d’informations. Il s’agit de la possibilité d’accéder aux contenus de manière automatisée et non par navigation classique, avec des programmes externes, de votre cru ou non. Vous pourriez ainsi par exemple développer un petit logiciel qui effectue des recherches Google depuis votre PC, par exemple en cliquant sur un mot dans Word ou OpenOffice sans devoir copier/coller ce mot dans votre navigateur habituel. Word se connecterait à l’API de recherche Google en lui envoyant le mot recherché, il recevrait en échange l’ensemble des réponses correspondantes qu’il serait à même de vous afficher dans une petite boîte de dialogue..
  • Le Mashup est une application ou un site web composite construit grâce à l’appel combiné de plusieurs APIs. Si vous possédez une entreprise de logistique par exemple vous pourriez être intéressé par un site vous indiquant en permanence l’emplacement de votre flotte de véhicules. En ayant un abonnement aux APIs Orange de géolocalisation vous pourriez récupérer la position de chaque véhicule grâce au mobile de son chauffeur et faire appel à l’API Google Maps pour les positionner sur une carte à l’aide de petits pictogrammes. Les possibilités sont infinies et ne dépendent que de l’imagination des auteurs et des APIs disponibles. ex: ProgrammableWeb.
  • AJAX (Asynchronous JavaScript and XML) est né de technologies relativement mûres présentes depuis bien longtemps dans l’univers du web mais qui combinées offrent des fonctionnalités particulièrement intéressantes afin de faciliter l’interaction entre le site et l’utilisateur. Le principe est de pouvoir récupérer de l’information depuis une page web en tâche de fond sans rechargement de page. Un morceau de code présent sur le site, exécuté suite à une action de la part de l’internaute ou non est en mesure d’envoyer ou de récupérer de l’information qu’il va ensuite traiter afin de mettre à jour dynamiquement la page en cours de consultation. Peu de webmails (interfaces de consultation de mails par le web) vous obligent encore aujourd’hui à recharger votre page lorsque vous désirez lire un nouveau mail : le contenu du mail est récupéré en tâche de fond lorsque vous cliquez sur son sujet puis un espace dédié à la lecture présent sur la page est mis à jour avec cette nouvelle information, la navigation est accélérée, fluidifiée et les interfaces sont bien plus ergonomiques.
  • Les systèmes de vote permettent de donner un avis noté sur une photo, un commentaire, un article ou tout autre contenu.

Tous ces outils, concepts et pratiques sont utilisés par une multitude de sites collaboratifs axés sur le partage de l’information et la collaboration dont les objectifs sont tout aussi divers que le partage de média (photos, videos, ..), de contenu (liens, articles, avis, …), ou de relations sociales (privées, professionnelles, associatives, …).