Vulgarisation web2.0 : la guerre des données aura-t’elle lieu ?

7 11 2008

D’après Google Insights, le terme ‘Dataportability’ existe depuis le début du mois de décembre 2007, mais le début de sa réelle légitimité se situe plus vraisemblablement le 4 janvier 2008, lorsque Google, Plaxo et Facebook rejoignent officiellement le groupe Dataportability.org fondé par Chris SAAD quelques semaines auparavant. Il seront bientôt rejoints par LinkedIn, Twitter, Flickr, Microsoft, Digg, Six Apart, Seesmic, Myspace et d’autres. Les objectifs de ce groupe de travail, fondé par des entrepreneurs indépendants du ‘web2.0’, pour leur grande majorité issus de la côté ouest des Etats-Unis, ne sont pas d’inventer de nouveaux standards mais de travailler à concevoir et mettre en œuvre un ‘blueprint’, un canevas dédié aux services désireux de rejoindre le mouvement et leur permettant d’afficher leur compatibilité à la vision véhiculée par la portabilité des données sur le web. Cette vision est mise en œuvre à l’aide de technologies ouvertes existantes comme FOAF (réseau social distribué), les microformats (première mise en œuvre du web sémantique), OpenID (Identification centralisée), XFN (description des relations sociales), OAuth (Authentification), RDF (technologie support du web sémantique), APML (partage de l’ « attention » : échange des goûts et intérêts) ou encore XMPP (protocole libre de messagerie). Le groupe de travail édite des guides de conduite à tenir pour un service voulant participer et s’affirmer portable.

La vision principale de la portabilité des données véhiculée par le groupe de travail de Chris SAAD est de rendre à l’utilisateur le contrôle de ses données, comme expliqué par son leader lorsqu’il a fondé le mouvement, nous avons besoin d’un serveur DHCP (configuration automatique) pour gérer la notion d’identité et d’un système de fichiers distribué pour gérer les données, leur localisation et leur stockage et cela ne sera rendu possible que si au moins deux fonctionnalités existent : un système d’auto-découverte des services et des identités de l’utilisateur et un catalogue de services. Cette vision créé le besoin d’un ‘serveur de profils’ utilisé par des ‘applications sociales’. Le serveur de profils, qui peut lui-même être une application sociale, un service web, contient par exemple les données d’attention, de recommandations, le graphe social de l’utilisateur, ses identités et enfin, et non des moindres, les politiques d’accès aux données.

D’autres initiatives, plus techniques, essaient déjà de faire bouger les choses à l’image de DiSO. Il s’agit d’un jeune projet paravent qui tente d’implémenter certains des concepts du réseautage social décentralisé et de la portabilité des données autour de l’information, de l’identité et de l’intéraction en utilisant les microformats, des APIs standards et des logiciels open-source. Fondée par deux ténors du millieu, Chris Messina et Will Noris, travaillant à présent pour la société Vidoop spécialisée dans la gestion de l’identité centralisée (OpenID), l’initiative s’est fixée comme premières étapes d’implémenter les technologies des microformats, d’OpenID et de OAuth comme greffons à la plate-forme de blogs WordPress autorisant l’extraction automatisée d’informations facilement interprétables par les machines et ajoutant des capacitées de réseau social distribué aux blogs personnels de millions d’internautes.

Sur fond de web sémantique et de monétisation des services web s’ouvre la grande ‘guerre‘ des données dans le monde digital, elle aura lieu sur trois fronts interdépendants, celui de l’idéologie, d’une certaine conception du monde et des usages, celui de l’économie numérique où nos données ont une valeur qui peut amener un élément de réponse dans la recherche du busines plan idéal mais dont l’utilisation devra savoir rester humble et respectueuse de ses utilisateurs et celui de la technologie qui ouvre un peu plus tous les jours l’étendue des possibilités offertes aux entreprises comme aux particuliers mais dont la tâche, fondamentale, semble tout aussi passionnante que titanesque.





Vulgarisation web2.0 : technologies et briques communes

10 07 2008

Si le paradigme web2.0 ne constitue pas une révolution technique en soi il repose cependant sur une couche technique qu’il convient d’appréhender avant de se lancer dans le grand bain.

La plupart des technologies qui sont utilisées sont bien connues et datent d’avant l’invention du terme web2.0, ce qu’il est intéressant de constater c’est l’utilisation qui en est faite, à vrai dire l’utilisation intégrée et simultanée qui en est faite.

Cette vision du web, orientée autour du l’humain, laissant entendre en sourdine que c’est bien l’utilisateur qui reprend le contrôle du réseau a quelque peu été encouragée par les ténors de l’open source, les idées cultivées par un Richard Stallmann ou un Ian Murdock sont bien proches lorsqu’ils militent pour la libéralisation des codes source, la possibilité pour tout un chacun pour peu qu’il en ai les compétences de modifier lui-même ses logiciels afin de les rendre tout à fait adapté à ses besoins et surtout l’idée que ces modifications ne peuvent être redistribuées que sous le même régime de droit : l’utilisateur reprend ses droits sur ses applications, il n’est plus simple possesseur d’une licence d’utilisation lourdement payée, il possède toutes les données pour adapter le logiciel à ses besoins si l’envie lui prend. Je tiens tout de même à préciser en guise de parenthèse pour les néophytes que le fait qu’un logiciel soit libre n’induit pas sa gratuité, rien ne vous empêche de vendre un logiciel libre tant que vous garantissez à l’utilisateur qu’il conserve les droits du logiciel d’origine.

Il est donc normal qu’une écrasante majorité de technologies utilisées par les services du web2.0 soient issues de la communauté du logiciel libre. Nous parlions précédemment des logiciels serveurs et des logiciels client, il est intéressant de noter afin d’illustrer les propos ci-dessus que le principal logiciel équipant les serveurs web de l’Internet est le logiciel Apache, digne représentant de cette communauté du libre et il est tout aussi représentatif d’indiquer que le principal navigateur web incluant toutes les évolutions du web2.0 est le logiciel libre Firefox 3.0, lointain descendant du plus célèbre des navigateurs de son époque : Netscape, assasiné sous les coups de boutoir de son rival Internet Explorer.

Un ensemble de concepts, de pratiques et d’outils caractérisent donc le web2.0 (je ne prétend pas être exhaustif) :

  • Le Blog (ou Weblog, journal web) qui est un peu la transposition numérique et surtout publique du journal intime, permettant d’adresser ses réflexions, ses émois et ses avis à la communauté.
  • Les commentaires : les contenus doivent pouvoir être commentés, débattus, directement sur la page qui le présente et non plus dans un espace de forum annexe. Tout se commente.
  • Le wiki, né bien avant l’avènement du web2.0 mais qui lui est depuis associé décrit un site internet ou un espace dédié d’un site internet où le contenu est directement éditable par les visiteurs, modéré (les modifications sont validées par un modérateur avant diffusion) ou non. Chacun contribue à l’information, le site le plus emblématique est sans conteste wikipedia, véritable encyclopédie participative en ligne.
  • La syndication (flux RSS, ATOM) est le véritable liant de l’espace web2.0 : le partage du contenu est la raison d’être du mouvement, cette utilisation de la technologie xml permets de diffuser l’information de manière extrêmement portable et légère. Il s’agit de petits fichiers organisés téléchargeables sur les serveurs web décrivant des informations : articles, photos, liens, … Ils sont destinés à être lus par des automates : des clients pc dédiés, des sites d’aggrégation (Google Reader par ex) ou d’autres sites de contenu permettant ainsi de partager l’information et d’augmenter sa visiblité.
  • Les nuages d’étiquettes (ou tags) sont au premier abord une manière de présenter l’information sous forme de mots-clés. Chaque information est accompagnée de mots-clefs la décrivant, il est donc possible de retrouver ainsi tous les contenus d’un site web étant attachés à ce mot-clef. Mais plus qu’une présentation il s’agit surtout d’une nouvelle méthode de recherche, la folksonomy, il devient en fin de compte presque inutile de classer l’information par catégories et sous-catégories car l’information est souvent multiple et le contenu pourrait appartenir à plusieurs catégories, chacun possède sa manière de ranger l’information dans des dossiers et retrouver ainsi l’information classée revient à essayer d’imaginer la manière dont l’auteur a pu vouloir organiser la sienne. Plutôt que de rechercher la catégorie on va donc à présent rechercher des mots-clefs qui pourraient être attachés à l’information recherchée.
  • Les APIs (Application Programming Interface), terme largement utilisé dans le monde du développement logiciel depuis de nombreuses années est utilisé sur le web simplement pour ce qu’elles sont : des interfaces d’accès aux données ou de récupération d’informations. Il s’agit de la possibilité d’accéder aux contenus de manière automatisée et non par navigation classique, avec des programmes externes, de votre cru ou non. Vous pourriez ainsi par exemple développer un petit logiciel qui effectue des recherches Google depuis votre PC, par exemple en cliquant sur un mot dans Word ou OpenOffice sans devoir copier/coller ce mot dans votre navigateur habituel. Word se connecterait à l’API de recherche Google en lui envoyant le mot recherché, il recevrait en échange l’ensemble des réponses correspondantes qu’il serait à même de vous afficher dans une petite boîte de dialogue..
  • Le Mashup est une application ou un site web composite construit grâce à l’appel combiné de plusieurs APIs. Si vous possédez une entreprise de logistique par exemple vous pourriez être intéressé par un site vous indiquant en permanence l’emplacement de votre flotte de véhicules. En ayant un abonnement aux APIs Orange de géolocalisation vous pourriez récupérer la position de chaque véhicule grâce au mobile de son chauffeur et faire appel à l’API Google Maps pour les positionner sur une carte à l’aide de petits pictogrammes. Les possibilités sont infinies et ne dépendent que de l’imagination des auteurs et des APIs disponibles. ex: ProgrammableWeb.
  • AJAX (Asynchronous JavaScript and XML) est né de technologies relativement mûres présentes depuis bien longtemps dans l’univers du web mais qui combinées offrent des fonctionnalités particulièrement intéressantes afin de faciliter l’interaction entre le site et l’utilisateur. Le principe est de pouvoir récupérer de l’information depuis une page web en tâche de fond sans rechargement de page. Un morceau de code présent sur le site, exécuté suite à une action de la part de l’internaute ou non est en mesure d’envoyer ou de récupérer de l’information qu’il va ensuite traiter afin de mettre à jour dynamiquement la page en cours de consultation. Peu de webmails (interfaces de consultation de mails par le web) vous obligent encore aujourd’hui à recharger votre page lorsque vous désirez lire un nouveau mail : le contenu du mail est récupéré en tâche de fond lorsque vous cliquez sur son sujet puis un espace dédié à la lecture présent sur la page est mis à jour avec cette nouvelle information, la navigation est accélérée, fluidifiée et les interfaces sont bien plus ergonomiques.
  • Les systèmes de vote permettent de donner un avis noté sur une photo, un commentaire, un article ou tout autre contenu.

Tous ces outils, concepts et pratiques sont utilisés par une multitude de sites collaboratifs axés sur le partage de l’information et la collaboration dont les objectifs sont tout aussi divers que le partage de média (photos, videos, ..), de contenu (liens, articles, avis, …), ou de relations sociales (privées, professionnelles, associatives, …).