Existe-t-il des solutions techniques “sur étagère” pour monter un portail de mise à disposition des données ?
En plus de permettre aux développeurs intéressés de télécharger les données, la plateforme en question (idéalement sous marque blanche) pourraient en proposer des statistiques d’accès. On pourrait même envisager qu’elle puisse permettre de convertir des données CSV en API.
Y- aurait-il donc parmi vous des fournisseurs de telles solutions et pourraient-ils en présenter les avantages, notamment par rapport à un développement en interne ?
A propos de SNCF Open Data
- CGU - Contactez-nous - Mode d'emploi - Mentions légales
- Imagine Cup 2012
© 2012

Commentaires (13)
Jean-Marc
J'ai créé et dirige la société OpenDataSoft qui se positionne exactement comme une solution dédiée aux problématiques de l'open data (http://www.opendatasoft.com/?page_id=12), idéalement pour permettre la création de portails personnalisés (donc en marque blanche).
Il ne faut pas confondre "sur étagère" et "boîte noire" car l'objectif d'une telle solution est bien de donner la main aux opérateurs d'un portail de services open data sur l'orchestration de ces derniers:
Disposer de l'intégration de tous ces composants sur une même plate-forme maximise les chances de tenir la promesse de l'open data, envers les producteurs de données, envers les réutilisateurs de données et envers les utilisateurs finaux.
En outre, une telles solution se doit ouverte aux écosystèmes en place et permettre la meilleure intéropérabilité possible avec les plates-formes existantes sur le cloud, aussi bien pour se sourcer en données (google docs, wikipedia ...) que pour exposer les données dans des "applications" générées automatiquement (google charts, formulaire facebook, flux twitter ...).
C'est tout l'intérêt notamment de positionner une telle solution en mode SaaS afin de ne pas restreindre le potentiel d'un hub open data pas des questions de sécurité du SI.
Enfin, un hub open data se doit d'être "accueillant" avec tout l'écosystème de partenaires qui y abonderont en données Le positionner dans le cloud est donc également un atout.
J'espère avoir l'opportunité de répondre à des demandes de précisions sur ce qui précède. (j'écris aussi de temps en temps ici http://www.opendatasoft.com/?cat=6).
Jean-Marc Lazard (http://fr.linkedin.com/in/jmlazard)
Arnaud
Il me semble que c'est précisément le but de Windows Azure Marketplace: https://datamarket.azure.com/
Jean-Marc
En effet, OpenDataSoft et l'Azure Market Place partagent cette approche SaaS et se distingueront vraisemblablement l'une de l'autre en termes d'offre sur les points suivants:
Vincent
Personnellement, je suis plus dans une démarche de PAAS en marque blanche, l'approche est plus globale et en même temps plus personnalisable, à la demande et sur-mesure. N'est-ce pas trop restrictif de parler de portail opendata ? Je parle en terme de finalité pour l'utilisateur final.
Jean-Marc
Oui, tout à fait d'accord avec Vincent, la notion de portail open data est bien trop restrictive, nous devrions a minima parler de portail de services open data
Et oui l'enjeu est bien de l'ordre du PaaS sur lequel peuvent se décliner diverses offres SaaS. Je dois avouer que j'use aussi un peu trop du terme SaaS, mais ce dernier est souvent plus connu et mieux compris que PaaS.
La notion de portails de services avec une solution open data en marque blanche a effectivé ma faveur sur l'approche "place de marché de données" (déjà faudra-t'il démontrer qu'il y a un marché de la données avec un cours de l'offre et de la demande, à date il y a en fait un marché des services de traitement et d'analyse de la donnée).
L'approche "marque blanche" a en effet le mérite de concilier les 3 composants qui devront nécessairement être associés pour que l'open data accouchent de projets/réalisations à a hauteur des promesses qu'on lui associe en termes de développement économique:
Pierre-Emmanuel
Je vous signale également la plate-forme opensource que nous avons développée :
http://opendata.in-cite.net/
Elle est actuellement utilisée par la ville de Rennes, Rennes Métropole, Keolis Rennes, la ville de Nantes et bientôt le Conseil général 44. Nous travaillons également actuellement avec le CG 49.
VincentD
Je partage le fait que les solutions technologiques Cloud (PaaS ou SaaS) sont parfaitement adaptées aux besoins d'un portail open data : facturation à l'usage, difficulté de prédire la charge, isolation avec le SI de l'entreprise...
Concernant les plateformes disponibles sur le marché, quelles sont les différences majeures entre les solutions évoquées plus haut et le produit CKAN conçu par l'Open Knowledge Foundation ? Même question pour les solutions de publication d'API type Mashery ou 3Scale ?
Jean-Marc
Concernant la principale différence entre l'approche CKAN (similaire à In-Cite?) et l'approche OpenDataSoft, elle réside dans le type "d'objet" manipulé au coeur de la plate-forme.
Enfin, j'ai évoqué le développement rapide d'application sur le cloud, les possibilités d'une solution comme Heroku (heroku.com) me paraissent totalement en ligne avec l'idée de produire des APIs open data à partir d'une plate-forme d'orchestration des flux de données.
Passionnantes perspectives selon moi, un nouveau type de gouvernance des SI, et des organisations, se préfigure à travers toutes ces initiatives.
Samuel
La plateforme opensource Data.gov-in-a-box devrait être disponible prochainement.
Jean-Marc
en effet, et cette plate-forme entre dans la catégorie CKAN (en moins abouti d'ailleurs), bâtie sur base du CMS Drupal (tout comme In-Cité sur base du CMS Typo3) pour gérer la mise en ligne des datasets et des métadonnées associées.
Voici par ex.le features présentées sur Github pour data.vo in-a-box (https://github.com/opengovplatform/opengovplatform)
Et tous les accès aux data en mode APIs des divers sites data.gov (medicare.gov ...) est le fait d'autres solutions utilisées par les administrations américaines en mode SaaS.
On a donc d'un côté la solution de catalogage des jeux de données et de l'autre celle d'exploitation directe des données.
Les solutions les plus récentes en SaaS tente de proposer cela de façon intégrer afin de concilier publication de datasets et de données en mode flux.
Ce cas est en effet un très bon exemple pour répondre à la question de @VincentD
Au plaisir de poursuivre cet échange qui, à travers des considérations techniques, touche la question des enjeux que l'on veut couvrir avec une démarche open data.
Je me permets du coup de pointer vers cet article du CTO de CapGemini "Big data or Open Data & Clou data" qui rejoint me semble-t-il la discussion que nous avons en ce moment: http://www.capgemini.com/ctoblog/2011/10/big-data-open-da...
Roux
Jean-Marc : notons tout de même que CKAN est désormais data-centric lui aussi : http://ckan.org/features/
Étant un logiciel libre, gratuit, avec une vraie communauté d'utilisateurs et développeurs, y compris parmi les administrations puisque le gouvernement anglais et bientôt la commission européenne l'utilisent pour leur plateforme OpenData, CKAN semble rester encore aujourd'hui le choix le plus sage :)
Jean-Marc
@Roux: en effet, ayant pas mal d'échanges avec les équipes d'OKFN sur CKAN, je reconnais que la direction prise est bien "data centric" et je suis d'accord qu'en solution logicielle à installer et customiser "on premises", ce choix peut être tout à fait pertinent.
Au plaisir de poursuivre cet échange stimulant ;-)
Nicolas
Il y a également une initiative intéressante avec Drupal via les plateformes opendata aux USA.