1. Accueil
  2. OpenData
  3. 69 - Le catalogue des méta-données est dispo…

N°69 - Le catalogue des méta-données est disponible sous la forme d'un jeu de données

Objectif
Les modalités de mises à jour du catalogue de métadonnées doivent être précisées ainsi que sa structuration et son historique.
Le schéma DCAT permet de décrire un entrepôt de jeux de données, l'historique des modifications ainsi que la description des différents jeux de données qu'il référence ou qu'il héberge.

La présence au sein d’un projet Open Data d’un jeu de données “Catalogue des jeux de données”, qui recense tous les jeux de données du projet, permet aux réutilisateurs de prendre la mesure en un fichier de l’étendue des jeux de données libérés.
Si chacun des projets Open Data utilise le même formalisme (colonnes et types d’informations) pour créer son catalogue des jeux des données , il sera d’autant plus facile de créer un méta-catalogue à l’échelle de tous les projets Open Data. Celui-ci permettra :

  • de faciliter l’identification des jeux intéressants pour les réutilisateurs
  • de faciliter le repérage des jeux de données identiques ou proches dans chacun des projets pour créer des réutilisations utilisables avec plusieurs jeux de données d’origine différente
  • de repérer au sein des projets Open Data les jeux de données qui mériteraient également d’être normalisés pour faciliter leur agrégation
  • de faciliter le croisement de ces données par la mise en relation des métadonnées
Solution technique
En l’occurrence, les noeuds du schéma proposé sont le noeud dataset qui ouvre sur les champs description et ressources et le ou les noeuds ressources en fonction du nombre de formats publiés pour ce jeu de données.
Le modèle de données identifie un noeud racine constitué par le catalogue (Catalog) . On y décrit les caractéristiques de celui-ci grâce aux métadonnées disponibles.
Le noeud racine Catalog contient optionnellement des noeuds fils CatalogRecord qui peuvent servir à indiquer l’historique de publication des jeux de données dans le catalogue.
Le noeud racine contient ensuite un ou plusieurs noeuds fils Dataset qui contiennent chacun les métadonnées descriptives d’un jeu de données.
Enfin, chaque jeu de données peut être disponible dans un ou plusieurs formats de données ou via un ou plusieurs mécanismes d’interrogation. En conséquence, un ou plusieurs nœuds Distribution peuvent permettre de décrire leurs caractéristiques.

Actuellement, le moyen le moyen le plus simple de générer des fichiers en RDF-DCAT est de :

1. mettre en forme un tableur numérique contenant les champs détaillés dans le fichier résultant des travaux du groupe de travail
2. télécharger google-refine : https://code.google.com/p/google-refine/
3. installer google-refine
4. télécharger et installer l’extension rdf : http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/
5. lire la doc http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/rdfExportDocs
6. éventuellement lire cette présentation http://www.slideshare.net/fadimaali/employing-google-refine-to-publish-linked-data
7. exporter le fichier en RDF
8. publier sur votre portail opendata
Sinon, l’application CKAN dispose d’un module permettant l’export des métadonnées du catalogue en RDF

Moyen de controle
Rubrique
Utilisabilité
Niveau
3
categorie
ressources
Crée le
3/09/2012 08h16
Automatisation
Manuel

Testez et faites reconnaître vos compétences

Logo Opquast Certfied

Opquast Certified est un test sur 1000 points permettant de vérifier le degré de maîtrise des meilleures pratiques du Web

Découvrir

Retrouvez cette fiche dans « Qualité Web »

Livre Qualité Web

En savoir +

Version numérique offerte pour l’achat de la version papier