Moissonnage DCAT
DCAT
DCAT est une ontologie RDF pour décrire des jeux de données.
L’Europe a publié son extension de DCAT, appelée DCAT-AP.
Spécificités techniques
Ce moissonneur attend l’URL d’un catalogue DCAT (dcat:Catalog
).
Plusieurs formats sont supportés et découvrables à travers la négociation de contenu :
RDF XML
JSON-LD
Turtle
N3
NT
Trig
La pagination est supportée via l’ontologie Hydra (ainsi que l’ancienne version)
Correspondance des champs du modèle
Par souci de lisibilité, les namespaces suivants sont déclarés :
dcat
⇨http://www.w3.org/ns/dcat#
dct
⇨http://purl.org/dc/terms/
foaf
⇨http://xmlns.com/foaf/0.1/
hydra
⇨http://www.w3.org/ns/hydra/core#
rdfs
⇨http://www.w3.org/2000/01/rdf-schema#
scv
⇨http://purl.org/NET/scovo#
skos
⇨http://www.w3.org/2004/02/skos/core#
vcard
⇨http://www.w3.org/2006/vcard/ns#
xsd
⇨http://www.w3.org/2001/XMLSchema#
freq
⇨http://purl.org/cld/freq/
Jeu de données
La notion équivalente au jeu de données sur data.gouv.fr (Dataset
) est un noeud de type dcat:Dataset
en RDF.
data.gouv.fr | RDF | Notes | |
---|---|---|---|
Titre | title |
dct:title |
|
Acronyme | acronym |
skos:altLabel |
|
Description | description |
dct:description |
Éventuellement HTML transformé en Markdown |
Mots-clés | tags |
dcat:keyword + dcat:theme |
|
Licence | license |
dct:license et dct:right depuis dcat:distributions |
|
Couverture spatiale | spatial |
❌ | |
Couverture temporelle | temporal_coverage |
dct:temporal |
|
Fréquence de mise à jour | frequency |
dct:accrualPeriodicity |
Extras
Certaines propriétés sont conservées dans les attributs clés-valeurs extras
par soucis de traçabilité :
data.gouv.fr extras |
RDF | Notes | |
---|---|---|---|
Identifiant distant | harvest:remote_id |
dct:identifier |
Conservé aussi sous dct:identifier |
URI | uri |
ID du noeud | URIRef |
Resssource
La notion équivalente à la ressource sur data.gouv.fr (Resource
) est un noeud de type dcat:Distribution
en RDF.
data.gouv.fr | RDF | Notes | |
---|---|---|---|
Titre | title |
dct:title |
Propriété facultative, un nom est généré sinon |
Description | description |
dct:description |
Éventuellement HTML transformé en Markdown |
URL | url |
dcat:downloadURL et dcat:accessURL |
Priorité à dcat:downloadURL |
Taille | filesize |
dcat:bytesSize |
|
Type MIME | mime |
dcat:mediaType |
|
Format | format |
dct:format |
|
Somme de contrôle | checksum |
spdx:checksum (spdx:algorithm + spdx:checksumValue ) |
|
Date de mise à jour | modified |
dct:modified |
|
Date de publication | published |
dct:issued |
Extras
Certaines propriétés sont conservées dans les attributs clés-valeurs extras
par souci de traçabilité :
data.gouv.fr Resource.extras |
RDF | Notes | |
---|---|---|---|
Identifiant distant | dct:identifier |
dct:identifier |
|
URI | uri |
dct:identifier |
Si dct:identifier est un URIRef |
Contribuer
Ce moissonneur fait partie du coeur de udata
, son code est disponible sur github. Vous pouvez donc soumettre des améliorations ou signaler des anomalies.