Guides méthodologiques
Production des identifiants permanents
Pourquoi un ID permanent
L'objectif de l'identifiant permanent est de pouvoir partager des concepts (observation, relevé, taxon…) issus de différents systèmes (BDD) et d'assurer l'unicité de ces concept de manière pérenne. Pour ce faire, le GBIF a réalisé une analyse des différents possibilité d'identifiant permanent, en se basant sur les critère suivants :
- persistance de l'identifiant soit le comportement de celui-ci face à la modification ou la suppression des données qui lui sont liées.
- indépendance de l'identifiant soit la génération de celui-ci à un niveau national ou à un niveau régional. Dans le contexte du SINP, il serait généré chez le fournisseur ou sur la plateforme.
- opacité de l'identifiant soit la lisibilité et la compréhension par l'homme. Ainsi cela peut être une suite de chiffres et lettres compréhensible juste par la machine ou un code lisible.
- résolution de l'identifiant soit quels sont les services ou outils à mettre en place pour récupérer les informations liées à l'identifiant.
- unicité de l'identifiant soit le lien unique qui lie un identifiant à une occurrence.
- génération de l'identifiant soit le mécanisme utilisé pour créer l'identifiant (script, algorithme…).
L'analyse complète réalisée par le GBIF est disponible ici : https://inpn.mnhn.fr/docs/standard/anaylse_identifiant_gbif_20131025.pdf
A quoi ressemble l'ID permanent
La production des identifiants permanents suivra la proposition du GBIF pour être en conformité avec le SINP. L’analyse du GBIF France conclue sur l’utilisation d’une solution d’identifiant permanent clé en main pour les utilisateurs non avertis sans empêcher des plateformes ayant des ressources nécessaires de développer leurs propres algorithmes.
L’analyse propose de se baser sur :
- une architecture permettant potentiellement d’accéder à la donnée en URL. Le type d’URL (PURL…) relève de l’architecture et n’est pas développé dans ce document.
- un UUID : Suite alphanumérique pseudo‐aléatoire générée par des algorithmes assurant à très forte probabilité le caractère unique de l’identifiant dans le monde. L'UUID est normalisé par l'ISO/IEC 9834‐8:2008. Son format est le suivant : XXXXXXXX‐YYYY‐ZZZZ‐AAAA‐BBBBBBBBBBBB. Exemple : a0eebc99‐9c0b‐4ef8‐bb6d‐6bb9bd380a11.
Ainsi la structure de l’identifiant proposée est la suivante :
http://nom_de_domaine/nom_champ_permanent/UUID
Une documentation plus complète est disponible ici : https://inpn.mnhn.fr/docs/standard/sinp_identifiantpermanent.pdf
Ce qu'il y a derrière l'URL de l'ID permanent
L’identifiant est une URL permettant l’accès à la donnée. Ainsi, le résultat qu’il donne peut être :
- une erreur (de type erreur 404)
- une ressource (page HTML ou RDF) décrivant les données de l’observation.
- un renvoi http vers une autre ressource utile à la personne ou à la machine s’intéressant à l’occurrence désignée par l’URI (approche du linked data)
Comment produire l'ID permanent
A vous de choisir la manière de produire les identifiants permanents. Si cela peut vous aider, sachez qu'il existe une fonction postgreSQL qui permet la génération d'UUID. Celle-ci est décrite dans le paragraphe generer_les_identifiants_permanents_pour_ces_donnees.
Dans ce même paragraphe, vous verrez qu'il existe une fonction du hub qui permet la génération de cet identifiant dans la partie temporaire du hub : hub_idPerm.
Rattachement géographique des relevés
La méthode de rattachement géographique élaborée à l'occasion de la première agrégation (2012/2013) est disponible ici: methode_rattachement_fcbn_v2.pdf