ONIX, OPF, ISNI, CLIL : Parlez-vous métadonnées du livre ? (Partie 1)
Les métadonnées sont essentielles pour la promotion des catalogues des éditeurs. 94 % des éditeurs seraient en tout cas de cet avis, d’après le SNE (Syndicat National de l’Édition). Dans le même temps, ils seraient 77 % à ne pas savoir comment améliorer ces métadonnées. Première partie du retour sur la formation aux métadonnées, donnée au PILEn (Partenariat Interprofessionnel du Livre et de l’Édition numérique) par Stéphane Leroy par l’entremise d’Edinovo.
Métadonnées et référentiels de métadonnées : organiser la jungle de l’information
La métadonnée est une donnée sur une donnée. Une donnée donnant une caractéristique sur une autre donnée. La métadonnée sert, d’une part à décrire une donnée, d’autre part à établir des relations entre données. Dit autrement encore, la métadonnée détaille et permet de trouver. C’est pour cette raison qu’elle est si importante pour les éditeurs et éditrices.
Les métadonnées sont rangées dans des registres. Il existe plusieurs registres, organisant chacun différemment les métadonnées. Ces registres sont appelés des référentiels de métadonnées. Ces référentiels posent une sémantique et une structuration des éléments qui leur sont propres, un cadre d’autorité à respecter par les personnes utilisant tel ou tel référentiel. Les référentiels de métadonnées sont nombreux. Tous n’ont pas réussi à s’imposer. L’un des plus connus se nomme Dublin Core (DC). Ce référentiel de métadonnées est géré par la Dublin Core Metadata Initiative, ou DCMI. La DCMI assure la maintenance du registre DC, notamment quand des évolutions sont nécessaires. Chaque référentiel possède son propre organisme de gestion.
Les métadonnées sont internes ou externes à un fichier. Internes, tout d’abord : un fichier photo par exemple contient toute une série d’informations (date de la prise de vue, objectif utilisé, durée d’obturation, etc.). Le logiciel affichant cette photo peut fournir toute une série d’informations supplémentaires ; via le référentiel IPTC (International Press Telecommunications Council), on peut ajouter une description de l’image, des mots-clés, un copyright, etc. C’est l’aspect renseignement de métadonnées, utile notamment pour être visible par les moteurs de recherche. Les métadonnées peuvent aussi être externes, stockées dans un autre fichier destiné à constituer, avec d’autres fichiers externes, une base de données. Par exemple, les données publiques de la région Bretagne disponibles sur ows.region-bretagne.fr. C’est l’aspect catalogue de métadonnées.
De MARC à ISNI : le livre et les métadonnées, une longue histoire
Les bibliothécaires sont les premiers à se pencher sur les métadonnées ; les premiers modèles de notices bibliographiques voient le jour au XIXe siècle. Mais c’est bien l’avènement de l’informatique qui fait entrer les métadonnées et le monde du livre dans une nouvelle dimension ; le format MARC (MAchine Readable Cataloging), une notice bibliographique lisible par ordinateur, est adopté par plusieurs bibliothèques dès 1968.
En 1970, l’ISBN (International Standard Book Number) est créé. Il ne compte à l’époque que 10 chiffres. L’ISBN à 13 chiffres, qu’on peut rapprocher de l’EAN (European Article Number), arrive en 2007 pour s’harmoniser sur un autre standard : le code-barres. Adopté par les acteurs et actrices de la chaîne du livre, ce numéro de série permet de simplifier la gestion des références. En effet, chaque ISBN est unique, mais toutes les structures d’ISBN sont les mêmes et se lisent de cette façon :
- trois premiers chiffres : pays du livre ;
- quatrième chiffre : langue utilisée ;
- cinquième à huitième chiffres : identification de l’éditeur ou éditrice ;
- neuvième à douzième chiffres : identification de la manifestation (c’est-à-dire : une édition poche d’un livre x, une édition avec annexes d’un livre y, etc.)
- treizième chiffre : clé de contrôle destinée à l’algorithme.
L’ISBN est attribué une fois pour toutes. Si un livre connaît plusieurs formats (papier, ePub, PDF, etc.), chaque format aura son propre ISBN. Si le contenu du livre est modifié (nouvelle édition, édition illustrée, nouvelle couverture, etc.), un nouvel ISBN sera attribué. Si les droits d’usage diffèrent (téléchargement, prêt numérique en bibliothèque, etc.), chaque droit générera un ISBN propre.
En 1994, c’est la révolution d’Internet ; désormais, on peut échanger des données depuis des lieux différents. Par la force des choses, la question des langages communs, et donc des référentiels de métadonnées, s’accentue. C’est ainsi qu’en 1998, le langage XML (EXtensible Markup Language, ou langage de balisage extensible) est défini ; il est désormais possible de créer et partager n’importe quel vocabulaire structuré de description, ou référentiel, qui sera lisible par n’importe quelle machine.
En 2000, un référentiel XML voit le jour pour la description du livre : ONIX (ONline Information eXchange). Ce standard de description, qui ne concerne à l’époque que le livre imprimé, a une dimension commerciale car il reprend des informations marketing, sur le prix, etc. ONIX est donc pensé pour les maisons d’édition et les libraires, pas pour les bibliothécaires qui utilisent plutôt le système MARC, plus descriptif. Depuis 2009, ONIX 3.0 permet la description du livre numérique également. Les métadonnées propres au livre numérique interactif ne sont pas intégrées à ONIX 3.0, ce qui ne permet pas la commercialisation correcte de ce produit, en particulier par les librairies indépendantes.
En 2012, l’ISNI (International Standard Name Identifier) vient compléter les métadonnées du livre ; l’ISNI permet, comme son nom l’indique, d’identifier tout créateur d’une œuvre de façon certaine dans le monde entier, peu importe si l’orthographe du nom diffère ou si un homonyme existe. Certains grands revendeurs ont adopté un système propre à eux (ASNI pour Amazon, par exemple). Chaque ISNI est lié à une notice, qui peut être complétée au fur et à mesure par qui de droit. À noter que d’autres identifiants existent, comme le DOI (Digital Object Identifier, pour les ressources numériques accessibles sur le web : podcasts audio, vidéos, articles) ou le ISSN (International Standard Serial Number, pour les publications périodiques).
Ailleurs sur Lettres Numériques :
- ONIX, OPF, ISNI, CLIL : Parlez-vous métadonnées du livre ? (Partie 2)
- Métadonnées commerciales : un enjeu crucial pour les éditeurs
- Métadonnées et mots-clés… du succès ?
Retrouvez Lettres Numériques sur Twitter, Facebook et LinkedIn.
— Gilles Simon