PUNKTOKOMO

Exposition des données du Centre international de l’ISSN par l’Abes : du nouveau pour les « zones libérées » des notices du Registre de l’ISSN

Depuis son origine, le Sudoc est alimenté en notices de ressources continues (journaux, revues, collections, sites web, blogs,…) par le Centre International d’Enregistrement des Publications en Série (CIEPS), autrement connu sous le nom d’ISSN International. La « libération » d’une partie des données gérées par le CIEPS depuis janvier 2018 permet désormais une plus large exposition de ces données auprès des usagers de l’Abes.

Le rôle majeur du CIEPS dans la description bibliographique des ressources continues, et l’attribution d’ISSN

La description bibliographique des ressources continues est une tâche complexe puisque, par définition ou presque, ces publications sont évolutives : elles ont toutes un début de publication, parfois une fin de publication effective pour les publications ‘mortes’, sans que l’on puisse prédire, pour une publication ‘vivante’ (en cours), à quelle date cette dernière cessera d’être publiée ;   elles peuvent se scinder en publications différentes, ou au contraire fusionner, etc. De plus, et plus encore dans le monde numérique, une même publication peut se décliner dans des formes ou sur des supports différents (papier/en ligne), dans des langues différentes, etc. La distinction entre différentes ressources aux contenus comparables est souvent difficile, tout comme l’établissement des « filiations » qui lient entre elles différentes publications.

Pour assurer une identification univoque de chaque ressource, et pour fiabiliser les liens entre les notices de publication affiliées, ISSN International et les centres ISSN étrangers attribuent à chaque publication un numéro ISSN[1] (deux groupes de quatre chiffres reliés par un tiret) associé à un « titre clé ».

Une collaboration unique au monde entre l’Abes et le Centre international de l’ISSN

Avant même la création de l’Abes et la mise en place du Sudoc, le Catalogue collectif national des publications en série (CCN-PS), un des ancêtres du Sudoc, géré par le centre national (CN) du CCN-PS, était alimenté en notices par le Registre de l’ISSN. De plus, le CN du CCN-PS avait mis en place une collaboration originale, et unique au monde : en plus de la récupération des informations en provenance du Registre, le réseau établi autour du CCN-PS avait la possibilité de proposer au CIEPS la création de nouvelles notices, et l’attribution concomitante d’ISSN, ou la modification de notices existantes. À la naissance de l’Abes et à la création du Sudoc, ce système a perduré.

Depuis la mi-2015, cette collaboration est organisée autour de l’outil de gestion de workflows CIDEMIS.
CIDEMIS permet aux utilisateurs habilités (essentiellement ceux des réseaux Sudoc et Sudoc-PS[2]) de faire des demandes informatisées de numérotation (demande d’attribution d’un numéro identifiant ISSN pour les notices qui en seraient dépourvues) ou de correction de notices (pour les zones « sous autorité ISSN » qui présentent des erreurs ou demandent une mise à jour : dates, pays de publication, titre, etc.), demandes accompagnées des justificatifs numérisés demandés par le CIEPS et les centres étrangers. Les centres du réseau du Sudoc-PS assurent un contrôle qualité sur les demandes émises, et en vérifient la prise en compte par le CIEPS et par les centres étrangers. En 2019, ce sont plus de 4000 demandes de numérotation et plus de 900 demandes de correction qui ont été émises et, en cinq ans, plus de 20 000 demandes ont été traitées. La notion de « correction » doit s’entendre plutôt comme « prise en compte d’évolutions », comme celles signalées plus haut (fin de parution, fusion, scission, etc.). Les notices du Registre de l’ISSN sont complètes et de très grande qualité, mais c’est la nature même des publications décrites dans ces notices que d’obliger à des « corrections ».

Une exposition plus large des données du Registre de l’ISSN depuis janvier 2018

Le modèle économique du CIEPS, largement basé sur la vente des données du Registre, ne permet pas d’exposer de manière libérale, à tous les publics, les données créées et gérées. Jusqu’en 2017, l’ensemble des données du Registre étaient accessibles exclusivement par abonnement, et leur usage au sein des réseaux du Sudoc et du Sudoc-PS essentiellement limité aux bibliothèques déployées et, d’une manière très limitative par le biais de conventions spécifiques, aux bibliothèques non déployées pour des usages très spécifiques. Ces données étaient systématiquement filtrées pour ne pas être exposées via les différents services proposés par l’Abes (XML, RDF,      Z39.50).
exposer les donnéesDepuis l’ouverture de son nouveau site web, en janvier 2018, le CIEPS a « libéré » un certain nombre de données, qui sont désormais accessibles et exploitables librement, sous réserve d’en mentionner la provenance.

Cette « libération » concerne essentiellement :

  • l’ensemble des données des notices décrivant des publications en ligne accessibles en libre accès, qui constitue un sous-ensemble du Registre de l’ISSN appelé ROAD pour « Directory of Open Access scholarly Resources »[3].
  • un certain nombre de zones de l’ensemble des notices du Registre : le « titre clé »[4], l’ISSN, le pays de publication, le medium de publication,…

Ces notices et informations sont librement exportables à partir du portail de l’ISSN,  sous licence CC-BY-NC-SA 4.0, en utilisant des « formats » et outils courants du web, comme RDF/XML[5], Json-LD, TURTLE.

Une exposition des données libérées des notices ISSN par l’Abes

En plus des usages professionnels (transferts réguliers, usage de SelfSudoc, etc), l’Abes a développé depuis longtemps un certain nombre de modalités d’exposition de ses données à l’intention de publics plus larges que ceux des bibliothèques déployées ou non déployées, modalités d’exposition se basant essentiellement sur les standards les plus courants : XML, RDF et Z39.50.

Jusque-là interdite, notamment pour respecter les conditions contractuelles spécifiques qui lient le CIEPS et l’Abes quant à la fourniture de données en provenance du Registre, l’exposition des données libérées des notices issues du Registre de l’ISSN est désormais possible selon des modalités spécifiques[6].

Il faut préciser que l’exposition concerne aussi l’ensemble des zones qui ne sont pas directement issues de l’exploitation des données en provenance du Registre, par exemple les zones de notes, les liens aux autorités d’indexation ou d’auteurs, etc.

Exposition en RDF

L’exposition en RDF des données libérées en provenance du Registre de l’ISSN concerne uniquement les notices qui sont localisées dans le Sudoc. L’accès se fait via le catalogue du Sudoc à partir de l’URL pérenne de la notice – elle-même basée sur son identifiant PPN – suivie de l’extension .rdf.

Exemple : https://www.sudoc.fr/001012509.rdf

Les données récupérées n’incluent pas les données d’exemplaire.

Exposition en XML

L’exposition des données en provenance du Registre de l’ISSN concerne uniquement les notices qui sont localisées dans le Sudoc. L’accès se fait via le catalogue du Sudoc à partir de l’URL pérenne de la notice – elle-même basée sur son identifiant PPN – suivie de l’extension .xml.

Exemple : https://www.sudoc.fr/001012509.xml

Les données récupérées incluent les données d’exemplaire.

Exposition en Z39.50

L’exposition des données en provenance du Registre de l’ISSN concerne uniquement les notices qui sont localisées dans le Sudoc. Les modalités générales de récupération des données via le service Z39.50 public offert par l’Abes sont précisées ici : http://www.abes.fr/Sudoc/Boite-a-outils-Sudoc-public/Z39.50-Sudoc-public

Vers une exposition plus large des données en provenance du CIEPS

L’Abes a réaffirmé, lors de la rédaction de son Projet d’établissement, que l’ouverture la plus large possible des données constitue un des axes forts de ses évolutions dans les années qui viennent. La collaboration unique entre le CIEPS et l’Abes pour la production et la gestion de données bibliographiques à haute valeur ajoutée, pour ces documents très particuliers que sont les ressources continues doit, dans toute la mesure du possible, être valorisée par l’exposition la plus large possible, et l’Abes va s’attacher, dans les années qui viennent, à favoriser encore ces évolutions.

En la matière, les besoins des usagers sont immenses, et le spectre est large, qui va de l’identification précise et détaillée des publications anciennes, par exemple dans le cadre de la mise en œuvre de chantiers de numérisation ou de plans de conservation partagée, à la disponibilité la plus immédiate de données fiables et à jour sur les publications en ligne disponibles en libre accès les plus récentes.

Y. Desrichard,
Service Ressources Continues, Abes

[1] Pour « International Standard Serial Number ».
[2] Le réseau Sudoc-PS correspond aux plus de 1500 bibliothèques qui ne peuvent décrire dans le catalogue du Sudoc « que » leurs collections de ressources continues, et en particulier de publications en série.
[3] Il convient de préciser que, dès la création de ROAD en 2014, l’ensemble des données de ROAD était disponible en libre accès.
[4] Le « titre clé » est attribué de manière univoque par le CIEPS et les centres étrangers de l’ISSN pour distinguer différentes publications qui portent le même titre courant.
[5] Il suffit simplement de renseigner l’ISSN souhaité dans l’URL suivante : https://portal.issn.org/resource/ISSN/[numéroISSN]?format=xml
(ex. : https://portal.issn.org/resource/ISSN/2240-967X?format=xml)
[6] L’exposition de l’ensemble des données des notices issues de ROAD sera envisagée ultérieurement.
Quitter la version mobile