IdRef dans VIAF et après … #2 Faciliter et améliorer le catalogage par dérivation

Ce post de fil.abes.fr annonce l’intégration du référentiel IdRef à VIAF et en présente les enjeux stratégiques. Punktokomo prend le relais pour détailler quelques implications pratiques. En voici la deuxième.

Grâce à MARC et Z39.50, le catalogage est d’ores et déjà une pratique professionnelle locale qui fonctionne dans un cadre global. L’idéal visé est le suivant : pour chaque livre, sa notice bibliographique est créée une fois, par quelqu’un, quelque part, puis échangée, reprise, exemplarisée autant de fois que nécessaire, partout, par tous.

Dans le cadre du Sudoc, plutôt que de créer ex nihilo une notice qui manque, le catalogueur interroge d’autres catalogues à la recherche de cette notice. S’il la trouve, il la récupère dans l’outil de catalogage du Sudoc et l’intègre telle quelle, … à beaucoup de détails près… C’est ce qu’on appelle du catalogage par dérivation. En voici un tutoriel, propre au contexte du Sudoc :

[slideshare id=30002336&style=border:1px solid #CCC;border-width:1px 1px 0;margin-bottom:5px&sc=no]

Parmi les adaptions à faire pour acclimater une notice externe à son nouvel environnement Sudoc, une des plus lourdes est de lier les points d’accès de la nouvelle notice aux autorités Sudoc (ie IdRef) : indexation matière, auteurs et autres mentions de responsabilité. Dans le cas des auteurs par exemple, il s’agit en général d’identifier dans les autorités Sudoc (ie IdRef) la bonne notice à partir d’un nom et d’un prénom (éventuellement complétés par une date). C’est une tâche très importante, mais parfois difficile, consommatrice de temps et sujette à erreur.

Or, il faut savoir que certains des catalogues qui servent de source à la dérivation dans le Sudoc sont eux-mêmes des catalogues sous contrôle d’autorité : en interne, leurs propres notices bibliographiques sont liées à des notices d’autorité, grâce à un identifiant. C’est le cas, par exemple, du catalogue de la bibliothèque nationale d’Allemagne et même de Worldcat. Par exemple, après vérification, il s’avère que la notice de Worldcat 212038123 est liée à une notice d’autorité interne et que cette autorité interne n’est qu’un clone de la notice nb98088322 du fichier d’autorité de la Bibliothèque du Congrès (LC). Hélas, quand cette notice Worldcat est exposée en ligne, soit par le Z39.50 auquel l’outil de catalogage du Sudoc est connecté, soit par web service, la mention de l’autorité a disparu : à la place de son identifiant, il ne reste qu’une chaîne de caractères (nom/prénom)… à partir de laquelle le catalogueur doit chercher une autorité Sudoc (en l’occurrence, 076940322).

Or, grâce à VIAF, si Worldcat exposait ses autorités internes – ou encore mieux l’identifiant LC -, il deviendrait possible d’automatiser cette tâche manuelle. En effet, cette grappe de VIAF met en relation l’autorité LC et l’autorité Sudoc (IdRef) que nous venons de prendre pour exemples. Dès lors, grâce aux solutions techniques proposées par VIAF, l’outil de catalogage du Sudoc pourrait automatiser cette tâche-ci du catalogage par dérivation qui consiste à lier un nom à une autorité Sudoc. Ce serait un gain de temps et sans doute en qualité. Certes, personne ne croit aux miracles ! VIAF ne réussit pas toujours à lier des autorités préexistantes. Et quand l’auteur n’a pas encore sa notice dans le Sudoc, il faut bien la créer. Mais ce serait néanmoins un progrès non négligeable.

Hélas, avant de mettre en place cette solution, il faudra attendre que Worldcat et les autres bases aient inclus dans les notices bibliographiques qu’elles exposent le lien à des autorités intégrées à VIAF. Côté Worldcat, l’ABES a explicitement transmis à OCLC une demande d’évolution allant dans ce sens. Pour d’autres bases, ce n’est pas encore le cas. Pour d’autres bases encore, c’est encore plus hypothétique : dans un catalogue comme celui de la Bibliothèque du Congrès, même en interne, il n’existe pas de lien matériel entre les notices bibliographiques et les notices d’autorité : seule la forme retenue de l’autorité est présente dans la notice bibliographique, mais pas son identifiant. La migration vers RDA et au-delà devrait permettre de dépasser ce manque.

Y. Nicolas

Cet article a 4 commentaires

  1. punktauteur

    Nous travaillons à mettre en place ce script dans l’outil de catalogage du Sudoc (WinIBW), qui faciliterait le lien aux autorités IdRef en exploitant le travail de VIAF. Pour un aperçu du fonctionnement futur de ce script, regardez le schéma animé présenté par O. Rousseaux (pôle Métadonnées, ABES) aux dernières journées ABES : http://www.abes.fr/Media/Fichiers/Article-WEB/Journees-ABES/2012/JABES2012_session_autour_des_autorites (vers le milieu, section introduite par la page de titre « côté catalogage »).
    L’ensemble de cette présentation, faite par O. Rousseaux et Y. Nicolas, tournait autour (!) du fait que les autorités ne sont plus confinées dans leur propre catalogue. Devenues IdRef, les autorités du Sudoc ne sont plus les seules autorités du Sudoc. Les autorités Sudoc doivent également cohabiter avec d’autres référentiels, locaux ou globaux. Enfin, comme le montrent les conclusions du projet SudocAD, il est désormais possible de s’appuyer sur des programmes pour automatiser en partie le lien aux autorités. Une nouvelle cohabitation/collaboration est à établir entre humains et programmes.

  2. punktauteur

    Du nouveau côté autorités et Worldcat (WC) !

    Worldcat supporte désormais les métadonnées schema.org dans ses pages HTML.
    Ces métadonnées sont cachées dans l’HTML et destinées aux moteurs de recherche notamment (comme dans Sudoc depuis un an) .
    Mais, bizarre et sympa, on peut quand même les voir (comme si la peau HTML de Worldcat était transparente #berk) : cliquer sur « linked data » au base de cette page : http://www.worldcat.org/title/malaparte/oclc/11684553#microdatabox

    Super, on y voit des liens aux autorités !! Des autorités LC. Et même du Viaf !
    C’est bon ça ! Même si leur Z39.50 ne contient toujours pas les liens aux autorités, on entrevoit ici un moyen de les avoir via la page HTML et ses métadonnées.

    Bibliographiquement, on a l’OCN (identifiant WC) pour appeler la page biblio (ex:11684553). Et dans la page on trouve du VIAF, du LC etc… à partir de quoi on peut récupérer les PPN (identifiant IdRef/Sudoc) via VIAF. Que demander de plus… ? C’est pas direct, mais c’est.

    Techniquement,il faut veiller à faciliter et fiabiliser le travail d’analyse de la page HTML pour en extraire les métadonnées schema.org.
    Quelque chose comme ce service, qui génère les métadonnées en JavaScript (JSON) à partir de la page HTML+microdata :
    http://omnidator.appspot.com/microdata/json/?url=http://www.worldcat.org/title/malaparte/oclc/11684553

    NB : omnidator est l’oeuvre du brillant @edsu : http://inkdroid.org/journal/about/
    NB : d’autres outils qui mangent du schema.org : http://schema.rdfs.org/tools.html

Laisser un commentaire

Aller au contenu principal