Une zone 309 pour coordonner le travail collectif sur la qualité des données Sudoc

Au moment du chargement de nouvelles notices ou à l’occasion d’un chantier de contrôle qualité, l’ABES peut être amenée à effectuer des modifications de masse pour améliorer ou corriger des notices. Hélas, tout n’est pas automatisable – surtout si on tient à conserver un certain niveau de qualité bibliographique. Une fois que les algorithmes ont parlé et atteint leurs limites, l’ABES passe le relais au réseau, qui possède la force de frappe et l’expertise humaine pour continuer le travail, ne serait-ce qu’en se concentrant sur l’essentiel ou le prioritaire.

Mais, précisément, qu’est-ce qui est essentiel ? Qu’est-ce qui est prioritaire ? Sur quelles notices faut-il que le réseau se mobilise ? Et sur quels points précis dans les notices ? Étant donné la taille de la base, le volume des entrées et la richesse des règles, chaque catalogueur, chaque service de catalogage peut se sentir perdu devant l’ampleur de la tâche. C’est pourquoi l’ABES souhaite structurer d’avantage l’organisation de cet immense travail collectif. Cette volonté se traduit aujourd’hui sous une forme très concrète : la zone 309…

309_en_chantier
Cette « note d’information interne au Sudoc » existait déjà, mais elle ne possédait qu’une sous-zone ($a) :

309 ##$aCORRIGER LE(S) CODE(S) DE FONCTION = 000 EN 7XX, L7XX et/ou E7XX. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

Elle est désormais structurée, ce qui permet une meilleure exploitation.

309 et ToDoList

Ainsi, dans le cadre des travaux du hub de métadonnées sur les ebooks de droit international achetés dans le cadre d’ISTEX, certains traitements automatiques ont permis d’enrichir les données, notamment en ajoutant des liens aux autorités auteur. Quand le programme n’a pas su identifier la bonne autorité, une zone 309 a été injectée dans la notice bibliographique concernée, pour inciter les catalogueurs à poursuivre le travail et les guider.

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$d2014-04-09 11:15:01.894

Dans la sous-zone $b, on trouvera l’identifiant du chantier ou du corpus auquel correspond cette zone de note. Grâce à cet identifiant précis, il est aisé d’effectuer des statistiques plus fines sur les chantiers qualité en cours, mais surtout de fournir aux catalogueurs la liste toujours à jour des notices à traiter. Pour accéder à cette liste, il suffit de se rendre à une adresse web ainsi construite :

http://www.sudoc.fr/services/chantier/ + {contenu de la $b}.

Ce qui donne, pour l’exemple précédent :

http://www.sudoc.fr/services/chantier/BRILL-RADI-LN.

A cette adresse, on récupère un fichier à ouvrir dans Excel : il s’agit d’un tableau qui liste toutes les notices à corriger, en précisant la correction à effectuer. En entête du tableau, quelques chiffres et pourcentages permettent de mesurer la progression du chantier, pour voir si on tient le bon bout… Pour des raisons de fond ou des raisons techniques, ces tableaux ne seront pas disponibles quand les 309 concerneront des chantiers qui touchent à des notices importées ou à un trop grand nombre de notices.

L’ABES propose. Le réseau dispose.

Enfin, dans certains cas, le programme a travaillé mais n’ose pas trancher. Pour reprendre l’exemple précédent, son cœur peut balancer entre deux autorités. Voire considérer que, même si une seule autorité est en lice, il serait imprudent de conclure aveuglément qu’il s’agit de la bonne. On trouvera alors en $c le(s) PPN que le programme suggère sans oser le(s) retenir. Cette liste de PPN se présente sous la forme d’une requête WinIBW :

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$cche PPN1 ou PPN2$d2014-04-09 11:15:01.894

Il s’agit d’une aide à la décision pour le catalogueur, qui, s’il le souhaite, peut se contenter d’examiner les PPN proposés, sans s’attarder sur les autres PPN qu’une recherche sur le nom pourrait renvoyer.
Qu’il suive les suggestions du programme ou non, le catalogueur crée le lien manquant puis n’oublie pas de supprimer la 309 correspondante. La notice disparaît alors du tableau des notices à traiter pour tel chantier (sauf si cette notice contient une autre 309 pour ce même chantier).

Aller plus loin

Ce nouveau dispositif se veut très pragmatique. Il s’agit d’améliorer l’efficacité collective du réseau sans compliquer la vie des catalogueurs. On pourrait imaginer d’autres dispositifs et l’ABES n’exclut pas de proposer au réseau d’autres manières d’intervenir sur les données. D’avance, merci pour vos retours, vos suggestions et … votre chasse aux 309.

NB : les chantiers en cours sont listés dans la page du guide méthodologique qui documente la zone 309 : http://documentation.abes.fr/sudoc/formats/unmb/zones/309.htm.

Y. Nicolas

Colodus : quel impact sur l’organisation du travail ?

COLODUS-04Interface web, Colodus ne nécessite aucune installation sur les postes de travail. Son utilisation n’est conditionnée qu’à l’attribution de login créés préalablement dans le cadre du réseau Sudoc par le coordinateur Sudoc, dans le cadre du réseau Sudoc-PS par le responsable du centre régional.

Le développement de masques de saisie prédéfinis ou personnalisés permet de travailler dans Colodus rapidement et efficacement sans pour autant exiger de l’utilisateur une forte expertise du format de catalogage.

Chaque établissement devra décider de l’opportunité de former son personnel à Colodus et déléguer à une partie des professionnels des tâches de corrections, de suppression ou de mises à jours des données d’exemplaire.

Colodus est une porte d’entrée pour s’initier puis approfondir sa connaissance du format et des règles de description des exemplaires puisque toutes les subtilités du format peuvent être restituées.

L’ABES souhaite que ce nouvel outil permette la sensibilisation des acteurs des réseaux  Sudoc et Sudoc-PS à la qualité des données d’exemplaires du catalogue Sudoc.

Mais Colodus ne concerne que les données d’exemplaires de son RCR et ne permet aucune intervention sur la notice bibliographique.

CPD

Colodus : coup de projecteur sur les données des exemplaires

COLODUS-03Par rapport à WinIBW, Colodus a des fonctionnalités très limitées. Colodus  propose « seulement » un habillage du format de catalogage  avec des libellés en clair pour faciliter la saisie de l’information. Mais ce « seulement » est l’occasion de se pencher sur les spécificités des données d’exemplaires.

Liés à des impératifs du système central du Sudoc, l’ABES distingue  depuis l’origine  deux formats de catalogage des exemplaires :

1/ un format spécifique aux établissements non déployés et rattachés à un centre régional du réseau Sudoc-PS,

2/ un format propre aux établissements déployés dans le Sudoc.

Aussi, Colodus applique à la lettre les règles de description et les formats de catalogage des exemplaires pratiquées dans le Sudoc depuis plus de 10 ans.

Ces règles sont empiriques et les formats sont des formats maison, sans normalisation internationale comme c’est le cas pour Unimarc ou Marc21 par exemple.

Colodus pourrait bien être l’occasion de s’interroger sur certaines pratiques  en usage. Les listes de discussion des réseaux Sudoc et Sudoc-PS pourront  permettre à chacun de s’exprimer et de faire avancer la réflexion. L’ABES sera à l’écoute de ses débats et si les formats de catalogage des exemplaires devaient évoluer, l’ABES l’implémentera dans Colodus.

N’espérez cependant pas de miracle !

Certains points de description, par exemple l’ordre de validation de codes de sous-zones sont intrinsèquement liés aux impératifs de validation de système central du Sudoc. L’ABES ne pourra pas y remédier, tant que le système central du Sudoc (CBS) est ce qu’il est.

Par contre, d’autres éléments d’ergonomie, d’affichage, voire de nouvelles fonctionnalités pourront être étudiés et l’ABES s’efforcera de faire évoluer Colodus selon vos besoins.

CPD

Colodus et WinIBW ? Colodus ou WinIBW ?

COLODUS-02Avant l’ouverture de Colodus, il n’existait qu’un seul outil pour décrire les exemplaires : le logiciel client WinIBW interconnecté avec le système central du Sudoc, CBS. Ces deux outils ont été développés par la société PICA (rachetée depuis par OCLC).

WinIBW est un outil robuste et complet mais son ergonomie est datée et il nécessite une installation parfois jugée fastidieuse.

S’inspirant de principe de production de données via des interfaces web (IdRef), l’ABES a souhaité développer une interface web pour la production de données d’exemplaires dans le Sudoc (cf. billet « Exemplariser sans WinIBW » https://punktokomo.abes.fr/2012/01/13/exemplariser-sans-winibw/.)

Par rapport à WinIBW, Colodus a les avantages suivants :

  • Colodus est gratuit. L’activité bibliographique réalisée via Colodus par le réseau Sudoc rentre dans le modèle de facturation général.
  • Colodus peut être utilisé sur n’importe quel poste disposant d’un accès internet. Colodus est optimisé pour Firefox.
  • Colodus propose un habillage du format de catalogage  avec des libellés en clair pour faciliter la saisie.

Mais Colodus n’anticipe pas une disparition programmée de WinIBW.

Tout d’abord Colodus ne concerne que les données d’exemplaires soit une infime proportion de l’ensemble des fonctionnalités de WinIBW. Ensuite, le système CBS demeure le cœur central de l’application. En effet, l’accès et l’utilisation de Colodus sont conditionnés par l’existence d’identifiants de connexion au système central du Sudoc (CBS) et le seul outil de création de ces identifiants est WinIBW.

Par conséquent, pour l’environnement Sudoc, Colodus ne peut être utilisé que par les établissements identifiés dans le réseau Sudoc et propriétaire d’au moins une licence WinIBW.

Alors pourquoi choisir d’utiliser Colodus ?

Dans WinIBW, pour décrire des exemplaires, le catalogueur part d’une page blanche : il doit connaître sur le bout de doigt toutes les possibilités du format.

Dans Colodus, le catalogueur se voit proposer des masques de saisie. Ces formulaires peuvent être personnalisés.

Colodus propose des zones par défaut : les zones obligatoires pour la validation d’une notice d’exemplaire, les zones facultatives pour favoriser la complétude de l’information disponible, les zones attendues pour la description d’exemplaires des documents spécifiques (documents électroniques, ressources continues…). En connexion directe avec le CBS, toute  intervention sur les données  – création, modification, suppression des exemplaires – met à jour instantanément la base du Sudoc.

Colodus a pour ambition via une ergonomie simplifiée de faciliter le travail de gestion de vos exemplaires mais aussi de permettre aisément un enrichissement qualitatif de toute l’information disponible sur vos données.

CPD

Colodus : un outil, deux profils

COLODUS-01Exemplariser sans WinIBW a déjà été évoqué sur ce blog (ici https://punktokomo.abes.fr/2012/01/13/exemplariser-sans-winibw/ et ici https://punktokomo.abes.fr/2013/01/14/colodus-exemplariser-sans-winibw/).

L’ouverture de Colodus est effective pour le réseau Sudoc-PS depuis le 2 avril 2013. Elle le sera pour le réseau Sudoc le 16 septembre 2013.

Colodus s’adresse par conséquent à tous les acteurs du réseau Sudoc (Sudoc et Sudoc-PS) habilités à intervenir sur les données d’exemplaires de leur établissement.
Selon son identifiant l’utilisateur accède à un environnement de travail Sudoc ou Sudoc-PS.

L’environnement Sudoc PS

Il fait intervenir deux types d’acteurs chacun doté d’une habilitation particulière.

  • LE RESPONSABLE CR : il est habilité à intervenir sur tous les exemplaires des RCR dont il a la charge au sein de son CR. Il a la charge de créer et de distribuer les logins « exemplarisateur » pour les RCR de son CR (cette opération ne se fait pas dans Colodus (cf. billet Colodus et WinIBW ? Colodus ou WinIBW ? ).
  • L’EXEMPLARISATEUR : il est habilité à intervenir sur les seules données d’exemplaire de son RCR de rattachement.

L’environnement Sudoc

Dans cet environnement, il n’existe qu’un seul type d’acteur, l’EXEMPLARISATEUR. Il est habilité à intervenir sur les seules données d’exemplaire de son RCR de rattachement.
Quel que soit l’environnement concerné, Colodus poursuit un même but : faciliter le travail d’exemplarisation des notices bibliographiques du Sudoc (cf billet Coup de projecteur sur les données des exemplaires ). Il s’agit de permettre une saisie simplifiée des informations de localisation en proposant au professionnel toutes les possibilités du format pour enrichir ses données.

Articulé sur 3 onglets, Colodus propose une suite d’événements logiques depuis la recherche d’une notice bibliographique jusqu’à l’affichage des exemplaires.
Colodus concerne donc le dernier maillon dans la chaîne de traitement du document : la création/modification de l’exemplaire qui a pour conséquence de rendre l’information visible par le grand public. Colodus ne permet aucune intervention sur le niveau bibliographique d’une notice.

IdRef dans VIAF et après … #2 Faciliter et améliorer le catalogage par dérivation

Ce post de fil.abes.fr annonce l’intégration du référentiel IdRef à VIAF et en présente les enjeux stratégiques. Punktokomo prend le relais pour détailler quelques implications pratiques. En voici la deuxième.

Grâce à MARC et Z39.50, le catalogage est d’ores et déjà une pratique professionnelle locale qui fonctionne dans un cadre global. L’idéal visé est le suivant : pour chaque livre, sa notice bibliographique est créée une fois, par quelqu’un, quelque part, puis échangée, reprise, exemplarisée autant de fois que nécessaire, partout, par tous.

Dans le cadre du Sudoc, plutôt que de créer ex nihilo une notice qui manque, le catalogueur interroge d’autres catalogues à la recherche de cette notice. S’il la trouve, il la récupère dans l’outil de catalogage du Sudoc et l’intègre telle quelle, … à beaucoup de détails près… C’est ce qu’on appelle du catalogage par dérivation. En voici un tutoriel, propre au contexte du Sudoc :

Parmi les adaptions à faire pour acclimater une notice externe à son nouvel environnement Sudoc, une des plus lourdes est de lier les points d’accès de la nouvelle notice aux autorités Sudoc (ie IdRef) : indexation matière, auteurs et autres mentions de responsabilité. Dans le cas des auteurs par exemple, il s’agit en général d’identifier dans les autorités Sudoc (ie IdRef) la bonne notice à partir d’un nom et d’un prénom (éventuellement complétés par une date). C’est une tâche très importante, mais parfois difficile, consommatrice de temps et sujette à erreur.

Or, il faut savoir que certains des catalogues qui servent de source à la dérivation dans le Sudoc sont eux-mêmes des catalogues sous contrôle d’autorité : en interne, leurs propres notices bibliographiques sont liées à des notices d’autorité, grâce à un identifiant. C’est le cas, par exemple, du catalogue de la bibliothèque nationale d’Allemagne et même de Worldcat. Par exemple, après vérification, il s’avère que la notice de Worldcat 212038123 est liée à une notice d’autorité interne et que cette autorité interne n’est qu’un clone de la notice nb98088322 du fichier d’autorité de la Bibliothèque du Congrès (LC). Hélas, quand cette notice Worldcat est exposée en ligne, soit par le Z39.50 auquel l’outil de catalogage du Sudoc est connecté, soit par web service, la mention de l’autorité a disparu : à la place de son identifiant, il ne reste qu’une chaîne de caractères (nom/prénom)… à partir de laquelle le catalogueur doit chercher une autorité Sudoc (en l’occurrence, 076940322).

Or, grâce à VIAF, si Worldcat exposait ses autorités internes – ou encore mieux l’identifiant LC -, il deviendrait possible d’automatiser cette tâche manuelle. En effet, cette grappe de VIAF met en relation l’autorité LC et l’autorité Sudoc (IdRef) que nous venons de prendre pour exemples. Dès lors, grâce aux solutions techniques proposées par VIAF, l’outil de catalogage du Sudoc pourrait automatiser cette tâche-ci du catalogage par dérivation qui consiste à lier un nom à une autorité Sudoc. Ce serait un gain de temps et sans doute en qualité. Certes, personne ne croit aux miracles ! VIAF ne réussit pas toujours à lier des autorités préexistantes. Et quand l’auteur n’a pas encore sa notice dans le Sudoc, il faut bien la créer. Mais ce serait néanmoins un progrès non négligeable.

Hélas, avant de mettre en place cette solution, il faudra attendre que Worldcat et les autres bases aient inclus dans les notices bibliographiques qu’elles exposent le lien à des autorités intégrées à VIAF. Côté Worldcat, l’ABES a explicitement transmis à OCLC une demande d’évolution allant dans ce sens. Pour d’autres bases, ce n’est pas encore le cas. Pour d’autres bases encore, c’est encore plus hypothétique : dans un catalogue comme celui de la Bibliothèque du Congrès, même en interne, il n’existe pas de lien matériel entre les notices bibliographiques et les notices d’autorité : seule la forme retenue de l’autorité est présente dans la notice bibliographique, mais pas son identifiant. La migration vers RDA et au-delà devrait permettre de dépasser ce manque.

Y. Nicolas