Une zone 309 pour coordonner le travail collectif sur la qualité des données Sudoc

Au moment du chargement de nouvelles notices ou à l’occasion d’un chantier de contrôle qualité, l’ABES peut être amenée à effectuer des modifications de masse pour améliorer ou corriger des notices. Hélas, tout n’est pas automatisable – surtout si on tient à conserver un certain niveau de qualité bibliographique. Une fois que les algorithmes ont parlé et atteint leurs limites, l’ABES passe le relais au réseau, qui possède la force de frappe et l’expertise humaine pour continuer le travail, ne serait-ce qu’en se concentrant sur l’essentiel ou le prioritaire.

Mais, précisément, qu’est-ce qui est essentiel ? Qu’est-ce qui est prioritaire ? Sur quelles notices faut-il que le réseau se mobilise ? Et sur quels points précis dans les notices ? Étant donné la taille de la base, le volume des entrées et la richesse des règles, chaque catalogueur, chaque service de catalogage peut se sentir perdu devant l’ampleur de la tâche. C’est pourquoi l’ABES souhaite structurer d’avantage l’organisation de cet immense travail collectif. Cette volonté se traduit aujourd’hui sous une forme très concrète : la zone 309…

309_en_chantier
Cette « note d’information interne au Sudoc » existait déjà, mais elle ne possédait qu’une sous-zone ($a) :

309 ##$aCORRIGER LE(S) CODE(S) DE FONCTION = 000 EN 7XX, L7XX et/ou E7XX. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

Elle est désormais structurée, ce qui permet une meilleure exploitation.

309 et ToDoList

Ainsi, dans le cadre des travaux du hub de métadonnées sur les ebooks de droit international achetés dans le cadre d’ISTEX, certains traitements automatiques ont permis d’enrichir les données, notamment en ajoutant des liens aux autorités auteur. Quand le programme n’a pas su identifier la bonne autorité, une zone 309 a été injectée dans la notice bibliographique concernée, pour inciter les catalogueurs à poursuivre le travail et les guider.

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$d2014-04-09 11:15:01.894

Dans la sous-zone $b, on trouvera l’identifiant du chantier ou du corpus auquel correspond cette zone de note. Grâce à cet identifiant précis, il est aisé d’effectuer des statistiques plus fines sur les chantiers qualité en cours, mais surtout de fournir aux catalogueurs la liste toujours à jour des notices à traiter. Pour accéder à cette liste, il suffit de se rendre à une adresse web ainsi construite :

http://www.sudoc.fr/services/chantier/ + {contenu de la $b}.

Ce qui donne, pour l’exemple précédent :

http://www.sudoc.fr/services/chantier/BRILL-RADI-LN.

A cette adresse, on récupère un fichier à ouvrir dans Excel : il s’agit d’un tableau qui liste toutes les notices à corriger, en précisant la correction à effectuer. En entête du tableau, quelques chiffres et pourcentages permettent de mesurer la progression du chantier, pour voir si on tient le bon bout… Pour des raisons de fond ou des raisons techniques, ces tableaux ne seront pas disponibles quand les 309 concerneront des chantiers qui touchent à des notices importées ou à un trop grand nombre de notices.

L’ABES propose. Le réseau dispose.

Enfin, dans certains cas, le programme a travaillé mais n’ose pas trancher. Pour reprendre l’exemple précédent, son cœur peut balancer entre deux autorités. Voire considérer que, même si une seule autorité est en lice, il serait imprudent de conclure aveuglément qu’il s’agit de la bonne. On trouvera alors en $c le(s) PPN que le programme suggère sans oser le(s) retenir. Cette liste de PPN se présente sous la forme d’une requête WinIBW :

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$cche PPN1 ou PPN2$d2014-04-09 11:15:01.894

Il s’agit d’une aide à la décision pour le catalogueur, qui, s’il le souhaite, peut se contenter d’examiner les PPN proposés, sans s’attarder sur les autres PPN qu’une recherche sur le nom pourrait renvoyer.
Qu’il suive les suggestions du programme ou non, le catalogueur crée le lien manquant puis n’oublie pas de supprimer la 309 correspondante. La notice disparaît alors du tableau des notices à traiter pour tel chantier (sauf si cette notice contient une autre 309 pour ce même chantier).

Aller plus loin

Ce nouveau dispositif se veut très pragmatique. Il s’agit d’améliorer l’efficacité collective du réseau sans compliquer la vie des catalogueurs. On pourrait imaginer d’autres dispositifs et l’ABES n’exclut pas de proposer au réseau d’autres manières d’intervenir sur les données. D’avance, merci pour vos retours, vos suggestions et … votre chasse aux 309.

NB : les chantiers en cours sont listés dans la page du guide méthodologique qui documente la zone 309 : http://documentation.abes.fr/sudoc/formats/unmb/zones/309.htm.

Y. Nicolas

Colodus et WinIBW ? Colodus ou WinIBW ?

COLODUS-02Avant l’ouverture de Colodus, il n’existait qu’un seul outil pour décrire les exemplaires : le logiciel client WinIBW interconnecté avec le système central du Sudoc, CBS. Ces deux outils ont été développés par la société PICA (rachetée depuis par OCLC).

WinIBW est un outil robuste et complet mais son ergonomie est datée et il nécessite une installation parfois jugée fastidieuse.

S’inspirant de principe de production de données via des interfaces web (IdRef), l’ABES a souhaité développer une interface web pour la production de données d’exemplaires dans le Sudoc (cf. billet « Exemplariser sans WinIBW » https://punktokomo.abes.fr/2012/01/13/exemplariser-sans-winibw/.)

Par rapport à WinIBW, Colodus a les avantages suivants :

  • Colodus est gratuit. L’activité bibliographique réalisée via Colodus par le réseau Sudoc rentre dans le modèle de facturation général.
  • Colodus peut être utilisé sur n’importe quel poste disposant d’un accès internet. Colodus est optimisé pour Firefox.
  • Colodus propose un habillage du format de catalogage  avec des libellés en clair pour faciliter la saisie.

Mais Colodus n’anticipe pas une disparition programmée de WinIBW.

Tout d’abord Colodus ne concerne que les données d’exemplaires soit une infime proportion de l’ensemble des fonctionnalités de WinIBW. Ensuite, le système CBS demeure le cœur central de l’application. En effet, l’accès et l’utilisation de Colodus sont conditionnés par l’existence d’identifiants de connexion au système central du Sudoc (CBS) et le seul outil de création de ces identifiants est WinIBW.

Par conséquent, pour l’environnement Sudoc, Colodus ne peut être utilisé que par les établissements identifiés dans le réseau Sudoc et propriétaire d’au moins une licence WinIBW.

Alors pourquoi choisir d’utiliser Colodus ?

Dans WinIBW, pour décrire des exemplaires, le catalogueur part d’une page blanche : il doit connaître sur le bout de doigt toutes les possibilités du format.

Dans Colodus, le catalogueur se voit proposer des masques de saisie. Ces formulaires peuvent être personnalisés.

Colodus propose des zones par défaut : les zones obligatoires pour la validation d’une notice d’exemplaire, les zones facultatives pour favoriser la complétude de l’information disponible, les zones attendues pour la description d’exemplaires des documents spécifiques (documents électroniques, ressources continues…). En connexion directe avec le CBS, toute  intervention sur les données  – création, modification, suppression des exemplaires – met à jour instantanément la base du Sudoc.

Colodus a pour ambition via une ergonomie simplifiée de faciliter le travail de gestion de vos exemplaires mais aussi de permettre aisément un enrichissement qualitatif de toute l’information disponible sur vos données.

CPD

Colodus : exemplariser sans WinIBW

Colodus, la nouvelle application pour exemplariser dans le Sudoc, est en cours de recettage.

Il est prévu une ouverture en deux temps, Colodus sera disponible pour le réseau Sudoc-PS à compter du 1er avril 2013 et pour l’ensemble du réseau Sudoc le 1er septembre 2013.