De mars à juin 2020, la situation sanitaire liée à la pandémie de coronavirus a contraint les bibliothèques à fermer leurs portes, à généraliser le télétravail et à ré-organiser leurs services.
Cette période de confinement a placé des catalogueurs dans une situation paradoxale, avec des outils à disposition (WinIBW, Calames Prod, IdRef, Paprika…), une gamme de webservices mais peu ou pas de nouveautés à cataloguer.
L’Abes a donc proposé aux membres des réseaux Autorités, Calames et Sudoc des chantiers d’enrichissement et de correction de données existantes, en fournissant, en plus de l’accès aux outils, des conseils méthodologiques pour encadrer, coordonner et réaliser ces chantiers réalisés sur la base du volontariat.
Plus que de lutter contre le désœuvrement, il s’agissait sans doute, pour ces établissements, volontaires et convaincus de l’intérêt de proposer un catalogue aux données de qualité, de consacrer enfin du temps à un travail d’enrichissement nécessaire, prévu de longue date mais sans cesse repoussé par manque de disponibilité.
Certains établissements se sont fait connaître sur ces chantiers : demandes de précisions, présentation de leur organisation ou de leur méthodologie, communication d’un bilan. D’autres ont œuvré dans l’ombre*.
Nous ne citons ici que quelques-uns d’entre eux, pour illustrer le travail qui s’est fait, mais l’Abes remercie et félicite tous ceux qui ont œuvré à améliorer la qualité et la structuration des données.
Voici les initiatives connues de l’Abes réalisées pendant le confinement.
Chantiers au sein du réseau Calames
Trois suggestions de chantiers étaient proposées.
Huit établissements du réseau Calames ont manifesté leur intérêt pour ces propositions. Quatre d’entre eux ont bien voulu partager leur ressenti :
- Bibliothèque Mazarine
- La contemporaine
- Institut de France
- CIRDOC
L’aide de l’Abes (notamment la mise à disposition de listes des composants à traiter – l’équivalent des listes de PPN pour le Sudoc) a été appréciée pour faciliter la mise en œuvre du chantier.
Trois établissements (La Mazarine, La contemporaine et l’Institut de France) s’en sont servis pour identifier et corriger leurs erreurs de saisie des composants ou pour lier les points d’accès listés à des notices IdRef.
Un établissement a proposé des pistes d’amélioration de ces listes : La Mazarine, via une simplification des données d’export alimentant les tableaux de suivi. On peut se réjouir de cette initiative pour imaginer mieux que ce qui est initialement proposé.
Ainsi, parfois, ces listes de repérage ont servi à traiter davantage de fichiers EAD que ceux directement concernés par le périmètre initial du chantier.
Le bilan est très positif, même si la nature même des documents de type archives ne permet pas de communiquer des statistiques quantitatives, en « nombre de notices ».
Des pistes d’amélioration sont d’ailleurs proposées :
- La Bibliothèque Mazarine suggère à l’Abes de systématiser la fourniture de listes d’erreurs et de simplifier leur diffusion pour informer à la demande les établissements souhaitant lancer de tels chantiers : l’export « visio_contrôle » ou l’envoi de rapports de synthèse pourraient servir à tenir les établissements au courant des points à corriger dans leurs fichiers EAD ;
- le CIRDOC souhaite que l’Abes l’accompagne dans le traitement en mase de ses données, notamment l’export de données actuellement sous Excel en EAD (c’est une demande récurrente de la part du réseau, pour l’instant encore complexe à gérer pour l’Abes).
Chantiers au sein des réseaux Autorités, Sudoc et Sudoc PS
Sept suggestions de chantiers étaient proposées.
La suggestion n° 1 (Chantier « La qualité des liens des documents Sudoc possédés par mon établissement ») a été la plus souvent choisie.
Elle suggérait d’utiliser le webservice AlgoLiens, puis d’intervenir manuellement sur les notices, avec WinIBW et/ou Paprika, ou de solliciter l’Abes pour des traitements automatisés par lots.
Très vite, Sylvain Machefert, du SCD de l’Université Bordeaux Montaigne, a développé et mis à disposition de tout le réseau (via le GitHub de l’Abes) une interface web pour facilement exploiter les rapports du webservice AlgoLiens (voir le billet qui saluait cette initiative).
Cela a permis à quatre établissements (les SCD des Universités Rennes 1 et Lyon 1 Claude Bernard, la BIU de Montpellier et la Bibliothèque Sainte-Barbe) en plus du SCD de l’Université Bordeaux Montaigne, d’utiliser plus facilement ce webservice AlgoLiens, indispensable pour initier le chantier.
Ce fut la première initiative de partage et de collaboration, dans cette période si particulière qui aurait pu générer un repli sur soi, et elle fut source de motivation (pour l’Abes comme pour les établissements sensibilisés à notre proposition) pour démarrer ces chantiers.
Cette suggestion n° 1 a permis, à titre d’exemples :
- Au SCD de l’Université de Caen Normandie d’intervenir sur 3 230 notices sans liens, de les compléter et de créer 2 275 notices d’autorité. Une équipe de 20 catalogueurs s’est constituée pour l’occasion, accompagnée par la Correspondante Autorités et la Coordinatrice Sudoc.
- À la Direction des bibliothèques de l’Université de Paris d’intervenir sur 2 744 notices sans liens et de créer plus de 3 600 notices d’autorité. Là-encore, une équipe de 8 catalogueurs s’est constituée, au sein du Service Traitement et Signalement des Collections, sous la responsabilité de la Coordinatrice Sudoc.
- À la BNU de Strasbourg de terminer son chantier CERCLES sur les notices CAIRN (1 714 notices vérifiées et 1 143 notices enrichies), d’enrichir ses notices d’ouvrages publiés avant 1920, de dédoublonner et de mettre 1 860 notices en conformité avec RDA-FR.
- Au SCD de l’Université Lyon 1 Claude Bernard d’insérer des liens sur 7 950 notices.
- À l’INHA de traiter les liens manquants 606 et 700 sur toutes ses notices localisées depuis 2017
- Au SCD de l’INSA de Lyon d’examiner les liens manquants sur un corpus de 1000 notices, d’en créer plus de 900 et de créer 557 notices d’autorité. L’équipe de 3 catalogueurs a enrichi ces notices au-delà de ce qui était demandé (les liens) : 635 codes de fonction ajoutés, 575 zones corrigées.
- À la bibliothèque de l’Institut d’urbanisme et de géographie alpine (Direction générale déléguée à la Documentation de l’Université Grenoble Alpes) d’enrichir 140 notices bibliographiques (et le chantier continue !).
- À la Bibliothèque Interuniversitaire Sorbonne de créer 3 300 liens Auteur et 670 liens Sujet, de créer 2 262 notices d’autorité Auteurs.
- Aux catalogueurs des SCD de l’Université Paris Saclay, Reims Champagne-Ardenne et de la Bibliothèque de Sciences Po d’expérimenter l’intelligence artificielle au service du catalogage : leurs notices sans lien à des autorités personnes physiques ont été soumises à un programme de liage automatique, qui, dans le meilleur des cas, a proposé de résoudre près de 57% des liens absents. Ces propositions ont été alors soumises à ces établissements, qui devaient les confirmer ou les infirmer. Ainsi ce sont 1 866 liens (pour Paris Saclay) et 3 400 liens (pour Sciences-Po) qui ont finalement été confirmés les catalogueurs et injectés dans les notices.
La suggestion n°2 (Chantier « Enrichissement des notices bibliographiques disposant d’une zone 309 ») nécessitait de travailler sur un fichier de notices mis à disposition par l’Abes.
- La Direction des bibliothèques d’Université de Paris s’est également mobilisé sur ce chantier, et près de 5 000 notices ont ainsi été corrigées, essentiellement par l’ajout d’un code de fonction en 7XX.
- La Direction générale déléguée à la documentation de l’Université Grenoble Alpes a mobilisé 7 bibliothèques sur ce chantier, avec comme résultat la correction de 700 notices.
- La Bibliothèque Interuniversitaire Sorbonne (et plus particulièrement la Bibliothèque de Géographie) a mobilisé une équipe de 3 catalogueurs pour intervenir sur 1 233 parmi les 1 369 notices avec une zone B309.
- L’INHA, le Campus Condorcet et les SCD de l’Université de Nantes et de l’INSA de Lyon ont également travaillé sur ce chantier, parmi d’autres.
La suggestion n° 3 (Chantier « Structure du point d’accès et cohérence intrinsèque des autorités Personnes) était plus complexe et chronophage, destiné à des catalogueurs très à l’aise avec le format Unimarc Autorités.
Nous n’avons aucun retour sur ce chantier.
La suggestion n° 4 (Chantier « Le traitement des candidats doublons bibliographiques ») ne s’adressait qu’à 7 établissements précis, qui ont été contactés et suivis individuellement.
- Le SCD de l’Université de Caen Normandie a mobilisé une équipe de 5 catalogueurs pour traiter ses 2 362 candidats doublons ; il en reste aujourd’hui moins de 600 à traiter.
- La bibliothèque de l’École Polytechnique devait, pour sa part, traiter près de 4 000 doublons ; le travail suit son cours, avec efficacité et ténacité.
-
D’autres établissements avaient des listes de doublons plus légères, et le travail a été mené à son terme, comme au SCD d’Aix-Marseille Université ou à la Bibliothèque de l’ICES, où une catalogueuse est venue à bout, seule, de ses 220 doublons.
La suggestion n° 5 (Chantier « Suppression des liens aux notices d’autorité dites « Notices de gestion et de renvoi général ») nécessitait de travailler exclusivement sur les 13 000 notices bibliographiques liées à ces 169 notices Rameau.
Des catalogueurs de la BU Angers, des SCD des Universités de Bretagne Occidentale (plus particulièrement l’INSPE), de Lorraine, d’Orléans, de Tours, des bibliothèques de l’INSPE Lille Hauts-de-France, de l’INHA et de Sciences Po Paris ont participé à ce chantier, et ont permis de dénouer les liens de 140 (sur 169) notices dites « de gestion ».
Un grand merci à eux, d’autant qu’il s’agissait là d’un chantier dont l’intérêt allait au-delà de celui de leur seul établissement.
La suggestion n° 6 (Chantier « Vérification des dates d’exemplaires dans les états de collection des bibliothèques non déployées de mon CR ») s’adressait aux Responsables de Centre du Réseau Sudoc-PS.
Les CR « Alsace » (BNU Strasbourg) « Pays de la Loire » (SCD Nantes), « Sciences Exactes et Appliquées » (SCD Sorbonne Université), « Sciences Humaines, Langues et Civilisations occidentales » (BIS) ont travaillé sur ce chantier, en allant parfois au-delà du périmètre proposé pour entreprendre des vérifications de fond, sur les données ou sur les demandes ISSN en cours, avec même l’intention, à Nantes, d’organiser un Sudocathon !
Au CR « Alsace » , par exemple, une équipe de 4 catalogueurs a choisi de relire et d’enrichir un corpus de 2 911 notices bibliographiques, localisées par 20 bibliothèques du réseau Sudoc-PS alsacien : les notices ont été mises en conformité avec les consignes liées à RDA-FR.
La suggestion n° 7 (Chantier « Correction des codes de fonction »)
Nous n’avons pas de retour d’établissements sur ce chantier. Dans le tableau de suivi, la seule intervention concerne la mise à jour de 180 notices bibliographiques de thèses, où le code « 725 » avait été employé à tort au lieu de « 727 » (Directeur de thèses). Et cette intervention a été réalisée par… un collègue de l’Abes.
Ce chantier est très simple à mettre en place, peu chronophage et un peu rigolo (on doit corriger des codes de fonction assez farfelus). Il est encore possible d’y travailler.
Update (07/09/22) ! La BU Médecine et Pharmacie de l’Université Grenoble Alpes a pu travailler sur ce chantier : 17 559 codes de fonction ont été repris, 2 414 codes de langues ont été corrigés et 1 787 liens ont été corrigés (algoliens)
Un bilan qualitatif
Ces types de chantiers « à distance » entraînent inévitablement des difficultés : les éventuels problèmes techniques d’installation ou d’utilisation des outils ainsi que l’inévitable absence du « livre en main », pour vérifier les données.
Pour les établissements assez grands, est venue s’ajouter la complexité de l’organisation et de la coordination : choix des chantiers à privilégier, création de requêtes spécialisées et extraction des notices dans des fichiers, édition des fichiers Excel pour les rendre utilisables, répartition des tâches, rédaction de procédures, réunions et accompagnement à distance pour planifier, expliquer, former, rassurer, aider, contrôler et motiver. Saluons l’implication des Correspondants, leur rôle fut, ici encore, prépondérant.
Mais les bénéfices s’avèrent, au final, bien plus nombreux :
- une activité de catalogage a été maintenue, permettant aux collègues de ne pas perdre leurs automatismes ;
- certains établissements ont été fiers de terminer leurs chantiers et, forts de cette première expérience, expriment leur volonté de la renouveler (sans le confinement qui allait avec, bien sûr) ;
- ce « temps long » fut plus propice à la découverte et à l’appropriation des nouvelles règles de catalogage, notamment pour les points d’accès et les codes de fonction. Les catalogueurs ont ainsi touché du doigt l’évolution que connaît cette pratique : il s’agira de plus en plus de se concentrer sur des corrections ou validations exigeant une intelligence humaine.
À tous les catalogueurs qui se sont investis, à tous les Correspondants de l’Abes qui ont su motiver et organiser leurs équipes, à tous les directeurs qui ont rendus cet investissement possible… un grand merci, au nom des réseaux, du service public et de l’intérêt général !
* Vous avez initié un chantier durant la période, qui n’est pas cité dans ce billet ? Dites-le nous et envoyez-nous un rapide bilan !
Ping : QualiMarc : un outil en ligne pour évaluer la qualité des notices bibliographiques du Sudoc - PUNKTOKOMO