[ndlr : ce post concerne un chantier précis : De Gruyter Classical Studies 2011-2014. Depuis, un autre chantier a été engagé, et terminé : De Gruyter Classical Studies 2015-2016. Le récit de ce dernier chantier est disponible ici.]
L’engagement BIS / EFA
Délimitation du périmètre d’action :
- Corpus De Gruyter, Classical studies : 288 notices à traiter
- Bouquets 2011, 2012, 2013 et 2014
- Répartition par établissements :
- EFA : bouquet 2014
- BIS : bouquets 2011, 2012, 2013
- Calendrier prévisionnel établi d’après une estimation du temps de travail par notice : 40 minutes en moyenne
- Début du chantier : août 2015
- Fin du chantier : fin novembre 2015
Axes d’enrichissements
Les axes d’enrichissements prévus au départ :
- Fusion de notices en cas de doublons ;
- Création des zones 4XX, 6XX et 7XX, et liens (amélioration et correction) ;
- Ajout de l’indexation-matière ;
- Nettoyage des notices (francisation des notes, correction des caractères grecs erronés) ;
- Ajout des zones propres aux documents électroniques (305, 306, 307, etc.) ;
- Création des notices d’autorité lorsqu’elles n’existent pas ;
- Demande de numérotation ISSN des notices de collection et création de notices de collection si besoin.
L’évaluation en amont des notices du corpus
Pour les premiers bouquets traités (bouquet 2011-BIS, et 2014-EFA), il a été décidé de noter de façon systématique toutes les corrections apportées aux notices, afin de repérer les plus récurrentes, et ainsi avoir l’analyse la plus précise de la qualité du corpus à traiter. Pour les bouquets 2012 et 2013 en revanche, les corrections étant les mêmes, nous avons choisi de ne plus les reporter. Nous avons préféré signaler d’autres problèmes qui sont apparus avec ces bouquets : les titres présents dans plusieurs bouquets, les titres non parus et les formats disponibles (PDF et/ou EPUB).
Le chantier d’enrichissement
Traitement dans WinIBW
Dans la pratique :
- Recherche par MTI (mots du titre) ou TOU (tous les mots) ou ISB (ISBN) des titres fournis par l’éditeur ne permettant pas toujours de trouver la notice
- Affichage des notices papier et électronique en « mosaïque verticale » et mise des 2 notices en « modification »
- Copier-coller des zones 101/102/104/105, 200
- Copier-coller de 452 ##$0 dans les 2 notices puis copier-coller du PPN de l’autre notice après le $0
- Copier-coller des 6XX du papier vers l’électronique
- Copier-coller des 7XX du papier vers l’électronique
- Copie de l’URL DOI pour afficher le document sur Internet et vérifier les informations mentionnées par l’éditeur : date, format PDF/EPUB, pagination, Table des matières, document pas encore paru, gratuit/payant…
- Exemplarisation
En avançant dans le traitement des différents bouquets, nous avons constaté que l’enrichissement des notices ne se limitait pas aux seules prévisions de départ. Voici, pour bon nombre d’entre elles, les corrections et améliorations apportées :
- 100, 101, 135 (les zones des données codées) : incohérences au niveau des dates (100/210), erreurs dans les langues, etc ;
- 200 $a, $f, $g (la zone du titre propre) : nombreuses erreurs d’indicateurs, parfois reprise du titre et des mentions de responsabilités. Egalement, suppression du « $bRessource électronique » ;
- 3XX :
- 302 (note sur les langues) : reprise des notes sur la version et traduction ;
- 328 (note de thèse) : absentes le plus souvent, ou non structurées ;
- 359 (zone de la table des matières) : l’une des parties la plus chronophage a été pour nous la reprise systématique des tables de matières ;
- 500, 503 (titre de forme et titre uniforme) : absence systématique.
Plusieurs vérifications/corrections sur des champs particuliers ont été faites à la fin de chaque lot traité : cela a permis la reprise d’oublis.
Traitement dans le SIGB Millennium
Un travail en amont a dû être fait avec la Cellule des Ressources électroniques et le Service informatique de la BIS afin de déterminer les données d’exemplaire à saisir dans Millennium. Après plusieurs mois de réflexion, les données exemplaires ont été validées en juillet 2015, et les paramétrages dans le SIGB effectués dans la foulée. Ainsi, dès le chargement des notices SUDOC dans Millennium, nous avons pu reprendre les données locales dans les notices items (création et exécution de fichiers de révision), et avoir un affichage satisfaisant à l’OPAC pour le lecteur.
Traitement des demandes ISSN
Notre engagement prévoyait aussi la création des notices de collections électroniques (Od) et la demande de numérotation ISSN pour ces collections. C’est pourquoi nous avons également été amenées à travailler avec Véronique Comby, responsable du CR 26.
Nous nous sommes interrogées sur les justificatifs à fournir pour la demande de numérotation ainsi que sur la conservation des liens 452 (lien type de support de la version électronique vers la version papier – la conservation d’un lien impliquant deux demandes de numérotation : une pour la version électronique et une pour la version imprimée). Au final, pour les justificatifs nous avons fourni les captures d’écran des collections du site éditeur. Et, pour les zones de lien 452 vers la version imprimée de la collection, les demandes n’ont tout simplement pas été traitées quand nous n’avions pas de localisation sous ces notices.
Les moyens mis en place
Création de scripts locaux et zones spécifiques
Afin de gagner du temps et éviter les oublis et les erreurs de saisie, différents scripts ont été créés :
- Scripts des zones 3XX (zones spécifiques aux ressources électroniques) : Suite à un rechargement de l’ABES des notices de De Gruyter, le script de départ a dû être légèrement modifié (remplacement de la zone 336 par la zone 339). Par ailleurs, certaines zones propres aux ressources électroniques étaient déjà présentes dans beaucoup de notices, comme la 310 ou 337. Nous avons alors veillé à ne pas doubler ces zones.
303 ##$aNotice rédigée d’après la consultation du AAAA-MM-J
304 ##$aTitre provenant de l’écran titre
305 ##$aVersion électronique de l’édition de Berlin : De Gruyter, XXXX
307 ##$aLa pagination de l’édition imprimée correspondante est de : … pages
310 ##$aL’accès complet à la ressource est réservé aux usagers des établissements qui en ont fait l’acquisition
337 ##$aNécessite navigateur et un lecteur de fichier PDF
339 ##$aPDF$dAAAA
339 ##$$aEPUB$dAAAA
- Script de la Zone 615 : nous avons choisi cette zone pour identifier chaque bouquet car la recherche sur le sous-bouquet « Classical studies » était impossible dans le SUDOC. Cette zone 615 permettra aux établissements qui voudront se localiser sous certains bouquets de les distinguer parmi les 38 418 notices d’e-book de l’éditeur De Gruyter. Cette zone a été ajoutée dans chaque notice, y compris lorsqu’il y avait plusieurs bouquets. La sous zone $n permet d’identifier le bouquet grâce à un numéro ISBN fourni par l’éditeur (une discussion est en cours au sein de l’ABES pour valider cette façon d’identifier les sous-lots).
615 ##$aClassical Studies 2011$n978-3-110-26121-9$2De Gruyter
615 ##$aClassical Studies 2012$n978-3-11-028896-4$2De Gruyter
615 ##$aClassical Studies 2013$n978-3-11-031709-1$2De Gruyter
615 ##$aClassical Studies 2014$n978-3-11-036961-8$2De Gruyter
- Script de localisation des e-books payants : zone E856 d’accès direct à la ressource en ligne : lien permanent doi -Digital Object Identifier -, ou à défaut autre lien fourni par l’éditeur (décision collégiale avec la cellule informatique et des ressources électroniques).
e01 $bx
930 ##$b751052105$aRessource en ligne$js
999 ##$aInitiales catalogueur
E856 4#$qPDF$zTexteintégral$uhttp://janus.biu.sorbonne.fr/login?url= http://dx.doi.org/…..
- Script de localisation des e-books gratuits : zone 856 et non E856 et code PEB différent (= « g » – non disponible pour le PEB car disponible pour tous).
856 4#$qPDF$uhttp://www.degruyter.com/doc/cover/9783110266405.jpg
859 4#$qPDF$uhttp://www.degruyter.com/search?f_0=isbnissn&q_0=9783110266405&searchTitles=true
859 4#$qPDF$uhttp://dx.doi.org/10.1515/9783110266405
e01 $a21-09-15$bx
930 ##$b751052105$aRessource en ligne$jg
999 $aInitiales catalogueur
- Script de localisation d’une collection d’e-books :
e01 $bxO
930 ##$b751052105$js
955 41$4Collection de livres électroniques
999 ##$aInitiales catalogueur
E856 4#$uhttp://www.degruyter.com…
Outil collaboratif
Pour avancer dans ce chantier, en plus de l’organisation de plusieurs réunions et d’une correspondance email avec l’EFA pour faire le point sur les difficultés rencontrées, nous avons pu disposer d’ un espace de travail collaboratif en ligne pour un échange entre l’ABES et les établissements participant à CERCLES .
Cet outil nous a permis d’accéder à différents fichiers modifiables ou en mode de lecture seule , notamment un tableau de bord nous permettant de communiquer avec l’EFA et l’ABES. Nous avons également pu y déposer un fichier afin de suivre notre avancée sur les différents bouquets : quatre tableaux Excel indiquant la progression de notre travail avec la liste des PPN, les notices traitées, les corrections et remarques, etc..
Nous avons parfois dû reprendre l’ensemble des notices d’un bouquet en fonction des réponses données dans le tableau par l’ABES ou l’EFA ; en exemple, la zone 336 et 339 sur le(s) format(s) : toutes les zones 336 ont été écrasées lors de chargements de l’ABES. Après demande via Bouda et attente de confirmation de l’ABES, il a fallu reprendre l’ensemble d’un bouquet pour ajouter cette zone quand elle ne figurait pas déjà dans la notice.
Bilan du chantier
Le chantier s’est déroulé sur 5 mois, de juillet à novembre 2015.
Bilan quantitatif
L’outil Check Sudoc a permis de corriger quelques oublis : incohérences entre la date saisie en zone 100 et 210, absence de zone 410.
Eléments quantitatifs du chantier : 288 notices
- 9 notices de collections créées
- 15 demandes de numérotation ISSN via CIDEMIS
- 9 autorités auteurs créées
- 195 liens 410 faits
- 10 liens 461 faits
- 260 notices ayant reçu une indexation matière
- 1026 liens 6XX faits
- 417 liens 7XX faits (+ les 71X non visibles par Check Sudoc)
- 522 liens 452 dans les notices de monographies (de l’électronique vers le papier et inversement)
- 76 liens 452 faits dans les notices de collection (de la collection électronique vers la collection papier et inversement)
Bilan qualitatif
La qualité des notices fournies par l’éditeur :
Les notices fournies par l’éditeur De Gruyter sont complètes mais leur structuration ne correspond pas à celle attendue dans le Sudoc.
Si le gain de temps est manifeste grâce à la saisie des données et à l’utilisation des notices bibliographiques décrivant les versions papier des ouvrages, il ne l’est pas sur les modifications à apporter pour rendre les notices du bouquet De Gruyter conformes aux exigences de qualité du Sudoc.
En moyenne, nous évaluons à 40 minutes le temps passé sur une notice entre le contrôle de la saisie des données (titres faux, tronqués …), la restructuration des champs (notamment pour le bloc des 3XX, avec des 359 inexploitables), la création des liens, l’exemplarisation …
L’ABES incite chaque établissement à mener des négociations directes avec l’éditeur afin d’obtenir des notices de meilleure qualité. (cf. démarche suivie par la MSH auprès de CUP, Cambridge University Press, ils ont conditionné leurs futurs achats à la fourniture de notices de qualité).
Un outil collaboratif plus performant :
L’outil utilisé par l’ABES (Bouda) pour permettre des échanges simplifiés entre l’EFA, l’ABES et la BIS n’a pas toujours été performant. Il devait permettre aux bibliothèques participant au projet CERCLES de poser des questions, de voir les questions posées par les autres établissements ainsi que les réponses apportées par l’ABES. Il devait aussi permettre à l’ABES d’avoir une visibilité sur le travail accompli.
Il faut noter que cet outil ne permet pas aux participants d’être prévenus lorsqu’une question a été posée ou qu’une réponse a été apportée par l’ABES ou par un autre établissement.
Sur le plan technique, la plate-forme a connu plusieurs dysfonctionnements nous obligeant à trouver des solutions pour pallier les manques (notamment lorsque l’accès à la plate-forme n’a pas été possible pendant plusieurs jours).
L’ABES est consciente des limites de cet outil (double saisie, suivi difficile des questions et des réponses) et travaille à son évolution. Une solution de contournement provisoire est le recours à Google Drive.
Réactivité de l’ABES :
Suite aux contraintes de l’EFA (mutation au 31 août de la responsable du chantier), le travail sur les notices a débuté au mois de juillet.
La période estivale a perturbé les temps de réponses de l’ABES et les temps de traitement par l’équipe de la BIS. Certaines réponses tardives de l’ABES nous ont contraintes plusieurs fois à reprendre des données (336/339, E856…).
Conclusion
Un traitement « facilité » :
Pour le corpus De Gruyter, nous avons bénéficié de la présence quasi systématique des notices bibliographiques de la version imprimée des documents. Cela nous a permis de copier-coller l’indexation, les liens vers les notices Autorités…
Dans une certaine mesure, on peut penser que cela a un peu contrebalancé le temps nécessaire à la restructuration des données.
La collaboration :
Ce projet a permis le travail en collaboration de deux bibliothèques distantes. Nous avons pu discuter de nos pratiques de catalogage respectives, les mettre en perspective et parvenir à établir un socle commun sur les modifications à faire.
La même démarche a été mise en place à la BIS. Des réunions régulières (6 réunions d’environ 2 heures entre juillet et début décembre) nous ont permis de discuter de nos pratiques, d’échanger nos points de vue et de valider des choix. Ces réunions étaient aussi l’occasion de faire le point sur l’avancée du chantier, de répartir les notices à traiter ou les reprises de données, poser des questions à l’ABES et discuter de leur réponse via la plate-forme Bouda …
Les objectifs et les moyens définis au départ (nombre de notices, délais, nombre restreint de personnes impliquées) ont permis que ce chantier soit conduit dans de bonnes conditions.
La valorisation et la visibilité :
Les livres électroniques présents depuis plusieurs années en bibliothèques sont encore, à ce jour, rarement catalogués.
Le dispositif CERCLES mené par l’ABES autour de 10 corpus permet de :
- mener une réflexion sur le catalogage des ressources électroniques
- mettre l’accent sur la collaboration en mettant à disposition du réseau des notices de qualité, permettant une localisation automatique
- valoriser ces ressources en les rendant visibles dans le Sudoc et dans les catalogues des établissements participants.
Pour la BIS, il permet de rendre visibles des ressources électroniques non intégrées à ENCORE et de s’inscrire dans un programme national de valorisation de ces ressources. Pour donner une suite à ce chantier, on pourra s’orienter vers une nouvelle participation à CERCLES sur un autre corpus, ou, en lien avec la Cellule des Ressources électroniques, envisager le catalogage des bases de données.
Lien vers le catalogue de la BIS : https://catalogue.biu.sorbonne.fr/
Lien vers le catalogue de l’EFA : http://www.catalogue.efa.gr/client/efa