« Genèse » du Chantier CERCLES de la Bibliothèque Numérique Dalloz
Le chantier “CERCLES BNDalloz” a été initié par le SCD de l’Université de Strasbourg en avril 2016 (sa fin est prévue pour le printemps 2017).
Il fait suite à l’immersion de Catherine Storne à l’Abes en janvier/février 2016.
Les objectifs de cette immersion étaient à la fois de rapprocher les équipes “docelec” et “catalogage” pour mieux signaler les ressources électroniques et de circonscrire la relation éditeurs et bibliothèque dans le traitement des métadonnées.
La documentation électronique seconde, voire prend le pas –pour certaines disciplines- sur la documentation papier. Il est dès lors nécessaire aux bibliothèques de s’inscrire comme acteur de leur signalement. Le SCD de l’université de Strasbourg a voulu participer, au travers de ce projet, à cette transition.
Organisation du Chantier CERCLES
L’équipe
L’équipe en charge de ce projet se compose de deux personnes :
- Stéphanie Himber, responsable du chantier CERCLES BNDalloz.
- Stéphane Rehlinger
Ne bénéficiant pas de temps dégagé pour se consacrer prioritairement à ce projet, nous y avons travaillé aussi régulièrement que possible lorsque nos activités propres à notre structure nous le permettaient.
Le départ de l’initiatrice du chantier, en septembre 2016, aurait pu nous fragiliser car nous ne disposions alors que des extractions initiales. L’appui des services Interfaces & Traitements et Métadonnées de l’Abes a donc été d’une grande aide : au niveau des outils, nous avons disposé d’extractions ad hoc et bénéficié de modifications en lot ; au niveau de l’accompagnement, nous avons pu nous appuyer sur des conseils et orientations de travail.
Nous avons également pu nous appuyer sur notre collègue Catherine Banos, correspondante “publications en série périodiques et collections” au sein du SCD de l’université de Strasbourg, et sur l’équipe du CR Alsace du Sudoc-PS de la BNUS – Christine Hecht et Estelle Cade – pour les demandes de numérotation ISSN des collections électroniques.
Périmètre du chantier
Le corpus initial – circonscrit en février 2016 – compte environ 1950 notices bibliographiques auxquelles s’ajoutent les versements réguliers de nouveaux titres, soit actuellement près de 2150 notices.
Il convient d’y ajouter les 40 notices de collection dont seulement 6 étaient présentes dans le Sudoc avant le début du chantier.
Lors du travail préparatoire sur ce corpus, les notices Oa ont été créées par copie des notices Aa existantes puis enrichies et corrigées par l’Abes.
Ci-dessous le tableau des modifications apportées par script vbs lors de la création par copie
Notice papier | Notice d’e-book correspondante |
001 | Non repris |
002 | Non repris |
003 | Non repris |
008 | Par défaut : $aOax3 |
010 | Non repris |
020 | Non repris |
021 | Non repris |
033 | Non repris |
034 | Non repris |
035 | Remplacé par défaut par : ##$aBNDalloz |
073 | Non repris |
106 | Non repris |
135 | Ajout par défaut : ##$av$br$cm$e#$gm$ia$ja |
181 | Ajout par défaut : ##$P01$ctxt |
182 | Ajout par défaut : ##$P01$cc |
215 | Non repris |
225 | Non repris |
230 | Ajout par défaut : ##$aDonnées textuelles |
337 | Ajout par défaut : ##$aNécessite un logiciel capable de lire un fichier au(x) format(s)Widelook ou Widelook Flash |
410 | Non repris |
452 | Ajout par défaut : ##$0″ + ancienPpn |
801 | Non repris |
802 | Non repris |
830 | Non repris |
Ci-dessous les enrichissements
zone | |
010 | ISBN électronique |
100$a / 210$s | dates du tableau-Dalloz ajoutées en 100$a et 210$d (par écrasement de celles éventuellement présentes) |
205 | Numéro d’édition tiré de la BNDalloz |
676 | $a340 |
859 | URL fourni par l’OAI-Dalloz |
Une fois ces deux opérations terminées, il restait environ 570 notices ou titres à traiter :
Cataloguer les documents électroniques pour lesquels la notice papier n’existe pas ;
Vérifier / corriger les notices Oa déjà présentes dans le Sudoc ;
Vérifier les notices susceptibles d’être des doublons. Dédoublonner quand nécessaire ;
Enrichissement des notices absentes de l’entrepôt OAI-Dalloz.
… et quelques 1830 notices Oa créées par l’Abes à enrichir ou à corriger.
Si la taille de ce corpus est relativement modeste, son signalement dans les catalogues est fortement attendu par les collègues. Aussi, plus que la complexité du traitement catalographique, c’est l’impératif de la réalisation du chantier pour fin 2016/janvier 2017 (comme nous nous l’étions fixé) qui nous a préoccupé.
Organisation du travail
- Nous avons élaboré des outils de travail que nous avons partagés sur un dossier commun et nous disposions d’un espace collaboratif de travail proposé par l’Abes.
Outils de suivi
▹Tableau de suivi étape par étape ;
▹Tableau de suivi des demandes ISSN ;
▹Tableau des erreurs à corriger : notices doublons, 859 doublons, pb. d’eISBN, erreur de référencement Dalloz, … ;
▹Sauvegarde de plusieurs extractions servant de base de travail ;
▹Tableau détaillé des zones retenues pour le catalogage des documents électroniques.
▹Liste des nouveaux titres versés sur la base depuis mars 2016 : pISBN-eISBN-titre-édition-collection-date de mise en ligne-eppn-URL ;
▹Suivi pour info. au réseau / tableau de bord ;
▹Extractions réalisées par l’Abes.
Le manuel CERCLES de suivi du chantier est disponible ICI
- Nous avons construit nos scripts vbs :
Avec Nicole Krieger, correspondante SUDOC pour notre structure, nous avons déterminé les zones Unimarc que nous utiliserons pour créer et enrichir les notices Oa. Dans un document interne, nous avons commenté chaque zone et détaillé la forme du contenu de celle-ci.
Nous avons formalisé le tout au travers d’un script que nous avons enrichi au fur et à mesure des consignes communiquées par l’Abes (ex. zones 339, 035).
Script vbs des notices bibliographiques :
"010 ##$AISBN$bebook"&vblf&_ "035 ##$aBNDalloz_"&vblf&_ "135 ##$av$br$cm$e#$in"&vblf&_ "181 ##$P01$ctxt"&vblf&_ "182 ##$P01$cc"&vblf&_ "230 ##$aDonnées textuelles"&vblf&_ "303 ##$aDescription d'après la consultation du 2017-MM-JJ"&vblf&_ "304 ##$aTitre provenant de la page de titre de la version électronique"&vblf&_ "305 ##$aVersion électronique de la XXe édition, Paris : Dalloz, 20"&vblf&_ "307 ##$aPagination de l'édition imprimée : XXX p."&vblf&_ "310 ##$aAccès réservé aux usagers des établissements qui en ont fait l'acquisition"&vblf&_ "320 ##$aBibliogr. p. XXX de l'édition imprimée"&vblf&_ "339 ##$aHTML$d20"&vblf&_ "339 ##$aSWF$d20"&vblf&_ "337 ##$aNécessite un logiciel capable de lire un fichier au(x) format(s) Widelook ou Widelook Flash"&vblf&_ "452 ##$0PPN imprimé"&vblf&_ "676 ##$a340$v22"&vblf&_ "830 ##$aChantier CERCLES 2016 ! Ne pas modifier cette notice sans avoir vérifié le périmètre d'intervention sous la responsabilité de : SCD de l'université de Strasbourg. Pour plus d'information, consultez le manuel CERCLES du GM."&vblf
- Nous avons procédé de la même façon pour les notices Od
Script vbs des notices de collection :
008 $aOdx3 100 0#$a200X$d200X- 101 0#$afre 102 ##$aFR 104 ##$ak$by$cy$dba$e0$ffre 106 ##$ar 110 ##$ab$by$cb$em$f0$gy$hy$i0 135 ##$av$br$cm$dn$e#$gm$hn$in$ja$kn 181 ##$P01$ctxt 182 ##$P01$cc 200 1#$a@Codes Dalloz universitaires et professionnels 210 ##$aParis$cÉditions Dalloz$d[200?]- 230 ##$aDonnées textuelles 301 ##$aDemande de numérotation ISSN en cours 303 ##$aNotice réd. d'après la consultation du 2016-07-06 304 ##$aTitre provenant de l'écran-titre 310 ##$aL'accès à cette ressource est réservé aux usagers des établissements qui en ont fait l'acquisition. 326 ##$aCollection 337 ##$aNécessite un logiciel capable de lire un fichier au(x) format(s) Widelook ou Widelook Flash 452 ##$0LIEN VERS Ad 517 ##$a@Codes Dalloz
Travaillant à deux personnes sur ce corpus et étant dans des établissements distants, il était capital d’assurer un traitement uniforme des notices au risque de devoir s’entre-corriger.
Le traitement
Suite à l’étude des extractions initiales et à l’étude de la qualité des métadonnées, il a été décidé de créer les notices Oa par duplication des notices Aa pré-existantes et de les corriger / compléter le cas échéant à l’aide des données venues du site Dalloz.
Aussi, contrairement à d’autres chantiers CERCLES, nous n’avons pas été concernés par la création d’autorités.
Plusieurs opérations ont fait l’objet de modifications en lot par l’Abes à partir d’extractions de sous-ensembles. C’est le cas de l’insertion des zones 035, 225/410, 304, 310, 339, 830, 859.
Le reste des vérifications et traitement des « cas spéciaux » s’est fait manuellement.
Concrètement, les opérations que nous avons eues à mener étaient :
- des enrichissements ou corrections de notices bibliographiques et de collection : pour cela, nous avons travaillé à partir des extractions initiales et à partir des extractions de sous-ensembles, résultats de modifications en lot, faites tout au long du chantier.
- des créations de notices bibliographiques et de collection : nous nous sommes appuyés – quand cela a été possible – sur la notice Aa existante que nous avons dupliquée et modifiée à l’aide de notre script.
Chaque création / vérification de notice s’est faite à partir de la « fiche de l’ouvrage » Dalloz + affichage / consultation du document électronique.
Quelques chiffres
Notices de collection | Traitement en lot | Traitement manuel |
Création de notices de collection + demande de numérotation ISSN | – | 39 notices |
Doublons | ||
notices dédoublonnées | – | env. 50 notices |
URL | ||
Vérification de notices sans URL | – | 34 ppn |
Modifications | ||
Insertion zone 010 $a | 120 notices | |
Insertion zone “035BNDalloz” | 2081 notices | 13 notices |
Insertion zones 181/182 | 5 notices | |
Insertion zones 225/410 | 1434 notices | 716 notices |
Insertion zone 230 | 1901 notices | |
Insertion zone 830 | 1901 notices | |
Insertion zone 859 “URL” | 1726 notices | – |
Zone 859 : substitution de l’URL pointant vers la notice de présentation par l’URL pointant vers le document | 380 notices | |
suppression zone 073 | 273 notices | |
Suppression zone 839 | 30 notices | |
Créations | ||
création manuelle de notices Oa | env. 240 notices |
Problèmes rencontrés
- Numérotation ISSN des collections électroniques :
L’intitulé de la collection électronique mentionné sur la fiche de présentation de la base Dalloz diffère de la mention de collection signalée sur la page de titre de la version électronique du document (nouvelle collection ou absence de série). Du coup, certaines demandes de numérotation ISSN ont été rejetées par le Centre ISSN France. Ces dernières ont été relancées en mars 2017 avec un dossier étoffé. Sont concernées les collections suivantes :
▹Cours
▹Dictionnaires Dalloz
▹Etudes, mélanges, travaux
▹Hors collection
▹Hors collection Dalloz / Hors collection Delmas / Hors collection Sirey
- Communication de l’URL d’accès :
Nous avons communiqué les URL au fur et à mesure à l’Abes en complétant un fichier partagé (contenant déjà les PPN des notices créées). l’Abes ne peut les récupérer directement et facilement via le service dédié Dalloz, un long nettoyage préalable des données récupérées est nécessaire via Open Refine avant de pouvoir les insérer en lot dans les notices.
Nous avons utilisé le service mis à disposition par Dalloz :
Test de service BND ☞ http://www.dalloz-bibliotheque.fr/services/bndtest.php?isbn
- Accès aux anciennes éditions déjà retirées de la base Dalloz. Grâce au même service Dalloz, via l’ISBN (consigné dans les premières extractions) nous avons pu trouver les informations éditeur du document électronique.
- Fiche de présentation BNDalloz incomplète ou erronée : absence de l’édition, ISBN doublon, … ;
- Nombre réduit de connexions simultanées (5) nous obligeant à différer la consultation / le traitement des documents.
Questions soulevées
- Lors du traitement catalographique :
- Quel sort réserver à la zone 205 ?
Pour la BNDalloz, la version électronique est la reproduction de la version imprimée ; c’est donc tout naturellement que Dalloz signale dans la « fiche de présentation » de l’ouvrage électronique, le numéro de l’édition imprimée. La BNDalloz donnant accès à plusieurs éditions du même titre, nous avons choisi de mentionner le numéro d’édition de la version imprimée conformément à ce que Dalloz fait dans sa base.
Nous avons ajouté également la zone 305 :
Ex. 305 ##$aVersion électronique de la 2e édition, Paris : Dalloz, 2016 - Que faire de la mention « matériel d’accompagnement » ?
Il a été décidé de garder cette information en zone 327.Ex. 327 2#$aLa ressource ne donne pas accès aux données contenues sur le CD-ROM accompagnant l’édition imprimée - Notices de collection : comment dater le début d’une collection électronique, sachant que la BNDalloz est une base dont la mise à jour est régulière ?
Il a été convenu que c’est l’année de mise en ligne du premier titre dans la collection qui compte. A défaut de la connaître, nous avons considéré la date comme incertaine :
100 $a 20XX, 100 $d20XX-… et en 210 $d [20??]-
- Quel sort réserver à la zone 205 ?
- Problème de l’URL d’accès
La structure initiale de l’URL nécessitait une première connexion à la plateforme Dalloz pour accéder au document. Après plusieurs tests, la structure suivante a finalement été retenue. Elle permet l’accès direct au document sans identification préalable à la plateforme.
http://scd-rproxy.u-strasbg.fr/login?url=http://www.dalloz-bibliotheque.fr/pvurl.php?r=http%3A%2F%2Fdallozbndpro-pvgpsla.dalloz-bibliotheque.fr%2Ffr%2Fpvpage2.asp%3Fpuc%3D5432%26nu%3D1%26selfsize%3D1Depuis Dalloz a modifié l’affichage du document électronique, ce qui permet semble t-il – je ne sais pourquoi… – d’accéder directement au document.
- Cas de l’exemplarisation :
La question s’est posée de s’exemplariser de suite sous les notices créées par duplication en février/mars 2016 ou d’attendre la fin du chantier CERCLES.
Certaines bibliothèques, en option « Mises à jour propres » pour leur transferts réguliers, ont décidé de se localiser sous les notices fraîchement créées par copie, au risque de récupérer en local des notices incomplètes et perfectibles. D’autres, en option « toutes mises à jour » ont pu bénéficier de la mise à disposition rapide de nos créations, en ayant la garantie de recevoir au fil de l’eau nos enrichissements.
Ici, le SCD de l’université de Strasbourg a opté pour l’exemplarisation en fin de chantier. Les modalités n’ont pas encore été définies ; il a toutefois été décidé de créer une double localisation si la ressource électronique est présente sur deux bases (le plus souvent ScholarVox) car la BNDalloz est pressentie comme une base relativement stable.
- La pertinence du corpus :
Les sciences juridiques étant une discipline pour laquelle l’information est vite obsolète, nous nous sommes demandé s’il était utile et pertinent de signaler des éditions anciennes.
La réponse n’étant pas clairement tranchée, nous avons traité tous les titres dont nous avions connaissance.
A voir par la suite si nous procéderons à une sorte de « désherbage » du catalogue.A titre d’exemple, le titre suivant (ppn 191184985) : Comptabilité et gestion des associations : système comptable, gestion financière, analyse et contrôle de gestion / Francis Jaouen. – 11e éd. [à jour au 22 décembre 2008]. – Paris : Dalloz : Delmas, 2009. – (Encyclopédie Delmas).
La notice ne comporte pas le champ 859 car le titre n’est plus accessible via la base et l’URL n’est pas connu.
Nos impressions sur cette expérience
Ce type de chantier nécessite un investissement important :
- du temps pour organiser le travail, pour assurer un suivi régulier et être réactif aux diverses sollicitations ;
- de la concentration pour jongler, au sein de la même journée, entre nos activités initiales et l’étude d’extractions / traitement de notices.
Nous n’avons été que deux personnes à nous lancer dans ce chantier. Après réflexion, cela n’a sans doute pas été un mal car le travail de coordination n’aurait été que plus important si nous avions été plus nombreux.
La création des notices Oa par copie des notices Aa nous a grandement soulagé. Du coup, nous avons eu relativement peu de notices à créer eu égard à la taille du corpus initial.
En outre, il me semble que pour mener à bien ce type de chantier, il est nécessaire de trouver l’appui d’une équipe capable de manipuler les métadonnées dans tous les sens, de faire des extractions du corpus et des modifications d’ensemble. Grâce aux équipes de l’Abes, nous avons pu avancer à pas de géant dans le traitement des notices.
Et la suite ?
Conformément au principe du dispositif CERCLES, où l’établissement reste le référent sur le corpus pour le réseau Sudoc, le SCD de l’université de Strasbourg maintiendra l’effort de mise à jour. En effet, Dalloz fait partie des éditeurs qui ne fournissent pas (encore ?) de métadonnées exploitables qu’il serait possible de traiter de façon automatique ou presque pour alimenter le SUDOC et d’autres outils.
En s’appuyant sur le nombre de titres versés sur la base en 2016, nous pouvons estimer le nombre de nouveaux titres annuels à environ 200.
Se pose en sus la gestion des titres quittant la base : introuvables via la BNDalloz mais consultables si l’URL est connue (… pour le moment).
La page dédiée au corpus Dalloz bibliothèque numérique est désormais disponible dans le manuel import ICI
Stéphanie Himber
Responsable du chantier CERCLES BNDalloz