CERCLES Bibliothèque Numérique Dalloz : retour d’expérience du SCD de l’université de Strasbourg

logo-unistra

« Genèse » du Chantier CERCLES de la Bibliothèque Numérique Dalloz

Le chantier “CERCLES BNDalloz” a été initié par le SCD de l’Université de Strasbourg en avril 2016 (sa fin est prévue pour le printemps 2017).

Il fait suite à l’immersion de Catherine Storne à l’Abes en janvier/février 2016.
Les objectifs de cette immersion étaient à la fois de rapprocher les équipes “docelec” et “catalogage” pour mieux signaler les ressources électroniques et de circonscrire la relation éditeurs et bibliothèque dans le traitement des métadonnées.

La documentation électronique seconde, voire prend le pas –pour certaines disciplines- sur la documentation papier. Il est dès lors nécessaire aux bibliothèques de s’inscrire comme acteur de leur signalement. Le SCD de l’université de Strasbourg a voulu participer, au travers de ce projet, à cette transition.

Organisation du Chantier CERCLES

L’équipe

L’équipe en charge de ce projet se compose de deux personnes :

  • Stéphanie Himber, responsable du chantier CERCLES BNDalloz.
  • Stéphane Rehlinger

Ne bénéficiant pas de temps dégagé pour se consacrer prioritairement à ce projet, nous y avons travaillé aussi régulièrement que possible lorsque nos activités propres à notre structure nous le permettaient.
Le départ de l’initiatrice du chantier, en septembre 2016, aurait pu nous fragiliser car nous ne disposions alors que des extractions initiales. L’appui des services Interfaces & Traitements et Métadonnées de l’Abes a donc été d’une grande aide : au niveau des outils, nous avons disposé d’extractions ad hoc et bénéficié de modifications en lot ; au niveau de l’accompagnement, nous avons pu nous appuyer sur des conseils et orientations de travail.
Nous avons également pu nous appuyer sur notre collègue Catherine Banos, correspondante “publications en série périodiques et collections” au sein du SCD de l’université de Strasbourg, et sur l’équipe du CR Alsace du Sudoc-PS de la BNUS – Christine Hecht et Estelle Cade – pour les demandes de numérotation ISSN des collections électroniques.

Périmètre du chantier

Le corpus initial – circonscrit en février 2016 – compte environ 1950 notices bibliographiques auxquelles s’ajoutent les versements réguliers de nouveaux titres, soit actuellement près de 2150 notices.
Il convient d’y ajouter les 40 notices de collection dont seulement 6 étaient présentes dans le Sudoc avant le début du chantier.

Lors du travail préparatoire sur ce corpus, les notices Oa ont été créées par copie des notices Aa existantes puis enrichies et corrigées par l’Abes.

Ci-dessous le tableau des modifications apportées par script vbs lors de la création par copie

Notice papier Notice d’e-book correspondante
001 Non repris
002 Non repris
003 Non repris
008 Par défaut : $aOax3
010 Non repris
020 Non repris
021 Non repris
033 Non repris
034 Non repris
035 Remplacé par défaut par : ##$aBNDalloz
073 Non repris
106 Non repris
135 Ajout par défaut : ##$av$br$cm$e#$gm$ia$ja
181 Ajout par défaut : ##$P01$ctxt
182 Ajout par défaut : ##$P01$cc
215 Non repris
225 Non repris
230 Ajout par défaut : ##$aDonnées textuelles
337 Ajout par défaut : ##$aNécessite un logiciel capable de lire un fichier au(x) format(s)Widelook ou Widelook Flash
410 Non repris
452 Ajout par défaut : ##$0″ + ancienPpn
801 Non repris
802 Non repris
830 Non repris

Ci-dessous les enrichissements

zone
010 ISBN électronique
100$a / 210$s dates du tableau-Dalloz ajoutées en 100$a et 210$d (par écrasement de celles éventuellement présentes)
205 Numéro d’édition tiré de la BNDalloz
676 $a340
859 URL fourni par l’OAI-Dalloz

Une fois ces deux opérations terminées, il restait environ 570 notices ou titres à traiter :
Cataloguer les documents électroniques pour lesquels la notice papier n’existe pas ;
Vérifier / corriger les notices Oa déjà présentes dans le Sudoc ;
Vérifier les notices susceptibles d’être des doublons. Dédoublonner quand nécessaire ;
Enrichissement des notices absentes de l’entrepôt OAI-Dalloz.

… et quelques 1830 notices Oa créées par l’Abes à enrichir ou à corriger.

Si la taille de ce corpus est relativement modeste, son signalement dans les catalogues est fortement attendu par les collègues. Aussi, plus que la complexité du traitement catalographique, c’est l’impératif de la réalisation du chantier pour fin 2016/janvier 2017 (comme nous nous l’étions fixé) qui nous a préoccupé.

Organisation du travail

  • Nous avons élaboré des outils de travail que nous avons partagés sur un dossier commun et nous disposions d’un espace collaboratif de travail proposé par l’Abes.

Outils de suivi
▹Tableau de suivi étape par étape ;
▹Tableau de suivi des demandes ISSN ;
▹Tableau des erreurs à corriger : notices doublons, 859 doublons, pb. d’eISBN, erreur de référencement Dalloz, … ;
▹Sauvegarde de plusieurs extractions servant de base de travail ;
▹Tableau détaillé des zones retenues pour le catalogage des documents électroniques.
▹Liste des nouveaux titres versés sur la base depuis mars 2016 : pISBN-eISBN-titre-édition-collection-date de mise en ligne-eppn-URL ;
▹Suivi pour info. au réseau / tableau de bord ;
▹Extractions réalisées par l’Abes.

Le manuel CERCLES de suivi du chantier est disponible ICI

  • Nous avons construit nos scripts vbs :
    Avec Nicole Krieger, correspondante SUDOC pour notre structure, nous avons déterminé les zones Unimarc que nous utiliserons pour créer et enrichir les notices Oa. Dans un document interne, nous avons commenté chaque zone et détaillé la forme du contenu de celle-ci.
    Nous avons formalisé le tout au travers d’un script que nous avons enrichi au fur et à mesure des consignes communiquées par l’Abes (ex. zones 339, 035).

Script vbs des notices bibliographiques :

"010 ##$AISBN$bebook"&vblf&_
"035 ##$aBNDalloz_"&vblf&_
"135 ##$av$br$cm$e#$in"&vblf&_
"181 ##$P01$ctxt"&vblf&_
"182 ##$P01$cc"&vblf&_
"230 ##$aDonnées textuelles"&vblf&_
"303 ##$aDescription d'après la consultation du 2017-MM-JJ"&vblf&_
"304 ##$aTitre provenant de la page de titre de la version électronique"&vblf&_
"305 ##$aVersion électronique de la XXe édition, Paris : Dalloz, 20"&vblf&_
"307 ##$aPagination de l'édition imprimée : XXX p."&vblf&_
"310 ##$aAccès réservé aux usagers des établissements qui en ont fait l'acquisition"&vblf&_
"320 ##$aBibliogr. p. XXX de l'édition imprimée"&vblf&_
"339 ##$aHTML$d20"&vblf&_
"339 ##$aSWF$d20"&vblf&_
"337 ##$aNécessite un logiciel capable de lire un fichier au(x) format(s) Widelook ou Widelook Flash"&vblf&_
"452 ##$0PPN imprimé"&vblf&_
"676 ##$a340$v22"&vblf&_
"830 ##$aChantier CERCLES 2016 ! Ne pas modifier cette notice sans avoir vérifié le périmètre d'intervention sous la responsabilité de : SCD de l'université de Strasbourg. Pour plus d'information, consultez le manuel CERCLES du GM."&vblf

  • Nous avons procédé de la même façon pour les notices Od
    Script vbs des notices de collection :
008 ‎$aOdx3
100 0#‎$a200X‎$d200X-
101 0#‎$afre
102 ##‎$aFR
104 ##‎$ak‎$by‎$cy‎$dba‎$e0‎$ffre
106 ##‎$ar
110 ##‎$ab‎$by‎$cb‎$em‎$f0‎$gy‎$hy‎$i0
135 ##‎$av‎$br‎$cm‎$dn‎$e#‎$gm‎$hn‎$in‎$ja‎$kn
181 ##‎$P01‎$ctxt
182 ##‎$P01‎$cc
200 1#‎$a@Codes Dalloz universitaires et professionnels
210 ##‎$aParis‎$cÉditions Dalloz‎$d[200?]-
230 ##‎$aDonnées textuelles
301 ##‎$aDemande de numérotation ISSN en cours
303 ##‎$aNotice réd. d'après la consultation du 2016-07-06
304 ##‎$aTitre provenant de l'écran-titre
310 ##‎$aL'accès à cette ressource est réservé aux usagers des établissements qui en ont fait l'acquisition.
326 ##‎$aCollection
337 ##‎$aNécessite un logiciel capable de lire un fichier au(x) format(s) Widelook ou Widelook Flash
452 ##$0LIEN VERS Ad
517 ##‎$a@Codes Dalloz

Travaillant à deux personnes sur ce corpus et étant dans des établissements distants, il était capital d’assurer un traitement uniforme des notices au risque de devoir s’entre-corriger.

Le traitement

Suite à l’étude des extractions initiales et à l’étude de la qualité des métadonnées, il a été décidé de créer les notices Oa par duplication des notices Aa pré-existantes et de les corriger / compléter le cas échéant à l’aide des données venues du site  Dalloz.
Aussi, contrairement à d’autres chantiers CERCLES, nous n’avons pas été concernés par la création d’autorités.

Plusieurs opérations ont fait l’objet de modifications en lot par l’Abes à partir d’extractions de sous-ensembles. C’est le cas de l’insertion des zones 035, 225/410, 304, 310, 339, 830, 859.
Le reste des vérifications et traitement des « cas spéciaux » s’est fait manuellement.

Concrètement, les opérations que nous avons eues à mener étaient :

  • des enrichissements ou corrections de notices bibliographiques et de collection : pour cela, nous avons travaillé à partir des extractions initiales et à partir des extractions de sous-ensembles, résultats de modifications en lot, faites tout au long du chantier.
  • des créations de notices bibliographiques et de collection : nous nous sommes appuyés – quand cela a été possible – sur la notice Aa existante que nous avons dupliquée et modifiée à l’aide de notre script.

Chaque création / vérification de notice s’est faite à partir de la « fiche de l’ouvrage » Dalloz + affichage / consultation du document électronique.

Quelques chiffres

Notices de collection Traitement en lot Traitement manuel
Création de notices de collection + demande de numérotation ISSN 39 notices
Doublons
notices dédoublonnées env. 50 notices
URL
Vérification de notices sans URL 34 ppn
Modifications
Insertion zone 010 $a 120 notices
Insertion zone “035BNDalloz” 2081 notices 13 notices
Insertion zones 181/182 5 notices
Insertion zones 225/410 1434 notices 716 notices
Insertion zone 230 1901 notices
Insertion zone 830 1901 notices
Insertion zone 859 “URL” 1726 notices
Zone 859 : substitution de l’URL pointant vers la notice de présentation par l’URL pointant vers le document 380 notices
suppression zone 073 273 notices
Suppression zone 839 30 notices
Créations
création manuelle de notices Oa env. 240 notices

Problèmes rencontrés

  • Numérotation ISSN des collections électroniques :
    L’intitulé de la collection électronique mentionné sur la fiche de présentation de la base Dalloz diffère de la mention de collection signalée sur la page de titre de la version électronique du document (nouvelle collection ou absence de série). Du coup, certaines demandes de numérotation ISSN ont été rejetées par le Centre ISSN France. Ces dernières ont été relancées en mars 2017 avec un dossier étoffé. Sont concernées les collections suivantes :
    ▹Cours
    ▹Dictionnaires Dalloz
    ▹Etudes, mélanges, travaux
    ▹Hors collection
    ▹Hors collection Dalloz / Hors collection Delmas / Hors collection Sirey
  • Communication de l’URL d’accès :
    Nous avons communiqué  les URL au fur et à mesure à l’Abes en complétant un fichier partagé (contenant déjà les PPN des notices créées).  l’Abes ne peut les récupérer directement et facilement via le service dédié Dalloz, un long nettoyage préalable des données récupérées est nécessaire via Open Refine avant de pouvoir les insérer en lot dans les notices.
    Nous avons utilisé le service mis à disposition par Dalloz :
    Test de service BND ☞ http://www.dalloz-bibliotheque.fr/services/bndtest.php?isbn
  • Accès aux anciennes éditions déjà retirées de la base Dalloz. Grâce au même service Dalloz, via l’ISBN (consigné dans les premières extractions) nous avons pu trouver les informations éditeur du document électronique.

dalws

  • Fiche de présentation BNDalloz incomplète ou erronée : absence de l’édition, ISBN doublon, … ;
  • Nombre réduit de connexions simultanées (5) nous obligeant à différer la consultation / le traitement des documents.

Questions soulevées

  • Lors du traitement catalographique :
    • Quel sort réserver à la zone 205 ?
      Pour la BNDalloz, la version électronique est la reproduction de la version imprimée ; c’est donc tout naturellement que Dalloz signale dans la « fiche de présentation » de l’ouvrage électronique, le numéro de l’édition imprimée. La BNDalloz donnant accès à plusieurs éditions du même titre, nous avons choisi de mentionner le numéro d’édition de la version imprimée conformément à ce que Dalloz fait dans sa base.
      Nous avons ajouté également la zone 305 :
      Ex. 305 ##‎$aVersion électronique de la 2e édition, Paris : Dalloz, 2016
    •  Que faire de la mention « matériel d’accompagnement » ?
      Il a été décidé de garder cette information en zone 327.Ex. 327 2#‎$aLa ressource ne donne pas accès aux données contenues sur le CD-ROM accompagnant l’édition imprimée
    • Notices de collection : comment dater le début d’une collection électronique, sachant que la BNDalloz est une base dont la mise à jour est régulière ?
      Il a été convenu que c’est l’année de mise en ligne du premier titre dans la collection qui compte. A défaut de la connaître, nous avons considéré la date comme incertaine :
      100 $a 20XX, 100 $d20XX-… et en 210 $d [20??]-
  • Cas de l’exemplarisation :

La question s’est posée de s’exemplariser de suite sous les notices créées par duplication en février/mars 2016 ou d’attendre la fin du chantier CERCLES.
Certaines bibliothèques, en option « Mises à jour propres » pour leur transferts réguliers, ont décidé de se localiser sous les notices fraîchement créées par copie, au risque de récupérer en local des notices incomplètes et perfectibles. D’autres, en option « toutes mises à jour » ont pu bénéficier de la mise à disposition rapide de nos créations, en ayant la garantie de recevoir au fil de l’eau nos enrichissements.
Ici, le SCD de l’université de Strasbourg a opté pour l’exemplarisation en fin de chantier. Les modalités n’ont pas encore été définies ; il a toutefois été décidé de créer une double localisation si la ressource électronique est présente sur deux bases (le plus souvent ScholarVox) car la BNDalloz est pressentie comme une base relativement stable.

  • La pertinence du corpus :
    Les sciences juridiques étant une discipline pour laquelle l’information est vite obsolète, nous nous sommes demandé s’il était utile et pertinent de signaler des éditions anciennes.
    La réponse n’étant pas clairement tranchée, nous avons traité tous les titres dont nous avions connaissance.
    A voir par la suite si nous procéderons à une sorte de « désherbage » du catalogue.A titre d’exemple, le titre suivant (ppn 191184985) : Comptabilité et gestion des associations : système comptable, gestion financière, analyse et contrôle de gestion / Francis Jaouen. – 11e éd. [à jour au 22 décembre 2008]. – Paris : Dalloz : Delmas, 2009. – (Encyclopédie Delmas).
    La notice ne comporte pas le champ 859 car le titre n’est plus accessible via la base et l’URL n’est pas connu.

Nos impressions sur cette expérience

Ce type de chantier nécessite un investissement important :

  • du temps pour organiser le travail, pour assurer un suivi régulier et être réactif aux diverses sollicitations ;
  • de la concentration pour jongler, au sein de la même journée, entre nos activités initiales et l’étude d’extractions / traitement de notices.

Nous n’avons été que deux personnes à nous lancer dans ce chantier. Après réflexion, cela n’a sans doute pas été un mal car le travail de coordination n’aurait été que plus important si nous avions été plus nombreux.

La création des notices Oa par copie des notices Aa nous a grandement soulagé. Du coup, nous avons eu relativement peu de notices à créer eu égard à la taille du corpus initial.
En outre, il me semble que pour mener à bien ce type de chantier, il est nécessaire de trouver l’appui d’une équipe capable de manipuler les métadonnées dans tous les sens, de faire des extractions du corpus et des modifications d’ensemble. Grâce aux équipes de l’Abes, nous avons pu avancer à pas de géant dans le traitement des notices.

Et la suite ?

Conformément au principe du dispositif CERCLES, où l’établissement reste le référent sur le corpus pour le réseau Sudoc, le SCD de l’université de Strasbourg maintiendra l’effort de mise à jour. En effet, Dalloz fait partie des éditeurs qui ne fournissent pas (encore ?) de métadonnées exploitables qu’il serait possible de traiter de façon automatique ou presque pour alimenter le SUDOC et d’autres outils.
En s’appuyant sur le nombre de titres versés sur la base en 2016, nous pouvons estimer le nombre de nouveaux titres annuels à environ 200.
Se pose en sus la gestion des titres quittant la base : introuvables via la BNDalloz mais consultables si l’URL est connue (… pour le moment).

La page dédiée au corpus Dalloz bibliothèque numérique est désormais disponible dans le manuel import ICI

28684221452_443261be71_n

« Kandinsky circles int’l july » (CC BY-NC-ND 2.0) by CaZaTo Ma

Stéphanie Himber
Responsable du chantier CERCLES BNDalloz

logo-unistra