Le SUDOC en RDF : du nouveau ! 2/2

RDA en RDF : pourquoi, comment ?

Fidèles au principe de réutiliser au maximum des vocabulaires déjà publiés, et si possible « métiers », c’est assez naturellement du côté de RDA, qu’on a cherché la sémantique adéquate. On utilisait déjà des propriétés et des classes telles que : ModeOfIssuance, WorkManifested/ManifestationOfWork, et la classe Work.

 Pour les zones de liens, ce vocabulaire est celui qui, en général, « colle » le mieux avec les données issues de l’Unimarc.

Il y avait toutefois un problème avec RDA en RDF : il était publié depuis 2009 à l’état de « propositions » seulement (« new-proposed », sur Open Metadata Registry), donc de brouillon.  Or, le JSC (Joint Steering Commitee, en charge du développement et de la diffusion du code de catalogage  RDA), s’est penché récemment sur son sort et a décidé d’en publier une nouvelle version consolidée et validée, sur l’OMR. L’espace de nom a été changé : l’URL http://www.rdaregistry.info/ accueille désormais l’ensemble des classes et propriétés RDA, ainsi que l’ensemble de la documentation associée.

Cette validation est en elle-même très positive, car elle donne une certaine garantie sur la pérennité et le maintien de ce vocabulaire. Mais dans l’immédiat, le changement d’espace de nom rend obsolètes les propriétés et classes précédemment utilisées, obligeant à une mise à jour du modèle de données. Il ne faudrait donc pas que cela devienne une habitude… D’autant plus que les listes de vocabulaires contrôlés (listes fermées de valeurs) sont restées sur l’ancien espace de nom http://rdvocab.info/. Ce qui ne simplifie pas les choses.

Les propriétés sont désormais, comme pour l’ISBD, identifiées par des codes opaques, et non plus par des libellés en anglais. Ce qui peut aussi se discuter car ne facilite pas leur manipulation. Mais elles sont désormais officiellement utilisables.

Ce vocabulaire comporte plusieurs sous-domaines : les agents (rdaa), les classes (rdac), et les propriétés, réparties selon leur domaine d’application FRBR : rdaw : pour les propriétés d’œuvres ; rdae, pour celles des expressions ; rdam, pour les manifestations, rdai, pour les items.

La plupart des catalogues, SUDOC compris, n’étant pas, ou très imparfaitement, FRBRisés, un domaine « unconstrained properties » (rdau), rassemble également l’ensemble des propriétés précédentes. C’est celui qui a été retenu pour les zones de liens.

Exemple

Une zone 430 (Suite de) exprime en principe une relation entre deux œuvres. Mais la ressource décrite dans le Sudoc est plutôt une manifestation. C’est pourquoi seul l’usage d’une propriété sans contrainte de domaine  est correct. En l’occurrence : "is continuation of" dont l’état civil sur le web de données est rdau:P60576.

M. Jeulin

De F. Rieder. CC BY-NC-SA 2.0. Source : Flickr

De F. Rieder. CC BY-NC-SA 2.0. Source : Flickr

Le SUDOC en RDF : du nouveau ! 1/2

A propos du  web de données, et du Sudoc en RDF, voir notamment les billets précédents ici et .

L’été 2013 avait vu la mise en ligne d’une documentation sur l’exposition du SUDOC en RDF, et l’annonce d’un chantier visant à enrichir et affiner progressivement celle-ci. Ce chantier a produit ses premiers résultats au cours de l’année universitaire écoulée, par petites touches successives. Zoom sur les nouveautés.

Alignements

Dans un souci d’interopérabilité avec Data.bnf.fr, le FRBNF des notices BNF a été ajouté, à côté des OCN d’OCLC déjà présents : onto-bnf :FRBNF (propriété maintenue par la BnF elle-même). Les identifiants ark – présents dans une partie des notices du Sudoc, devraient suivre un peu plus tard.

Types de documents

Pour typer les documents décrits, on fait appel, de façon partiellement redondante, à trois vocabulaires :

-  Bibliographic ontology (plus familièrement « bibo »). C’est un vocabulaire simplifié d’usage assez large, au-delà de la communauté professionnelle des bibliothécaires

- Dublin Core, encore plus générique

- ISBD en RDF, maintenu par l’IFLA. Celui-là correspond plus strictement à nos standards de description bibliographique. Plus précis mais sans doute plus déroutant pour le profane…

Jusqu’ici, on utilisait de « bibo » que les classes « Book », « Periodical », « Series ». D’autres types de documents sont désormais identifiés: « Image », « Audio », « Audiovisual »…

- Idem pour Dublin Core : Image, Moving Image, Sound…

Côté ISBD, on utilise les deux propriétés isbd:P1001 « Content form » (type de contenu) et isbd:P1003 « Media type » (type de « médiation ») qui font appel à des listes de valeurs contrôlées.

Auparavant on ne distinguait guère que les documents imprimés et électroniques.  Désormais, le spectre des documents identifiés est plus large, même si pas encore tout à fait exhaustif : images fixes ou animées, documents musicaux ou sonores, cartographiques, microformes…

Exemple (RDF/XML):

<bibo:AudioVisualDocument rdf:about="http://www.sudoc.fr/114415641/id">
 <dc:title>Les Shadoks  [Images animées]  : l'intégrale des origines à nos jours  / René Borg, Robert Richez, Jacques Rouxel... [et al.], réal.  ; Jacques Rouxel, texte  ; Robert Cohen-Solal, comp.  ; Claude Piéplu, voix</dc:title>
 …
 <isbd:P1001>
 <skos:Concept rdf:about="http://iflastandards.info/ns/isbd/terms/contentform/T1002">
 <skos:prefLabel xml:lang="en">image</skos:prefLabel></skos:Concept>
 </isbd:P1001>
 <isbd:P1003>
 <skos:Concept rdf:about="http://iflastandards.info/ns/isbd/terms/mediatype/T1007"><skos:prefLabel xml:lang="en">video</skos:prefLabel></skos:Concept>
 </isbd:P1003>
 …
 </bibo:AudioVisualDocument>

Soit en Turtle :

<http://www.sudoc.fr/114415641/id> a bibo:AudioVisualDocument ;
 dc:title "Les Shadoks  [Images animées]  : l'intégrale des origines à nos jours  / René Borg, Robert Richez, Jacques Rouxel... [et al.], réal.  ; Jacques Rouxel, texte  ; Robert Cohen-Solal, comp.  ; Claude Piéplu, voix" ;
 isbd:P1001 <http://iflastandards.info/ns/isbd/terms/contentform/T1002> ;
 isbd:P1003 <http://iflastandards.info/ns/isbd/terms/mediatype/T1007> ;
 dc:type "Moving Image" ;
  
 <http://iflastandards.info/ns/isbd/terms/contentform/T1002> a skos:Concept ;
 skos:prefLabel "image"@en .
 <http://iflastandards.info/ns/isbd/terms/mediatype/T1007> a skos:Concept ;
 skos:prefLabel "video"@en .

Zones de liens bibliographiques : Unimarc 4XX

Ces liens se trouvent dans les zones 4XX de l’Unimarc, une bonne partie d’entre eux concernant les périodiques dont ils permettent de reconstituer l’historique (suite de/ devient, fusions/scissions, etc.).

Jusqu’ici, seule une petite partie d’entre eux était convertie, à l’aide des propriétés relationnelles de Dublin Core, beaucoup moins précis en la matière que l’Unimarc : hasFormat, relation, hasVersion.

A présent presque tous ces liens sont publiés. Il reste encore un peu de  Dublin Core (is part of / has part), de Bibo, à la marge (notamment pour les tirés à part) ; le reste avec RDA qui a fourni l’essentiel du vocabulaire ad hoc. (Voir la suite)

Certaines relations ont été par la même occasion précisées par une nouvelle propriété : par exemple « Est une reproduction de » : traduit par dcterms:isFormat l’est désormais par rdau:P60297 (is reproduction of)

Deux zones Unimarc sont encore exprimées de façon approximative :

- 451 : Autre édition sur un même support

- 452 : Autre édition sur un support différent

Elles n’existent dans aucun vocabulaire et devront être forgées.

La suite consistera à exposer  ces mêmes champs 4XX quand ils n’ont pas de lien, c’est-à-dire lorsqu’ils sont utilisés comme points d’accès. Comme, par exemple, les nombreuses 463$t ou 464$t (Comprend) contenant des titres de volumes ou d’œuvres contenues.

Mises à jour, présentes et à venir : bonnes pratiques

L’ancienne propriété a été pour l’instant  conservée, de façon redondante.

Par ailleurs, les propriétés RDA WorkManifested, ManifestationOfWork, et la classe Work : déjà utilisées dans quelques cas précis (titres uniformes, thèses) sont désormais obsolètes et sont  remplacées par leurs homologues rdam:P30135, rdac:C10001. De même que modeOfIssuance par  rdau:30003

A noter que le vocabulaire obsolète est pour l’instant maintenu. Ceci dans un souci d’assurer une interopérabilité entre deux versions du modèle de données, et d’éviter de « casser » des applications qui exploiteraient les données impactées. Ce principe ne pourra pas toujours être appliqué, mais à l’avenir, les modifications apportées à l’existant seront annoncées à l’avance avec une échéance, comme pour les modifications habituelles de format.

A ce propos, tous les retours sont les bienvenus !

Chantier ouvert au public, casque obligatoire

D’après A. Raanes. CC by 2.0. Source :Flickr

Rappelons enfin que tout ce qui précède est détaillé dans la documentation en ligne :

http://documentation.abes.fr/sudoc/manuels/administration/sudoc_rdf

M. Jeulin

Retours et explications sur la panne du 14 au 20 juin 2014

Contexte

L’intervention technique prévue les 12 et 13 juin derniers avait plusieurs objectifs :

  •   installer de nouveaux matériels (serveurs, mémoires, commutateurs réseaux, serveurs de stockage, …) et migrer des services sur ces nouveaux matériels
  •  réorganiser et sécuriser le réseau
  •   réorganiser les serveurs dans les baies.
  •   sécuriser l’alimentation électrique des serveurs

Certaines de ces interventions, délicates à mener, nécessitant une assistance extérieure, l’ABES a été obligée de programmer cet arrêt en semaine. De plus, une partie de ces interventions était un préalable à d’autres actions, planifiées durant l’arrêt prévu du 18 au 23 juillet – un arrêt imposé par notre hébergeur, le Cines, qui procède à de lourds travaux de sécurisation de son infrastructure électrique.

Le fait que cette intervention se soit révélée aussi « catastrophique » n’est pas dû à un manque de préparation – une équipe du DSI ayant travaillé depuis plusieurs mois à son organisation – mais à un malheureux jeu de pannes matérielles successives et improbables qui ont entrainé une impossibilité pour l’ABES de reprendre le service dans les délais annoncés.

Les faits marquants

  • jeudi 12 juin à 16h : l’intervention débute normalement
  •  nuit de jeudi 12 à vendredi 13 : lors du redémarrage des serveurs, 3 matériels essentiels tombent en panne : 2 commutateurs réseaux et le serveur de stockage principal. De plus, du fait d’une configuration erronée, certains nouveaux matériels refusent également de fonctionner normalement. La panne la plus grave est celle affectant le serveur de stockage. En effet, celui-ci héberge les bases de données des Thèses, la base miroir du Sudoc (la base XML), ainsi que tous les serveurs (virtuels) d’indexation associés à ces 2 bases de données.
  •  vendredi – samedi – dimanche : face à ces pannes, les équipes informatiques de l’ABES établissent une nouvelle stratégie afin de pouvoir reprendre le service et surtout éviter toute corruption de données.
  • lundi 16 juin : grâce à cette intervention, le service peut reprendre partiellement. Les applications du Sudoc (WinIBW, interface publique, Colodus) et Calames fonctionnent normalement, malgré quelques perturbations passagères durant les 2 jours suivants. Malheureusement, du fait de la panne du serveur de stockage, les applications des Thèses ainsi que les services autour de la base miroir du Sudoc (Périscope, SelfSudoc, webservices) ne reprennent pas.
  •  mardi 17 juin : l’ABES s’engage dans deux voies distinctes :
  • reconstruire l’ensemble de services en panne sur de nouveaux serveurs puis restaurer les données à partir des sauvegardes
  •  en parallèle, continuer à tenter avec notre prestataire de réparer le serveur de stockage.
  • mercredi 18 : après plusieurs tentatives infructueuses, le serveur de stockage est partiellement réparé. Cependant, une nouvelle intervention est nécessaire. Elle est planifiée par le prestataire le jeudi matin. Le mercredi soir, l’ABES décide donc logiquement de ne pas reprendre le service puisque l’intervention prévue le jeudi matin nécessite à nouveau un arrêt. Malheureusement, après avoir repoussé une première fois l’intervention au jeudi après midi, le prestataire l’annule car … il a commandé la mauvaise pièce ! Suite à cette mauvaise nouvelle, l’ABES prend la décision de reprendre au plus tôt le service sur des nouveaux serveurs, de restaurer les données et de faire fonctionner le serveur partiellement réparé pour les quelques services qui n’ont pu être migrés sur de nouveaux serveurs.
  •  soirée du jeudi et matinée du vendredi : après quelques ajustements, l’ensemble des services de l’ABES réouvrent le vendredi après midi.

Et la suite ?

L’ABES va maintenant s’atteler à :

  • terminer la migration des données encore présentes sur le serveur incriminé. Cette action est bien entendu déjà engagée.
  • se prémunir pour que cette suite d’évènements ne puisse plus se reproduire. Du matériel réseau en secours va être acquis et tous les matériels de stockage seront doublés. L’intervention du 12 juin avait d’ailleurs cet objectif – un objectif qui, comme vous le comprendrez, n’a pu être mené à son terme. Durant cette intervention, il était en effet initialement prévu de migrer la majeure partie des données du serveur de stockage tombé en panne sur 2 nouveaux serveurs, avec duplication des données sur ces serveurs.
  •  ajuster les procédures d’exploitation afin de pouvoir réagir au plus vite en cas de panne

Stéphane Rey, chef du Département Système d’Information

« Métarevues » : un outil dédié au traitement des périodiques

« Métarevues », quésaco ?

Comme son nom l’indique, « Métarevues » est un outil dédié aux périodiques, qui permet de générer l’historique complet – papier et électronique – d’une même métarevue, à partir d’un PPN (identifiant des notices du SUDOC) ou d’un ISSN papier ou électronique. Plus précisément, on appelle ici métarevue, l’ensemble des titres qui constitue un périodique depuis sa naissance. Car, comme on le sait, une revue est véritablement vivante ! Contrairement aux monographies, aux vies bien rangées, il est en effet possible qu’au cours de son existence, une revue change de nom (et ce parfois plusieurs fois), fusionne avec un titre cousin ou soit l’objet d’une scission en deux voire trois, quatre titres distincts…

« Métarevues » et ISTEX

Dans le cadre des achats en licence nationale (projet ISTEX), notamment durant la phase des négociations, ADELE (le département achat de documentation électronique de l’ABES) reçoit de la part des éditeurs des listes de revues. Bien souvent, ces listes ne sont pas correctes (bibliographiquement parlant, s’entend). Effectivement les données fournies par les éditeurs ne reflètent pas toujours l’historique exact des revues.

Par exemple, l’éditeur nous livrerait simplement l’élément …

  • La revue du blouson     1925   –   2008

… à la place des éléments suivants, qui correspondraient à la véritable histoire de la revue :

  • La revue de la blouse 1925 – 1960
  • La revue de la blouse grise A. Avec des boutons blancs   1961 – 1974
  • La revue de la blouse grise B. Avec des boutons bleus 1961 – 1974
  • La revue du blouson en jean 1975 – 1998
  • La revue du blouson en cuir 1999 – 2003
  • La revue du blouson 2004 -2008

A l’origine, l’ABES a donc développé le programme « Métarevues » pour aider à corriger les listes de périodiques proposées par les éditeurs dans le cadre des achats ISTEX.

Ce travail est particulièrement utile pour le signalement des exemplaires ABES Licence Nationale dans le catalogue SUDOC ; il permet en effet d’identifier l’ensemble des notices à exemplariser une fois les corpus de revues acquis.

De plus, le programme génère non seulement l’historique complet d’une même métarevue électronique mais aussi celui de sa métarevue papier correspondante. C’est donc également grâce à cet outil que le hub peut proposer les fameux fichiers d’aide au désherbage – listes des PPN des éditions imprimées liées aux ressources électroniques acquises – mis à disposition des établissements sur le site licencesnationales.fr.

« Métarevues » peut aussi servir aux négociateurs ADELE directement. Par exemple, si l’éditeur propose dans son offre le titre La revue du blouson en jean (1975-1998) et le titre La revue du blouson (2004-2008), l’outil permettra de repérer que ces deux titres appartiennent en fait à une même métarevue, et aux négociateurs alors de pointer les titres manquants (La revue de la blouse, la revue du blouson en cuir, etc) : « pourquoi ne pas les intégrer dans votre offre, cher éditeur, puisqu’ils appartiennent en réalité à la même revue ? » Et si le fournisseur ne détient pas (ou plus) les droits sur les titres en question, ce peut être éventuellement un argument pour rediscuter les tarifs… tout en gardant en tête l’idée qu’il sera peut-être possible de reconstituer le « puzzle » ultérieurement, en achetant les parties lacunaires auprès d’autres éditeurs avec lesquels il est prévu de faire affaire.

Comment ça marche ?

« Métarevues » repose sur les données du SUDOC. L’outil remonte les informations des notices liées à partir des zones :

  • 4XX
  • 440 Devient
  • 441 Devient partiellement
  • 442 Remplacé par
  • 443 Remplacé partiellement par
  • 444 Absorbé par
  • 445 Absorbé partiellement par
  • 446 Scindé en … et en …
  • 447 Fusionne avec … pour donner…
  • 43X :
  • 431 Suite partielle de
  • 432 Remplace
  • 433 Remplace partiellement
  • 434 Absorbe
  • 435 Absorbe partiellement
  • 436 Fusion de … et de …
  • 452 : a pour autre édition sur un support différent.

Les résultats peuvent être renvoyés sous deux formes, une forme tabulée (format xls) contenant les champs suivants : ISSN, PPN, Titre, Editeur, Date, et un schéma XML. C’est à partir de la sortie en format XML qu’il est possible de visualiser les données sous forme de graphe. Les données de lien peuvent ainsi être interprétées avec un logiciel comme Gephi (https://gephi.org/).

Ci-dessous le type de visualisations qu’il est possible d’obtenir ainsi :

metarevue1

Utilisation dans Périscope

Au-delà d’ISTEX, « Métarevues » est utilisé dans l’application Périscope, laquelle permet désormais de visualiser l’historique complet lié à une revue.

Exemple, pour le titre Physics world publié par IOP Publishing :

metarevue12

metarevue3

Y OCLC también

OCLC propose également des historiques de revues. Les résultats donnés se fondent sur les informations signalées dans son propre catalogue, WorldCat.

Le lien vers le service en ligne se trouve ici : http://xissn.worldcat.org/xissnadmin/index.htm

Marion Grand-Démery

Annuaire des Web Services Sudoc

Un annuaire des Web Services Sudoc est disponible à cette adresse : http://www.sudoc.fr/services/annuaire/.

Il permet  de prendre connaissance de l’ensemble des Web Services Sudoc existants et d’accéder à leur documentation.

L’annuaire et les Web Services Sudoc ont été présentés pendant les Journées ABES 2014 lors de la session "Des API, pour quoi faire ?" :
"Afin de rendre plus concrètes les possibilités offertes par ces API, Yves Tomic et Julien Sicot présenteront les réalisations de leurs établissements respectifs : enrichissement de l’OPAC, nouveaux outils pour les usagers (DoMyBiblio), mise en valeur des thèses… "

L’ annuaire des Web Services Sudoc  est également disponible à partir de la page "Pour les développeurs" du site de l’ABES.

 

 

Une zone 309 pour coordonner le travail collectif sur la qualité des données Sudoc

Au moment du chargement de nouvelles notices ou à l’occasion d’un chantier de contrôle qualité, l’ABES peut être amenée à effectuer des modifications de masse pour améliorer ou corriger des notices. Hélas, tout n’est pas automatisable – surtout si on tient à conserver un certain niveau de qualité bibliographique. Une fois que les algorithmes ont parlé et atteint leurs limites, l’ABES passe le relais au réseau, qui possède la force de frappe et l’expertise humaine pour continuer le travail, ne serait-ce qu’en se concentrant sur l’essentiel ou le prioritaire.

Mais, précisément, qu’est-ce qui est essentiel ? Qu’est-ce qui est prioritaire ? Sur quelles notices faut-il que le réseau se mobilise ? Et sur quels points précis dans les notices ? Étant donné la taille de la base, le volume des entrées et la richesse des règles, chaque catalogueur, chaque service de catalogage peut se sentir perdu devant l’ampleur de la tâche. C’est pourquoi l’ABES souhaite structurer d’avantage l’organisation de cet immense travail collectif. Cette volonté se traduit aujourd’hui sous une forme très concrète : la zone 309…

309_en_chantier
Cette "note d’information interne au Sudoc" existait déjà, mais elle ne possédait qu’une sous-zone ($a) :

309 ##$aCORRIGER LE(S) CODE(S) DE FONCTION = 000 EN 7XX, L7XX et/ou E7XX. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

Elle est désormais structurée, ce qui permet une meilleure exploitation.

309 et ToDoList

Ainsi, dans le cadre des travaux du hub de métadonnées sur les ebooks de droit international achetés dans le cadre d’ISTEX, certains traitements automatiques ont permis d’enrichir les données, notamment en ajoutant des liens aux autorités auteur. Quand le programme n’a pas su identifier la bonne autorité, une zone 309 a été injectée dans la notice bibliographique concernée, pour inciter les catalogueurs à poursuivre le travail et les guider.

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$d2014-04-09 11:15:01.894

Dans la sous-zone $b, on trouvera l’identifiant du chantier ou du corpus auquel correspond cette zone de note. Grâce à cet identifiant précis, il est aisé d’effectuer des statistiques plus fines sur les chantiers qualité en cours, mais surtout de fournir aux catalogueurs la liste toujours à jour des notices à traiter. Pour accéder à cette liste, il suffit de se rendre à une adresse web ainsi construite :

http://www.sudoc.fr/services/chantier/ + {contenu de la $b}.

Ce qui donne, pour l’exemple précédent :

http://www.sudoc.fr/services/chantier/BRILL-RADI-LN.

A cette adresse, on récupère un fichier à ouvrir dans Excel : il s’agit d’un tableau qui liste toutes les notices à corriger, en précisant la correction à effectuer. En entête du tableau, quelques chiffres et pourcentages permettent de mesurer la progression du chantier, pour voir si on tient le bon bout… Pour des raisons de fond ou des raisons techniques, ces tableaux ne seront pas disponibles quand les 309 concerneront des chantiers qui touchent à des notices importées ou à un trop grand nombre de notices.

L’ABES propose. Le réseau dispose.

Enfin, dans certains cas, le programme a travaillé mais n’ose pas trancher. Pour reprendre l’exemple précédent, son cœur peut balancer entre deux autorités. Voire considérer que, même si une seule autorité est en lice, il serait imprudent de conclure aveuglément qu’il s’agit de la bonne. On trouvera alors en $c le(s) PPN que le programme suggère sans oser le(s) retenir. Cette liste de PPN se présente sous la forme d’une requête WinIBW :

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$cche PPN1 ou PPN2$d2014-04-09 11:15:01.894

Il s’agit d’une aide à la décision pour le catalogueur, qui, s’il le souhaite, peut se contenter d’examiner les PPN proposés, sans s’attarder sur les autres PPN qu’une recherche sur le nom pourrait renvoyer.
Qu’il suive les suggestions du programme ou non, le catalogueur crée le lien manquant puis n’oublie pas de supprimer la 309 correspondante. La notice disparaît alors du tableau des notices à traiter pour tel chantier (sauf si cette notice contient une autre 309 pour ce même chantier).

Aller plus loin

Ce nouveau dispositif se veut très pragmatique. Il s’agit d’améliorer l’efficacité collective du réseau sans compliquer la vie des catalogueurs. On pourrait imaginer d’autres dispositifs et l’ABES n’exclut pas de proposer au réseau d’autres manières d’intervenir sur les données. D’avance, merci pour vos retours, vos suggestions et … votre chasse aux 309.

NB : les chantiers en cours sont listés dans la page du guide méthodologique qui documente la zone 309 : http://documentation.abes.fr/sudoc/formats/unmb/zones/309.htm.

Y. Nicolas

Politique de signalement des licences nationales ISTEX

logo-LN-ombre

[Ce billet reprend le message envoyé aux listes de discussion  Sudoc et Sudoc PS (Périodiques), le 24/2/2014. Il a été suivi d'une série de messages faisant le point sur le signalement de chaque corpus. Si vous n'appartenez pas aux réseaux ABES, le site licencesnationales.fr est le bon endroit pour se tenir informé. Il sera bientôt mis à jour pour intégrer les services évoqués dans le billet qui suit.]

En Janvier, l’ABES a annoncé l’acquisition de plusieurs corpus de ressources numériques en licence nationale, dans le cadre du projet ISTEX :

Au-delà de la négociation de ces ressources, l’ABES est responsable de leur signalement.
Pour chaque corpus, un message spécifique sera envoyé afin de détailler les opérations de signalement qui ont été réalisées ou qui le seront sous peu. A ce jour, malheureusement, il faut noter que le signalement des périodiques Elsevier (ISTEX) n’a pas été réalisé, et ce pour la raison suivante : la liste a été fournie telle quelle par l’éditeur et n’a pas pu être élaborée et vérifiée en amont et en partenariat ABES/éditeur.

La suite de ce message expose les principes généraux et les modalités concrètes du signalement des licences nationales ISTEX.

Signaler au sens large

Aujourd’hui, le signalement doit être entendu en un sens plus large qu’avant. En effet, si le signalement dans le Sudoc demeure un objectif prioritaire, il faut également travailler à signaler ces ressources dans d’autres environnements : aujourd’hui les bases de connaissance, sur lesquelles s’appuient les outils de découverte et les résolveurs de lien ; demain le web de données (LOD – Linked Open Data).
C’est pourquoi le signalement des licences nationales ISTEX est assuré par l’ABES dans le cadre du projet de hub de métadonnées, en collaboration avec les équipes responsables du circuit Sudoc habituel. Derrière le terme de « hub de métadonnées », il faut imaginer un espace de traitement des métadonnées indépendant des autres applications de l’ABES. L’équipe du hub récupère les métadonnées auprès des éditeurs, sans exiger de format particulier. En bout de chaîne, il s’agit de redistribuer des données de qualité, normalisées, exploitables dans différents environnements, dont le Sudoc.

Pour le Sudoc et vos SIGB

Comme c’est le cas depuis des années, afin d’assurer la visibilité de ces ressources dans le catalogue collectif, l’ABES crée systématiquement un exemplaire ABES – en l’occurrence un exemplaire « ABES Licence nationale ».
Les établissements qui souhaiteront ajouter leur propre exemplaire, notamment pour faire redescendre ces notices dans leur SIGB, pourront utiliser le service d’exemplarisation automatique. Pour ce faire, l’ABES fournira au réseau la liste complète des documents appartenant à un corpus ISTEX.

Pour les bases de connaissance

Fait nouveau, l’ABES fournira également des listes conformes à la recommandation KBART, prêtes à l’emploi dans les bases de connaissance qui alimentent les outils d’accès à la documentation électronique.
Les équipes de l’ABES s’efforceront de fournir des listes KBART qui soient bibliographiquement correctes. Souvent, sur la plateforme d’un éditeur, derrière une seule revue se cachent en fait plusieurs revues qui entretiennent entre elles des relations de succession, de scission, d’absorption, etc. Les fichiers KBART de l’ABES veilleront à respecter cette granularité bibliographique. Il faudra être attentif à l’impact de cette granularité sur les résolveurs de lien, par exemple.

Pour une gestion optimale des collections imprimées

Dans le cadre d’ISTEX, l’acquisition des ressources électroniques est adossée à un engagement de l’Etat et de ses opérateurs sur le long terme : le CINES assure la conservation à long terme et l’INIST garantira l’accès sur la plateforme qu’il développe. Dès lors, la politique nationale d’achat pérenne de documentation électronique peut déboucher sur des décisions locales relatives à la gestion des collections imprimées (désherbage, déménagement, etc.).
L’ABES souhaite faciliter ces décisions locales en fournissant, pour chaque corpus de ressources électroniques acquises, la liste des ressources imprimées correspondant. Pour les périodiques, en particulier, il s’agit de lister les documents imprimés en précisant les états de collection électroniques ISTEX.
Ce nouveau service de l’ABES s’inscrit dans une démarche d’ensemble qui vise à offrir aux établissements des outils d’aide à la décision en matière de conservation de l’imprimé, dans le cadre d’un plan de conservation partagée ou non. Une communication spécifique va suivre qui donnera un aperçu de cette nouvelle offre de services en construction.

Zoom : les périodiques ISTEX et le Sudoc

Même si l’ABES récupère auprès des éditeurs des métadonnées au niveau de l’article, c’est au niveau du périodique que se fait le signalement dans le Sudoc. Ces notices de périodique ne sont pas générées à partir des métadonnées d’éditeur, car, dans le Sudoc, ce sont les notices ISSN qui font autorité.
Pourtant, au-delà du travail d’exemplarisation sous ces notices ISSN,  certaines informations bibliographiques seront ajoutées ou modifiées par l’ABES. Il s’agit de la zone 859 (URL fournie par l’éditeur) mais surtout de la zone 207. Cette zone sert à préciser le numéro et la date du premier et du dernier volume d’un périodique. Cette zone est particulièrement importante pour les périodiques électroniques. En effet, la date de publication d’un périodique électronique ne permet pas de connaître sa couverture réelle. Seule la zone 207 permet de comprendre que le volume n°1 d’une revue électronique créée en 1999 remonte en fait à 1923, du fait d’une numérisation rétrospective. Or, disposant des métadonnées au niveau des articles, l’ABES est en mesure de générer ces informations de manière systématique, fiable et standardisée. Si, dans les faits, il n’est pas toujours possible d’effectuer complètement cette opération au moment de la création de l’exemplaire ABES, elle sera finalisée dans un second temps, une fois les métadonnées livrées par l’éditeur et acceptées.
Par ailleurs, une part non négligeable des périodiques acquis dans le cadre d’ISTEX n’a jamais fait l’objet d’une numérotation ISSN. Un message spécifique portant sur cette question sera bientôt adressé aux centres régionaux du Sudoc PS.

Zoom : les ebooks ISTEX et le Sudoc

Contrairement aux périodiques, c’est à partir des métadonnées fournies par les éditeurs que des notices MARC seront générées et chargées dans le Sudoc. Là encore, un exemplaire ABES leur sera associé.
La qualité des notices produites dépendra essentiellement de la qualité initiale des métadonnées, mais également des efforts fournis par l’ABES pour normaliser, corriger et enrichir ces métadonnées (normalisation de certains types d’information, vérification des DOIs ou des URLs, liens à des référentiels comme IdRef, Viaf, RAMEAU, etc.). Or, ces traitements complémentaires peuvent prendre du temps. C’est pourquoi le signalement des ebooks pourra se faire en deux étapes. Dans un premier temps, les notices chargées dans le Sudoc ne seront qu’un reformatage des éléments d’information présents dans les données des éditeurs. Dans un second temps, ces notices seront modifiées pour intégrer les corrections et enrichissements effectués par l’ABES, dans le cadre du hub de métadonnées. Entre temps, il sera demandé au réseau de ne pas modifier ces notices.
Une fois ces corrections et enrichissements effectués, c’est le réseau des catalogueurs qui reprendra la main. Dans la mesure du possible, l’ABES s’efforcera de guider les efforts des catalogueurs soucieux d’améliorer la qualité de ces nouvelles notices, en indiquant le plus précisément possible celles qui méritent des interventions particulières et les zones sur lesquelles ces interventions devraient porter en priorité.

Pour toute question, merci d’utiliser le guichet d’assistance : https://stp.abes.fr/assistance/domaines/3

Y. Nicolas