CERCLES : bilan du chantier AMS

Le chantier CERCLE « AMS – American Mathematical Society »

Description du corpus

Crédit image : David Stewart

Plusieurs bibliothèques membres du RNBM acquérant des collections d’ebooks publiées par l’American Mathematical Society (AMS), trois d’entre elles ont choisi de participer à un chantier commun CERCLES AMS. Ce travail de correction et d’enrichissement de notices concernait un total de 2760 notices d’ebooks, et presque autant de monographies imprimées.

Le chantier a été circonscrit aux 13 collections disponibles en ebooks au moment de l’ouverture du chantier (l’éditeur a publié depuis de nouvelles collections)

  1. Mathematical Surveys and Monographs (1943 – 2015) : ​SURV​ 215 notices
  2. Graduate Studies in Mathematics (1993-2013) : ​GSM​ 127 notices
  3. Student Mathematical Library (1999-2015) : ​STML​ 73 notices
  4. University Lecture Series (1989-2015) : ​ULECT​ 63 notices
  5. Memoirs of the AMS (1950-2015) : ​MEMO​ 1141 notices
  6. Proceedings of Symposia in pure Mathematics (1959-2015) : ​PSPUM ​117 notices
  7. Proceedings of Symposia in Applied Mathematics (1949-2014) : ​PSAPM​ 73 notices
  8. Contemporary Mathematics (1980-2015) : ​CONM​ 665 notices
  9. CBMS Regional Conference Series in Mathematics (1970-2015) : ​CBMS​ 129 notices
  10. Colloquium Publications (vol.1(1905)-vol.62(2016)) : COLL 63 notices
  11. AMS non-series monographs (2007-2015) :​ MBK​ 53 notices
  12. CBMS Issues in Mathematics Education (1990-2012) : ​CBMATH ​18 notices
  13. Mathematical World (1991-2013) : ​MAWRLD​ 23 notices

Il a également été nécessaire de définir un état de collection précis, notamment pour les collections vivantes ayant un accroissement annuel. L’année 2015 a dans la plupart des cas été choisie comme année de clôture : il s’agissait en effet de la dernière année complète au moment du démarrage du chantier et de l’import des notices de l’éditeur.

Description du chantier

Les 3 établissements ayant participé au projet

Continuer la lecture

Nouveau workflow d’import automatisé dans le Sudoc : première évaluation


Licence : Paternité. Pas de modification. Certains droits réservés par mbtphoto (away a lot). Source Flickr

Ce billet s’inscrit dans la continuité de l’article Vers un nouveau workflow d’imports de données dans le Sudoc : les notices des ouvrages publiés par Oxford University Press.

Suite aux retours des d’établissements ayant répondu à l’appel lancé le 4 février dernier via la liste Corcat  “Votre avis sur la qualité des notices Oxford University Press – import courant”, l’Abes a pu dresser un premier bilan et adapter ce workflow.

Continuer la lecture

Un nouveau web service pour les Plans de Conservation Partagée des périodiques


Un nouveau webservice PCP2RCR développé par les équipes de l’Abes est à la disposition des utilisateurs pour obtenir la liste – et la géolocalisation – des bibliothèques (RCR) participant à un Plan de Conservation Partagée (PCP) de Périodiques.

Pour fonctionner, ce webservice utilise la présence, dans les données d’exemplaires, de la sous-zone 930$z [code PCP], ce qui permet de faire remonter les bibliothèques concernées par un PCP ainsi que les informations les concernant : n° ILN, n° RCR, identifiant IdRef de la notice RCR, Nom de l’établissement, Intitulé court de l’établissement, Adresse, Téléphone, Email, Site web, Type de bibliothèque, Latitude, Longitude.

De plus, ce webservice facilite la détection d’erreurs manifestes, comme par exemple les données de latitude/longitude ou la présence d’un code PCP erroné dans un exemplaire.

Continuer la lecture

CERCLES : le premier chantier dédié aux autorités


En 2015, naissait le dispositif CERCLES (voir le billet) mis en place par l’Abes pour accompagner, aider et valoriser un établissement souhaitant s’investir sur l’enrichissement des données d’un corpus de documents spécifique. Initiée avec 4 établissements, l’expérimentation fut concluante : très vite, d’autres établissements ont rejoint le dispositif puisque 3 ans après, on dénombre 17 chantiers CERCLES d’enrichissements de données bibliographiques.

Dès sa mise en place, l’Abes annonçait son intention d’étendre le dispositif d’accompagnement à d’autres types de données afin de créer un cercle vertueux. Le dispositif a en effet été pensé afin de s’adapter à tous les corpus, puisqu’il s’agit :

    • pour l’établissement : d’enrichir des données
  • pour l’Abes : de conseiller, de faciliter par des traitements automatiques et de rendre compte

Continuer la lecture

Vers un nouveau workflow d’imports de données dans le Sudoc : les notices des ouvrages publiés par Oxford University Press


[English abstract at the bottom of this blog’s post]D’un point de vue technique, charger des corpus de livres dans le Sudoc n’est pas très difficile. Depuis plusieurs années, les équipes de l’Abes importent régulièrement des ensembles de notices MARC en provenance de différents éditeurs (Springer, CAIRN …) et, globalement, ces notices sont bien utilisées par les bibliothèques du réseau.

Pourquoi un nouveau workflow d’imports de données dans le Sudoc ?

Pour autant, on a pu constater que ce système comporte des limites : en amont, il n’est pas toujours évident de récupérer auprès des éditeurs des notices MARC – si possible de bonne qualité, cette démarche exigeant généralement de nombreux aller-retours. En aval, ce type d’opérations de chargement dans le Sudoc requiert des interventions et compétences spécifiques, relativement rares à l’Abes. Autant d’éléments qui rendent les processus actuels difficilement scalables et difficile aussi l’atteinte de l’objectif de signalement total. Aussi, il s’est avéré indispensable de réfléchir  à la conception de nouveaux  workflows,  afin de réaliser automatiquement les opérations d’ingestion,  transformation, enrichissements et chargement dans le Sudoc.

Continuer la lecture

Signaler les thèses déposées sur TEL dans le Sudoc et theses.fr


35 000 thèses TEL proviennent de Star : et les autres ?

logo_telActuellement, 75 000 documents  estampillés « thèses » sont déposés sur TEL. Or, si 35 000 documents  – qui proviennent de l’application Star – sont bien estampillés « version validée par le Jury », 40 000  d’entre eux ne sont signalés ni dans le Sudoc ni sur theses.fr, alors même que le lien vers le texte intégral de la thèse peut avoir un intérêt pour les lecteurs. Suite à ce constat, plusieurs établissements, soucieux d’offrir une visibilité plus importante à ces travaux de recherche, ont sollicité l’Abes en vue de leur signalement automatique. Deux options s’offraient :

  • importer les notices de TEL en s’appuyant sur leurs métadonnées (XML TEI) pour les transformer en Unimarc.
  • décrire ces documents via les notices des thèses originelles déjà présentes dans le Sudoc.

Continuer la lecture

La géolocalisation des autorités géographiques dans le Sudoc – partie 2


Cette série de billets écrite par Elena Avellino présente le travail de géolocalisation de notices d’autorité géographiques dans le Sudoc, réalisé par l’École française de Rome.

  1. Finalités, modalités et applications
  2. Mode d’emploi de la géolocalisation (ce billet)

Ce billet expose les modalités de géolocalisation et la transcription de ces données dans l’outil de production du Sudoc, WinIBW.

Continuer la lecture

Synthèse de l’enquête « Évaluation du dispositif CERCLES »


Cercles pencils by art sourse

Le dispositif CERCLES (Corrections et Enrichissements par le Réseau de Corpus de l’Enseignement Supérieur) a été lancé en 2015.
Depuis, 17 chantiers ont été lancés, dont 9 encore en cours.

Avec le double objectif d’évaluer les modalités de fonctionnement actuelles et de réfléchir à l’évolution du dispositif, une enquête a été menée, en février 2018, auprès des 18 responsables de chantiers CERCLES.

Voici un résumé de leurs opinions sur le dispositif.

Continuer la lecture

Chantier Qualité des données de thèses : bilan 2017


En février 2017, l’Abes annonçait via les listes de diffusion des réseaux Sudoc et Thèses que les établissements intéressés pouvaient demander des  traitements automatiques sur les notices de thèses du Sudoc. Ce billet fait le point sur les modifications réalisées entre février et novembre,  ce à l’initiative soit des établissements, soit de l’Abes.

Rappel

thesestheses.fr, moteur de recherche des thèses de doctorat, a pour objet d’afficher les thèses soutenues en France depuis 1985 ainsi que les thèses en préparation ( depuis 10 ans au maximum). Il s’agit donc de données en provenance des applications nationales STEP et STAR et du Sudoc.

Continuer la lecture