Webservice AlgoLiens : remédier à l’absence de liens dans les données du Sudoc

imagealogoliens
Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

L’Abes vient de mettre en production un nouveau web service, baptisé AlgoLiens. Ce dernier détecte les notices du Sudoc dans lesquelles une zone de liens aux autorités n’est pas liée. En mettant à la disposition de leurs créateurs les notices présentant une telle anomalie afin de les amener à la corriger, l’objectif est d’atteindre à un signalement documentaire total.

A l’origine d’AlgoLiens, nouvel outil à la disposition des catalogueurs du réseau Sudoc, se trouve une question que, plus d’une fois, nous nous sommes collectivement posée : comment améliorer les données du Sudoc ? Cette question à peine énoncée, le doute s’instille. Finalement, est-ce tout simplement possible ? Écrasante, la recherche de la réponse est repoussée à un horizon de pieuse espérance habité par de dociles machines… Pourtant, insistons car le jeu en vaut la chandelle et répond à quatre enjeux majeurs :

Continuer la lecture

CERCLES : retour d’expérience du SCD de l’Université de Picardie Jules Verne sur le corpus CAIRN

Les origines

Les questions sur SUCAT

cercles_upjv

Nouvelle adjointe à la gestion de la bibliothèque numérique dans mon établissement, et chargée du signalement des e-books, je me suis posé beaucoup de questions quant au traitement de ces ressources. J’ai étudié de près les avantages et inconvénients de l’exemplarisation automatique, notamment en terme de qualité et de complétude des notices, et lancé une question ouverte aux catalogueurs de ressources en ligne sur SUCAT (ndlr : la liste de diffusion des catalogueurs du réseau Sudoc), posant les questions qui me taraudaient, intitulée : « Aux catalogueurs des bibliothèques numériques ».

Les réponses ont afflué, l’ABES a également répondu que cela figurait parmi ses préoccupations actuelles.

Continuer la lecture

Récit d’une immersion. Traiter les ebooks Dalloz avec les données Sudoc, les données de l’éditeur et les outils du hub

Ce billet relate à la première personne l’immersion effectuée par Catherine Storne (Université de Strasbourg) au sein de l’équipe hub de l’ABES, entre le 1er et le 5 février 2016. Catherine a eu l’occasion de partager cette expérience aux dernières journées ABES. Merci pour tout, Catherine !

Placée en face de la nouvelle « Metadaten Weltanschauung » au travers de la réflexion locale sur l’abonnement à un outil de découverte (discovery tool) ou sur les réalisations de la plateforme ISTEX sur les licences nationales, je ressentais le besoin de monter en compétences sur la manipulation des métadonnées. J’ai donc souhaité faire une immersion à l’ABES pour mieux comprendre les projets de l’établissement tournant autour des métadonnées dont les noms parvenaient aux confins de nos bibliothèques : BACON, hub de métadonnées, CERCLES, ainsi que les liens entre eux. Mon objectif étant de travailler au rapprochement, au sein du SCD de Strasbourg, des équipes de la documentation électronique et du catalogage, la participation à un projet concret, au travers d’un chantier CERCLES me semblait de nature à y contribuer.

Continuer la lecture

Mettre nos données en réseau – un démonstrateur. [1] Introduction.

Ce démonstrateur est un plaidoyer en faveur d’une approche “web sémantique” de l’interopérabilité des données de l’IST. Mais, cette fois, il s’agit de montrer et non d’argumenter. Il s’agit de défendre, en illustrant cette approche par des études de cas. Alors, si vous fuyez les plaidoyers, si vous exigez du concret, de la donnée (RDF), de la requête (SPARQL), passez cette introduction et lisez l’un des billets suivants :

  1. Introduction (ce billet)
  2. Inventaire des données
  3. Suivez le guide ! Le modèle de données
  4. Études de cas

SPARQL endpoint : https://lod.abes.fr/sparql
Interface de recherche full text et de navigation : https://lod.abes.fr/fct

Continuer la lecture

Mettre nos données en réseau – un démonstrateur. [2] Inventaire des données.

[ Lire le billet qui introduit cette série « Mettre nos données en réseau – un démonstrateur » ]

Pour les besoins de la démonstration, nous avons agrégé des données diverses et variées, mais finalement cette auberge espagnole n’est pas si anarchique : tout mène à tout, et on peut regrouper les jeux de données de différentes manières :

  • Données descriptives vs Référentiels
  • Données produites par les réseaux ABES vs Données de tiers
  • Données du monde des bibliothèques vs Données d’autres mondes (science, administration, etc.)
  • Données récupérées en RDF vs Données produites en RDF

Mais dans ABES, il y a B : notre réseau de données se déploie autour des données bibliographiques, qui décrivent des livres, des revues, mais également des chapitres et des articles.

Continuer la lecture

CERCLES : 4 NOUVEAUX CORPUS

CERCLES_Hula_hoop_Jerry_via_Flick_CC_BY_SA_2_0

Le dispositif CERCLES s’agrandit : 4 nouveaux corpus vont être pris en charge par 4  établissements (2 nouveaux établissements, et 2 établissements déjà référents sur un précédent corpus).

Corpus « American Mathematical Society », Bibliothèque Universitaire Pierre et Marie Curie

  • Corpus : e-books AMS, dont les séries « Memoirs of the AMS » – 2500 titres
  • Période de travail : mai 2016 – décembre 2017
  • Responsable du chantier : Yves Momboisse
  • Axes d’enrichissement : vérification des ISBN, création et complétude des liens 4XX, 6XX et 7XX, création et numérotation ISSN des collections électroniques
  • Le «+» du chantier  :
    • engagement sur la fusion de notices en cas de doublon
    • bonne connaissance du dispositif par le responsable de chantier
    • chantier initié par les bibliothèques MIR qui ont lancé un appel à collaboration auprès des établissements du réseau national des bibliothèques de mathématiques (RNBM) dont elles font partie
    • fort engagement de cet établissement dans le dispositif : la BUPMC prend déjà en charge le corpus ENI (avec la BIU Montpellier) et s’apprête à lancer un 3ième chantier, sur un autre corpus de mathématiques.
Continuer la lecture

CERCLES : tous concernés !

 Mon établissement n’est pas dans CERCLES. En quoi suis-je alors concerné par ce dispositif ?

Le dispositif CERCLES est le premier dispositif formalisé d’enrichissement collaboratif au sein du réseau Sudoc. Les établissements volontaires prennent en charge un corpus, et concentrent leur activité d’enrichissement des notices sur ce seul corpus. Au niveau du réseau, la charge de travail est mieux répartie, et les corpus qui bénéficient d’un travail d’enrichissement programmé sont mieux identifiés.

Le résultat sert la communauté. Tout membre du réseau Sudoc est donc concerné par CERCLES, que son établissement soit actif dans le dispositif ou pas.

Continuer la lecture

CERCLES : Retour d’expérience de La Sorbonne & l’École Française d’Athènes

[ndlr : ce post concerne un chantier précis : De Gruyter Classical Studies 2011-2014. Depuis, un autre chantier a été engagé, et terminé : De Gruyter Classical Studies 2015-2016. Le récit de ce dernier chantier est disponible ici.]

L’engagement BIS / EFA

CERCLESLa Bibliothèque Interuniversitaire Sorbonne (BIS) et l’École Française d’Athènes (EFA), rejoignent le dispositif CERCLES en juillet 2015 et s’engagent à corriger les notices des bouquets 2011 à 2014 des Classical Studies publiés par De Gruyter. Ces e-books ont été acquis par le CADIST Antiquité pour les usagers des deux établissements.

Délimitation du périmètre d’action :

  • Corpus De Gruyter, Classical studies : 288 notices à traiter
  • Bouquets 2011, 2012, 2013 et 2014
  • Répartition par établissements :
    •      EFA : bouquet 2014
    •      BIS : bouquets 2011, 2012, 2013
  • Calendrier prévisionnel établi d’après une estimation du temps de travail par notice : 40 minutes en moyenne
  • Début du chantier : août 2015
  • Fin du chantier : fin novembre 2015
Continuer la lecture

CERCLES : retour d’expérience de la FMSH

Un premier chantier terminé
Un premier chantier terminé

Pour un signalement collectif des ebooks

À la bibliothèque de la Fondation Maison des sciences de l’homme, l’accroissement de l’achat d’ebooks à titre pérenne en bouquets, et la volonté de valoriser ces achats par un signalement titre à titre qui soit à la fois de qualité et partagé dans le catalogue collectif du Sudoc, nous a amené à rejoindre en mars 2015 l’expérimentation CERCLES lancée par l’ABES.

Une question sur SUCAT…

Dès novembre 2014, sur la liste SUCAT, en réponse à une question au sujet de la complétude des notices de ressources électroniques, nous avions en effet pointé le risque pour le réseau des bibliothèques universitaires et de recherche, de voir le Sudoc rater le tournant numérique pour les ouvrages, si les bibliothèques qui y participent n’y signalaient pas leurs bouquets d’ebooks, et souligné l’utilité du catalogue collectif national pour toute politique documentaire cohérente quel que soit son niveau (local, COMUE, national, …). Nous ne pouvions que soutenir la volonté de l’ABES d’associer les forces du réseau à sa propre action en promouvant  le partage du travail au sein du réseau.

Continuer la lecture

CERCLES : 4 nouveaux corpus

by_Horla_Varlan__CC_BY_2_0_via Flick'r
by_Horla_Varlan__CC_BY_2_0_via Flick’r

Ceux d’entres vous qui ont assisté à la séquence « Actualités de l’ABES », lors des Journées ABES 2015, se rappellent qu’il a beaucoup été question de qualité des données et de mutualisation du travail.

Le dispositif CERCLES a fait l’objet d’un premier bilan (pour revoir la séquence, c’est ICI – à partir de 21mn20s).

Il est possible que ce bilan ait convaincu de nouveaux établissements, ou ait simplement conforté ceux qui s’étaient déjà inscrits sur une « liste d’attente ». Quel que soit l’élément déclencheur, nous pouvons annoncer aujourd’hui l’entrée de 4 nouveaux établissements dans le dispositif, et de 4 nouveaux corpus.

Continuer la lecture