Un serveur SPARQL pour le Sudoc

Depuis juillet 2011, l’ensemble des données Sudoc est accessible en RDF. Si on connaît son identifiant, chacune des dix millions de notices du Sudoc peut être affichée en RDF/XML. Mais encore faut-il connaître cet identifiant… Ce dispositif est utile pour permettre à un programme de naviguer de notice en notice, y compris en rebondissant sur les données RDF d’IdRef par exemple, mais cela ne permet pas d’explorer systématiquement le Sudoc ni d’effectuer une recherche.

Continuer la lectureUn serveur SPARQL pour le Sudoc

IdRef dans VIAF et après … #3 Des données et des liens sous licence ouverte

  • Auteur/autrice de la publication :
  • Post category:IdRefSudoc

Ce post de fil.abes.fr annonce l’intégration du référentiel IdRef à VIAF et en présente les enjeux stratégiques. Punktokomo prend le relais pour détailler quelques implications pratiques. En voici la troisième.


Comme en témoigne cette courte biographie, VIAF est né comme un projet de recherche porté par OCLC et les bibliothèques nationales allemande, américaine et française. En 2012, VIAF est devenu un service OCLC. C’est un changement important, notamment du point de vue de la gouvernance.

Continuer la lectureIdRef dans VIAF et après … #3 Des données et des liens sous licence ouverte

IdRef dans VIAF et après … #2 Faciliter et améliorer le catalogage par dérivation

Ce post de fil.abes.fr annonce l’intégration du référentiel IdRef à VIAF et en présente les enjeux stratégiques. Punktokomo prend le relais pour détailler quelques implications pratiques. En voici la deuxième.

Grâce à MARC et Z39.50, le catalogage est d’ores et déjà une pratique professionnelle locale qui fonctionne dans un cadre global. L’idéal visé est le suivant : pour chaque livre, sa notice bibliographique est créée une fois, par quelqu’un, quelque part, puis échangée, reprise, exemplarisée autant de fois que nécessaire, partout, par tous.

Dans le cadre du Sudoc, plutôt que de créer ex nihilo une notice qui manque, le catalogueur interroge d’autres catalogues à la recherche de cette notice. S’il la trouve, il la récupère dans l’outil de catalogage du Sudoc et l’intègre telle quelle, … à beaucoup de détails près… C’est ce qu’on appelle du catalogage par dérivation. En voici un tutoriel, propre au contexte du Sudoc :

Continuer la lectureIdRef dans VIAF et après … #2 Faciliter et améliorer le catalogage par dérivation

IdRef dans VIAF et après … #1 Passer d’un identifiant à l’autre (VIAF, IdRef, LC, BnF, Wikipedia, …)

Ce post de fil.abes.fr annonce l’intégration du référentiel IdRef à VIAF et en présente les enjeux stratégiques. Punktokomo prend le relais pour détailler quelques implications pratiques. En voici la première.

Tout l’intérêt de VIAF repose dans son travail d’interconnexion entre des notices d’autorité d’origines différentes. En effet, les algorithmes de VIAF cherchent à identifier toutes les notices d’autorité qui « parlent’ de la même chose, qu’il s’agisse d’une personne, d’une collectivité ou d’une oeuvre. Ils génèrent alors des grappes (clusters) d’autorités. Ces grappes VIAF possèdent elles-même un identifiant unique, en bijection avec chacun des identifiants des autorités membres de la grappe.

Continuer la lectureIdRef dans VIAF et après … #1 Passer d’un identifiant à l’autre (VIAF, IdRef, LC, BnF, Wikipedia, …)

Rapport du groupe technique sur le Système de Gestion de Bibliothèque mutualisé

  • Auteur/autrice de la publication :
  • Post category:Non classé

Le contexte

Depuis le début de l’année 2011, l’Abes a mené une réflexion sur un projet de SIGB  mutualisé. Aux premières réflexions conduites en interne a succédé, le 16 mai dernier, un atelier ouvert aux établissements de nos réseaux qui a permis de préciser les scénarios envisageables (degrés d’implication de l’Abes dans la mutualisation, système hébergé dans les nuages…).

Le groupe technique

Parallèlement à la réflexion menée par l’Abes, plusieurs établissements préparant une réinformatisation à moyen terme ont mis en place un groupe technique avec pour objectif premier de rédiger un cahier des charges de système de gestion de nouvelle génération dont l’acquisition serait mutualisée.

Ce groupe a été piloté par Nicolas Morin du PRES de Toulouse. L’Abes y était représentée.

Rapport final de Nicolas Morin au nom du PRES de Toulouse

Relevé de conclusions du groupe technique

Continuer la lectureRapport du groupe technique sur le Système de Gestion de Bibliothèque mutualisé

Rapport du groupe projet ENSSIB sur le Système de Gestion de Bibliothèque mutualisé

  • Auteur/autrice de la publication :
  • Post category:Non classé

Le groupe projet a travaillé d’août 2011 a janvier 2012.

Le Projet :

Quelle articulation entre le projet de SGB (système de gestion de bibliothèque) nouvelle génération et la mission de signalement des ressources documentaires portée par l’ABES ?

Origine du projet

Plusieurs bibliothèques universitaires envisagent de changer à court ou moyen terme leurs systèmes locaux, et s’organisent pour préparer la commande de façon mutualisée (rédaction commune du cahier des charges, choix d’un même système). Des solutions de nouvelle génération arrivent sur le marché, et le concept de solution « dans les nuages » (cloud computing) ouvre de nouvelles perspectives.

Ce projet est lancé dans le contexte du projet d’établissement 2012-2015 de l’ABES. Il est considéré comme une priorité par le conseil scientifique et le conseil d’administration de l’ABES, à mettre en œuvre rapidement car plusieurs établissements ont fait part de leur intention de changer rapidement de système.

Lire le rapport final du groupe projet

Continuer la lectureRapport du groupe projet ENSSIB sur le Système de Gestion de Bibliothèque mutualisé

Le cercle vertueux de theses.fr : mise en relation de l’utilisateur et du producteur de données

  • Auteur/autrice de la publication :
  • Post category:theses.fr
L. Par J.G. Park. CC BY-NC 2.0. Source : Flickr

Depuis début avril, le bouton « signaler un problème » de theses.fr présent sur les pages de thèses en préparation et de thèses soutenues permet à un utilisateur lambda d’entrer en contact avec l’établissement de soutenance responsable des données. Le Fil ABES expose le contexte de la mise en place du feedback dans theses.fr.

Continuer la lectureLe cercle vertueux de theses.fr : mise en relation de l’utilisateur et du producteur de données

Sudoc, IdRef : de nouveaux Micro Web Services

De nouveaux Micro Web Services Sudoc et IdRef ont été développés :

  • merged : à partir d’un PPN de notice Sudoc ou IdRef fusionnée, trouver le PPN actif (notice valide)
  • multiwhere : localiser (RCR de localisation) un ou plusieurs document(s) à partir de leur identifiant Sudoc (PPN)

A noter : un service where a été précédemment développé pour permettre la localisation d’un seul document à partir de son identifiant (PPN). Il est dorénavant conseillé d’utiliser le multiwhere qui est plus riche que le where : non seulement il permet de traiter plusieurs notices à la fois, mais il contient également les coordonnées géographiques de chaque bibliothèque.

  • frbn2ppn, ocn2ppn, etc. : connaitre l’identifiant Sudoc à partir d’un identifiant externe (BnF, WorldCat, etc.)
  • iln2rcr : connaître la liste des RCR rattachés à un ILN

Pour  retrouver l’ensemble de la documentation technique :

Continuer la lectureSudoc, IdRef : de nouveaux Micro Web Services

Concours pour les prochaines Journées ABES

  • Auteur/autrice de la publication :
  • Post category:Non classé

« Utilisation innovante des données, outils ou services proposés par l’ABES » : tel est le thème du concours lancé par l’ABES en vue des prochaines Journées ABES, qui auront lieu les 19 et 20 juin 2012 à Montpellier. Ce concours est  destiné à valoriser les initiatives des établissements utilisant de façon spécifique les produits ou services proposés par l’ABES. A titre d’exemple, il pourra s’agir tout autant:

  • de solutions informatiques (utilisation de web services, applications ou modules..)
  • de solutions concernant la qualité des données,
  • de coordination des équipes concernées par les service de l’ABES,
  • de module de formation proposé aux utilisateurs (objets pédagogiques, vidéos, objets de communication…),
Continuer la lectureConcours pour les prochaines Journées ABES

SudocAD : résumé du projet

Voici le résumé du rapport final (+ annexes) du projet SudocAD, mené par l’ABES et le LIRMM en 2010-2011 et co-financé par le TGE ADONIS :

Mené par l’ABES et l’équipe de recherche GraphIK du LIRMM, co-financé par le TGE ADONIS dans le cadre de son appel à projets 2009-2010, le projet SudocAD vise à interconnecter entre eux différents corpus de métadonnées agrégés par la plateforme de recherche ISIDORE, en les reliant au référentiel IdRef. Ce qui est en jeu, ce n’est pas seulement l’efficacité de la recherche dans Isidore, mais l’intégration des données SHS françaises au web de données, auquel IdRef est déjà connecté.

L’objectif opérationnel du projet était d’enrichir automatiquement des notices d’articles du portail Persée, en identifiant (quand elle existe) l’autorité IdRef correspondant à chacun des auteurs de l’article. 13 444 notices ont ainsi été traitées et livrées à ADONIS et à l’équipe Persée.

Pour identifier la notice d’autorité IdRef qui correspond à l’auteur Persée, SudocAD ne se contente pas d’utiliser les informations contenues dans la notice d’autorité mais exploite les connaissances enfouies dans les notices bibliographiques Sudoc liées. Toutes ces connaissances sont exprimées en RDF, selon le vocabulaire FRBROO. Il devient possible alors de raisonner à propos de ces connaissances, grâce aux outils sémantiques conçus et développés par GraphIk.

Les principales étapes du traitement opéré par SudocAD sont les suivantes : le nom et le prénom de l’auteur Persée sont utilisés pour sélectionner une liste parfois longue d’autorités IdRef candidates ; le raisonneur du LIRMM charge un ensemble de données RDF composées de la notice Persée, des autorités candidates et des notices bibliographiques Sudoc liées à ces autorités ; enfin, après avoir analysé ces données au moyen de règles logiques, le raisonneur répartit les autorités candidates en sept catégories de liage, de Strong à Impossible.

SudocAD ne donne donc pas directement un verdict sur la bonne autorité à lier. Mais, à partir du rapport d’analyse en XML et des sept catégories, il est facile de définir un algorithme qui détermine automatiquement l’autorité à lier. Mais il existe plusieurs manières de construire un tel algorithme. Ce rapport distingue les algorithmes de liage automatique qui paraissent les plus pertinents.

A côté du liage automatique, le rapport d’analyse généré par SudocAD peut également être utilisé dans une perspective d’aide à la décision. Il s’agirait d’utiliser ce rapport pour présenter les autorités candidates d’une manière qui facilite et fiabilise le travail manuel du catalogueur qui cherche à lier une notice bibliographique à une autorité.

Afin d’évaluer l’approche de SudocAD, un protocole a été établi pour comparer les résultats d’un traitement automatique aux décisions de liage prises par un catalogueur. Sur un échantillon de 150 notices Persée, elle montre que SudocAD atteint un très bon taux de bonnes décisions (liage ou non liage), autour de 80%, et surtout un taux d’erreur (création de liens erronés) inférieur à  2%.

Au-delà du projet SudocAD, l’ABES et l’équipe GraphIK ont la volonté d’éprouver la validité de cette approche sur d’autres corpus de métadonnées et d’améliorer encore son efficacité en corrigeant les défauts actuels et surtout en élargissant le spectre des informations prises en compte, notamment en exploitant de manière sémantique les co-auteurs et le vocabulaire Rameau.

Continuer la lectureSudocAD : résumé du projet
Aller au contenu principal