IdRef : ORI-OAI, première application externe cliente

La plate-forme ORI-OAI, conçue pour gérer la production numérique institutionnelle d’établissements de l’Enseignement supérieur et de la recherche, propose une nouvelle version du module ORI-OAI-md-editor (version 1.8.3). L’une des nouvelles fonctionnalités de l’outil permet, tout en restant connecté à ORI-OAI, de rechercher, trouver ou créer dans IdRef les autorités Personnes, Collectivités, etc. nécessaires à la description catalographique des thèses.

Pour récupérer cette nouvelle version, il suffit de faire un checkout du module ORI-OAI-md-editor depuis la version 2.0 du projet ORI-OAI.

Principes et fonctionnements

Le principe est similaire à celui utilisé dans l’interfaçage de STAR à IdRef : si un n°PPN est requis dans un champ du formulaire de thèse, l’icône « Lier à l’autorité Sudoc »  est proposée. Ce lien ouvre l’application IdRef dans une iframe (fenêtre intégrée à la page de travail). Le cartouche de recherche est préparé pour que l’opérateur lance la recherche.

Si la recherche est fructueuse, il suffira de cliquer sur le bouton « Lier la notice » en bas de la notice. Alors l’iframe se ferme. Le formulaire de thèse revient en avant-plan et les données utiles sont maintenant présentes dans les champs à remplir.

Dans le cas où l’autorité recherchée n’existe pas encore dans le référentiel, il convient de la créer. Cela se fait avec beaucoup de facilité puisque les données présentes dans la fiche de thèse et intéressant l’autorité sont pré-remplies automatiquement : PPN, date de naissance, nom, prénom, etc. A l’inverse, si les données sont saisies durant la création de l’autorité, elles seront poussées dans les champs correspondants du formulaire TEF d’ORI-OAI lors du liage.

Comprendre le workflow 

ori01

ori-02

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ori-03

ori-04

ori-05

ori-07

Qui est concerné ?

Cette fonctionnalité est déjà en production à Valenciennes. Tous les établissements qui référencent leurs thèses depuis ORI-OAI peuvent utiliser ce service, comme par exemple, l’Université de Lorraine, l’Université Lille 1 Sciences et Technologies, l’Université de Rennes 1, l’Université Paris 2 Panthéon-Assas…

Jacques Brassart, coordinateur fonctionnel du projet ORI-OAI,

Yohan Colmant, coordinateur technique du projet ORI-OAI

Publicités

Comment « CERCLES » se met en place

by_Horla_Varlan__CC_BY_2_0_via Flick'r

by_Horla_Varlan__CC_BY_2_0_via Flick’r

Il y a un mois, ce billet dévoilait les grands principes de l’expérimentation CERCLES (Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur). Les 4 établissements pilotes se sont mis en ordre de bataille, et l’ABES les accompagne : l’accord de participation (qui valide les engagements de chaque partie) est signé, les référents « ABES » pour chaque établissement et chaque corpus sont désignés, les premiers contacts ont été pris, et le chantier est parfois bien avancé. Voici des nouvelles des 4 premiers « cercles » :

SCD de l’université Paris Est Créteil

  • Corpus : périodiques Oxford University Press – 250 notices
  • Période de travail : janvier 2015 – mars 2015
  • Responsables du chantier : Ewa Nieszkowska, Hélène Pipet
  • Référent ABES : Ilhem Addoun Poliakow
  • Points forts du chantier : création ou amélioration des liens 4XX , 6XX, 7XX ; émission des demandes de numérotation ISSN
  • Méthodologie :
    • phase 1 : les liens 4XX.  À 20 liens par heure, 408 liens ont été établis, sur 20,5 heures de travail (3 jours ETP)
    • phase 2 (en cours)  : les liens 6XX et 7XX. Ce sont les liens aux autorités collectivités (et les créations afférentes) qui se révèlent les plus complexes (5 Tb créées à l’heure, en moyenne).
    • phase 3 (à venir) : numérotation ISSN, et déjà un questionnement sur la possibilité de fusions de notices pré-existantes lors des chargements de notices ISSN.
  • Les « + » du chantier :
    • création d’un journal de bord, partagé avec l’ABES, pour consigner au jour le jour son travail, ses questions à poser à l’ABES, ses galères, ses joies
    • collaboration avec d’autres établissements : le CR 26, pour les demandes de numérotation ; des SCD du réseau, lorsqu’au hasard d’une notice, on propose une délocalisation
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • export de notices à la demande du SCD
    • liaison avec des SCD concernés par des délocalisations
    • expertise, conseil et dépannage

Bibliothèque Diderot de Lyon

  • Corpus : e-books Classiques Garnier – notices des imports mensuels
  • Période de travail : 6 mois après le premier import
  • Responsables du chantier : Marion Ringot
  • Référent ABES : Dominique Esmenjaud
  • Points forts du chantier : création ou amélioration des liens 452 , 6XX, 7XX
  • Méthodologie :
    • réunion de cadrage avec l’ABES : accord sur les collections à inclure dans le périmètre
    • la BDL enrichit les notices du fichier d’import mensuel
  • Les « + » du chantier :
    • collaboration ABES / Garnier pour mettre en place les imports mensuels
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • mise en place d’une procédure d’import mensuel des mises à jour
    • expertise, conseil et dépannage

SCD de l’université Jules-Verne Picardie

  • Corpus : e-books Cairn- 4864 notices
  • Période de travail : avril 2015 – avril 2016
  • Responsables du chantier : Aurélie Bec
  • Référent ABES : Kattialyn Gossiaux
  • Points forts du chantier : création ou amélioration des liens 7XX : création des notices d’autorités si nécessaire
  • Les « + » du chantier :
    • collaboration avec le SID2 de Grenoble, pour la création de notices Od associées à certains titres du corpus et avec le CR 69, pour les demandes de numérotation
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • mise en relation avec le SCD « partenaire »
    • expertise, conseil et dépannage

SCD de l’université François-Rabelais Tours

  • Corpus : e-books Open Edition- 1621 notices
  • Période de travail : février 2015- à préciser
  • Responsables du chantier : Véronique Lacan
  • Référent ABES : Olivier Rousseaux
  • Points forts du chantier : création ou amélioration des liens 4XX , 6XX, 7XX ; création des autorités auteurs
  • Méthodologie :
    • phase 1 : analyse des corrections et propositions d’actions à valider par l’ABES
    • phase 2 : définition des priorités en concertation avec l’ABES
  • Les « + » du chantier :
    • analyse raisonnée et préalable
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • expertise, conseil et dépannage

Trop tôt pour le bilan, mais déjà des pistes …

À chaque établissement sa méthode, son rythme et son calendrier ! Conduire le chantier seul ou à deux, définir un plan d’action préalable ou avancer en faisant, il n’y a pas de règles définies. L’heure des bilans viendra, il s’agit pour l’instant de ne pas freiner cet élan positif. Ce qui commence à se dessiner, c’est le rôle de l’ABES : plutôt que de valider, il consiste à faciliter (export de notices à la demande, mise en relation avec d’autres établissements, résolution de problèmes sur une notice) et à accompagner (compte-rendu au réseau, mise à disposition d’outils). Il sera à consolider à la lumière des premiers retours effectués par les établissements CERCLES eux-mêmes.  Mais l’ABES commence à anticiper sur ce qui suivra cette phase d’expérimentation, et sur la façon d’élargir « CERCLES » aux autres réseaux. Aux établissements du réseau Thèses, par exemple, il est actuellement proposé d’enrichir les notices de thèses du Sudoc pour améliorer leur visibilité dans theses.fr (plus d’infos ICI).

Que peuvent faire les autres établissements Sudoc intéressés, pendant cette expérimentation ?

  • contacter l’ABES pour rejoindre le dispositif CERCLES ?

OUI. Des établissements se sont manifestés via twitter, via ce blog ou par mail. Des consignes précises pour contribuer seront données, lors des Journées ABES. D’ici-là, un autre établissement va rejoindre le dispositif : la Fondation Maison des Sciences de l’Homme de Paris, qui travaillera sur le corpus des e-books Cambridge University Press (plus d’infos ici).

  • participer, indirectement ?
Image Un cercle dans le cercle

Un cercle dans le cercle (By Lucy Nieto CC-BY-NC 2.0 via Filck’r)

OUI. C’est déjà le cas pour Grenoble 2 (cf plus haut) qui, souhaitant travailler sur un corpus CERCLES, a pris contact avec l’ABES pour savoir dans quelle mesure il était « autorisé » à intervenir. Ne risquait-il pas de doublonner avec le SCD de Picardie, ce qui aurait été contraire au but même poursuivi par CERCLES : la mutualisation ? Certes, la priorité est donnée à l’établissement qui porte le chantier, mais rien n’interdit de lui prêter main forte. L’établissement porteur peut ainsi devenir à son tour un référent, pour l’établissement qui souhaite collaborer. Et prendre la tête d’un petit cercle de contributeurs. La dynamique du cercle vertueux, qu’on souhaite créer avec ce dispositif, s’en trouve facilitée.

La consigne suivante est donc à passer dans les établissements :

 « Si vous souhaitez intervenir sur des notices d’un des corpus CERCLES, vous le pouvez, à condition d’en informer l’établissement en charge du corpus, avant toute action, et d’y travailler de concert avec lui ».

Webservice AlgoSudoc : prendre connaissance et remédier aux anomalies de chargement des données Sudoc dans theses.fr

Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

« Nous sommes en 2015 après Jésus-Christ. Toutes les thèses de doctorat soutenues en France depuis 1985 sont recensées dans theses.fr… Toutes ? Non ! Un lot d’irréductibles notices Sudoc résiste encore et toujours à l’algorithme de chargement. Et la vie n’est pas facile pour les garnisons de catalogueurs des bibliothèques retranchés dans les établissements de soutenance.« 

En mai 2013, les données du Sudoc ont été chargées dans le moteur de recherche theses.fr. Un précédent billet liste (de manière non exhaustive) les raisons pour lesquelles certaines notices n’ont pas pu être chargées.
Au-delà de l’énoncé de ces quelques principes, le programme de versement des données Sudoc restait une boite noire pour les catalogueurs. Vous avez été nombreux à nous réclamer via le guichet d’assistance des explications sur le non-chargement de telle ou telle notice, souvent à la demande d’un directeur de thèse qui constatait que theses.fr ne recensait pas la totalité des thèses qu’il a dirigées. Nous vous avons répondu au cas par cas, en vous promettant une liste de toutes les notices en erreur.

Ce service est désormais (enfin !) disponible. L’ABES a développé un webservice baptisé AlgoSudoc permettant de générer à la demande un « rapport dynamique de chargement des données Sudoc dans theses.fr ». Ce rapport est un fichier .csv contenant les résultats des tests de l’algorithme. Ces tests portent principalement sur la qualité de la notice décrivant la thèse originelle (codée 105$bm) et sont divers et variés (présence, structure et unicité du numéro national de thèse, structure de la note de thèses…). Pour chaque PPN en anomalie, le catalogueur est invité à corriger la notice dans WinIBW ; le rapport dynamique lui suggère d’intervenir à tel ou tel endroit de la notice.
Aujourd’hui, des dizaines de milliers d’anomalies sont détectées, y compris pour les thèses soutenues après 1985. Face à l’ampleur de la tâche, il est nécessaire d’organiser le travail de correction. En utilisant des paramètres dans l’url de génération du rapport dynamique, il est possible de définir un lot précis (par exemple, toutes les notices de thèses localisées avec un RCR donné).

La documentation sur ce webservice est ici. Un J-e.cours de présentation de ce service aura lieu le 12 mars.

Nous espérons que ce webservice sera l’occasion pour les établissements de mettre en place des chantiers de corrections ciblés, un peu comme le traitement des ebooks de droit international achetés dans le cadre d’ISTEX  ou plus récemment comme dans la démarche des CERCLES (Correction et Enrichissement par le Réseau de Corpus de L‘Enseignement Supérieur) .
Il est évident que dans un corpus centré sur les thèses, composé de notices qui bien souvent sont des unicas, les bibliothèques des établissements habilités à délivrer le doctorat ont une responsabilité particulière.
L’ABES vérifiera régulièrement l’avancement des corrections de manière globale. Par ailleurs, l’ABES prend à sa charge un certain nombre de traitements (qui n’apparaissent pas dans les rapports dynamiques) et ne s’interdit pas de mettre en place de nouveaux contrôles, notamment sur l’absence de liens entre notices bibliographiques et notices d’autorité (tests qui eux apparaitront dans les rapports dynamiques).

Un jour, à terme, ce webservice devrait être inutile : plus aucune anomalie ne devrait être détectée par l’algorithme.

Les irréductibles notices Sudoc n’ayant pas de potion magique, elles seront vaincues par les armées de catalogueurs !

IMR