IdRef : ORI-OAI, première application externe cliente

La plate-forme ORI-OAI, conçue pour gérer la production numérique institutionnelle d’établissements de l’Enseignement supérieur et de la recherche, propose une nouvelle version du module ORI-OAI-md-editor (version 1.8.3). L’une des nouvelles fonctionnalités de l’outil permet, tout en restant connecté à ORI-OAI, de rechercher, trouver ou créer dans IdRef les autorités Personnes, Collectivités, etc. nécessaires à la description catalographique des thèses.

Pour récupérer cette nouvelle version, il suffit de faire un checkout du module ORI-OAI-md-editor depuis la version 2.0 du projet ORI-OAI.

Principes et fonctionnements

Le principe est similaire à celui utilisé dans l’interfaçage de STAR à IdRef : si un n°PPN est requis dans un champ du formulaire de thèse, l’icône « Lier à l’autorité Sudoc »  est proposée. Ce lien ouvre l’application IdRef dans une iframe (fenêtre intégrée à la page de travail). Le cartouche de recherche est préparé pour que l’opérateur lance la recherche.

Si la recherche est fructueuse, il suffira de cliquer sur le bouton « Lier la notice » en bas de la notice. Alors l’iframe se ferme. Le formulaire de thèse revient en avant-plan et les données utiles sont maintenant présentes dans les champs à remplir.

Dans le cas où l’autorité recherchée n’existe pas encore dans le référentiel, il convient de la créer. Cela se fait avec beaucoup de facilité puisque les données présentes dans la fiche de thèse et intéressant l’autorité sont pré-remplies automatiquement : PPN, date de naissance, nom, prénom, etc. A l’inverse, si les données sont saisies durant la création de l’autorité, elles seront poussées dans les champs correspondants du formulaire TEF d’ORI-OAI lors du liage.

Comprendre le workflow 

ori01

ori-02

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ori-03

ori-04

ori-05

ori-07

Qui est concerné ?

Cette fonctionnalité est déjà en production à Valenciennes. Tous les établissements qui référencent leurs thèses depuis ORI-OAI peuvent utiliser ce service, comme par exemple, l’Université de Lorraine, l’Université Lille 1 Sciences et Technologies, l’Université de Rennes 1, l’Université Paris 2 Panthéon-Assas…

Jacques Brassart, coordinateur fonctionnel du projet ORI-OAI,

Yohan Colmant, coordinateur technique du projet ORI-OAI

Comment « CERCLES » se met en place

by_Horla_Varlan__CC_BY_2_0_via Flick'r

by_Horla_Varlan__CC_BY_2_0_via Flick’r

Il y a un mois, ce billet dévoilait les grands principes de l’expérimentation CERCLES (Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur). Les 4 établissements pilotes se sont mis en ordre de bataille, et l’ABES les accompagne : l’accord de participation (qui valide les engagements de chaque partie) est signé, les référents « ABES » pour chaque établissement et chaque corpus sont désignés, les premiers contacts ont été pris, et le chantier est parfois bien avancé. Voici des nouvelles des 4 premiers « cercles » :

SCD de l’université Paris Est Créteil

  • Corpus : périodiques Oxford University Press – 250 notices
  • Période de travail : janvier 2015 – mars 2015
  • Responsables du chantier : Ewa Nieszkowska, Hélène Pipet
  • Référent ABES : Ilhem Addoun Poliakow
  • Points forts du chantier : création ou amélioration des liens 4XX , 6XX, 7XX ; émission des demandes de numérotation ISSN
  • Méthodologie :
    • phase 1 : les liens 4XX.  À 20 liens par heure, 408 liens ont été établis, sur 20,5 heures de travail (3 jours ETP)
    • phase 2 (en cours)  : les liens 6XX et 7XX. Ce sont les liens aux autorités collectivités (et les créations afférentes) qui se révèlent les plus complexes (5 Tb créées à l’heure, en moyenne).
    • phase 3 (à venir) : numérotation ISSN, et déjà un questionnement sur la possibilité de fusions de notices pré-existantes lors des chargements de notices ISSN.
  • Les « + » du chantier :
    • création d’un journal de bord, partagé avec l’ABES, pour consigner au jour le jour son travail, ses questions à poser à l’ABES, ses galères, ses joies
    • collaboration avec d’autres établissements : le CR 26, pour les demandes de numérotation ; des SCD du réseau, lorsqu’au hasard d’une notice, on propose une délocalisation
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • export de notices à la demande du SCD
    • liaison avec des SCD concernés par des délocalisations
    • expertise, conseil et dépannage

Bibliothèque Diderot de Lyon

  • Corpus : e-books Classiques Garnier – notices des imports mensuels
  • Période de travail : 6 mois après le premier import
  • Responsables du chantier : Marion Ringot
  • Référent ABES : Dominique Esmenjaud
  • Points forts du chantier : création ou amélioration des liens 452 , 6XX, 7XX
  • Méthodologie :
    • réunion de cadrage avec l’ABES : accord sur les collections à inclure dans le périmètre
    • la BDL enrichit les notices du fichier d’import mensuel
  • Les « + » du chantier :
    • collaboration ABES / Garnier pour mettre en place les imports mensuels
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • mise en place d’une procédure d’import mensuel des mises à jour
    • expertise, conseil et dépannage

SCD de l’université Jules-Verne Picardie

  • Corpus : e-books Cairn- 4864 notices
  • Période de travail : avril 2015 – avril 2016
  • Responsables du chantier : Aurélie Bec
  • Référent ABES : Kattialyn Gossiaux
  • Points forts du chantier : création ou amélioration des liens 7XX : création des notices d’autorités si nécessaire
  • Les « + » du chantier :
    • collaboration avec le SID2 de Grenoble, pour la création de notices Od associées à certains titres du corpus et avec le CR 69, pour les demandes de numérotation
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • mise en relation avec le SCD « partenaire »
    • expertise, conseil et dépannage

SCD de l’université François-Rabelais Tours

  • Corpus : e-books Open Edition- 1621 notices
  • Période de travail : février 2015- à préciser
  • Responsables du chantier : Véronique Lacan
  • Référent ABES : Olivier Rousseaux
  • Points forts du chantier : création ou amélioration des liens 4XX , 6XX, 7XX ; création des autorités auteurs
  • Méthodologie :
    • phase 1 : analyse des corrections et propositions d’actions à valider par l’ABES
    • phase 2 : définition des priorités en concertation avec l’ABES
  • Les « + » du chantier :
    • analyse raisonnée et préalable
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • expertise, conseil et dépannage

Trop tôt pour le bilan, mais déjà des pistes …

À chaque établissement sa méthode, son rythme et son calendrier ! Conduire le chantier seul ou à deux, définir un plan d’action préalable ou avancer en faisant, il n’y a pas de règles définies. L’heure des bilans viendra, il s’agit pour l’instant de ne pas freiner cet élan positif. Ce qui commence à se dessiner, c’est le rôle de l’ABES : plutôt que de valider, il consiste à faciliter (export de notices à la demande, mise en relation avec d’autres établissements, résolution de problèmes sur une notice) et à accompagner (compte-rendu au réseau, mise à disposition d’outils). Il sera à consolider à la lumière des premiers retours effectués par les établissements CERCLES eux-mêmes.  Mais l’ABES commence à anticiper sur ce qui suivra cette phase d’expérimentation, et sur la façon d’élargir « CERCLES » aux autres réseaux. Aux établissements du réseau Thèses, par exemple, il est actuellement proposé d’enrichir les notices de thèses du Sudoc pour améliorer leur visibilité dans theses.fr (plus d’infos ICI).

Que peuvent faire les autres établissements Sudoc intéressés, pendant cette expérimentation ?

  • contacter l’ABES pour rejoindre le dispositif CERCLES ?

OUI. Des établissements se sont manifestés via twitter, via ce blog ou par mail. Des consignes précises pour contribuer seront données, lors des Journées ABES. D’ici-là, un autre établissement va rejoindre le dispositif : la Fondation Maison des Sciences de l’Homme de Paris, qui travaillera sur le corpus des e-books Cambridge University Press (plus d’infos dans un prochain billet).

  • participer, indirectement ?
Image Un cercle dans le cercle

Un cercle dans le cercle (By Lucy Nieto CC-BY-NC 2.0 via Filck’r)

OUI. C’est déjà le cas pour Grenoble 2 (cf plus haut) qui, souhaitant travailler sur un corpus CERCLES, a pris contact avec l’ABES pour savoir dans quelle mesure il était « autorisé » à intervenir. Ne risquait-il pas de doublonner avec le SCD de Picardie, ce qui aurait été contraire au but même poursuivi par CERCLES : la mutualisation ? Certes, la priorité est donnée à l’établissement qui porte le chantier, mais rien n’interdit de lui prêter main forte. L’établissement porteur peut ainsi devenir à son tour un référent, pour l’établissement qui souhaite collaborer. Et prendre la tête d’un petit cercle de contributeurs. La dynamique du cercle vertueux, qu’on souhaite créer avec ce dispositif, s’en trouve facilitée.

La consigne suivante est donc à passer dans les établissements :

 « Si vous souhaitez intervenir sur des notices d’un des corpus CERCLES, vous le pouvez, à condition d’en informer l’établissement en charge du corpus, avant toute action, et d’y travailler de concert avec lui ».

Webservice AlgoSudoc : prendre connaissance et remédier aux anomalies de chargement des données Sudoc dans theses.fr

Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

« Nous sommes en 2015 après Jésus-Christ. Toutes les thèses de doctorat soutenues en France depuis 1985 sont recensées dans theses.fr… Toutes ? Non ! Un lot d’irréductibles notices Sudoc résiste encore et toujours à l’algorithme de chargement. Et la vie n’est pas facile pour les garnisons de catalogueurs des bibliothèques retranchés dans les établissements de soutenance.« 

En mai 2013, les données du Sudoc ont été chargées dans le moteur de recherche theses.fr. Un précédent billet liste (de manière non exhaustive) les raisons pour lesquelles certaines notices n’ont pas pu être chargées.
Au-delà de l’énoncé de ces quelques principes, le programme de versement des données Sudoc restait une boite noire pour les catalogueurs. Vous avez été nombreux à nous réclamer via le guichet d’assistance des explications sur le non-chargement de telle ou telle notice, souvent à la demande d’un directeur de thèse qui constatait que theses.fr ne recensait pas la totalité des thèses qu’il a dirigées. Nous vous avons répondu au cas par cas, en vous promettant une liste de toutes les notices en erreur.

Ce service est désormais (enfin !) disponible. L’ABES a développé un webservice baptisé AlgoSudoc permettant de générer à la demande un « rapport dynamique de chargement des données Sudoc dans theses.fr ». Ce rapport est un fichier .csv contenant les résultats des tests de l’algorithme. Ces tests portent principalement sur la qualité de la notice décrivant la thèse originelle (codée 105$bm) et sont divers et variés (présence, structure et unicité du numéro national de thèse, structure de la note de thèses…). Pour chaque PPN en anomalie, le catalogueur est invité à corriger la notice dans WinIBW ; le rapport dynamique lui suggère d’intervenir à tel ou tel endroit de la notice.
Aujourd’hui, des dizaines de milliers d’anomalies sont détectées, y compris pour les thèses soutenues après 1985. Face à l’ampleur de la tâche, il est nécessaire d’organiser le travail de correction. En utilisant des paramètres dans l’url de génération du rapport dynamique, il est possible de définir un lot précis (par exemple, toutes les notices de thèses localisées avec un RCR donné).

La documentation sur ce webservice est ici. Un J-e.cours de présentation de ce service aura lieu le 12 mars.

Nous espérons que ce webservice sera l’occasion pour les établissements de mettre en place des chantiers de corrections ciblés, un peu comme le traitement des ebooks de droit international achetés dans le cadre d’ISTEX  ou plus récemment comme dans la démarche des CERCLES (Correction et Enrichissement par le Réseau de Corpus de L‘Enseignement Supérieur) .
Il est évident que dans un corpus centré sur les thèses, composé de notices qui bien souvent sont des unicas, les bibliothèques des établissements habilités à délivrer le doctorat ont une responsabilité particulière.
L’ABES vérifiera régulièrement l’avancement des corrections de manière globale. Par ailleurs, l’ABES prend à sa charge un certain nombre de traitements (qui n’apparaissent pas dans les rapports dynamiques) et ne s’interdit pas de mettre en place de nouveaux contrôles, notamment sur l’absence de liens entre notices bibliographiques et notices d’autorité (tests qui eux apparaitront dans les rapports dynamiques).

Un jour, à terme, ce webservice devrait être inutile : plus aucune anomalie ne devrait être détectée par l’algorithme.

Les irréductibles notices Sudoc n’ayant pas de potion magique, elles seront vaincues par les armées de catalogueurs !

IMR

Enrichissement mutualisé de corpus : entrez dans le « CERCLES » !

Depuis l’apparition des ressources électroniques, les modalités de signalement de ces ressources dans le catalogue Sudoc n’apportait pas de véritable satisfaction.

L’ABES apportait au réseau ses compétences en matière d’imports de notices par lots, mais ne pouvait assurer un traitement « à la notice », notamment en termes de corrections de données, lorsqu’elles s’avéraient nécessaires.

Les établissements, disposant de la ressource, pouvaient intervenir sur ce travail d’enrichissement, mais hésitaient sans doute à le faire, ne disposant pour cela ni d’interlocuteurs précis à l’ABES (en cas de doute sur les actions à effectuer), ni de visibilité sur les prochains traitements automatiques envisagés par l’ABES.

Les éditeurs, enfin, fournisseurs de métadonnées, n’entendaient certainement pas les demandes isolées d’un établissement, un client parmi tant d’autres.

Il fallait que ça change, et une des solutions résidait sans doute dans ce qui constitue notre principale force : le réseau.

by_Horla_Varlan__CC_BY_2_0_via Flick'r

by_Horla_Varlan__CC_BY_2_0_via Flick’r

Comme nous l’ont indiqué certains interlocuteurs, via des messages sur les listes de diffusion, des tweets ou des courriers adressés à la direction de l’ABES, pourquoi ne pas travailler de façon concertée et additionner nos forces respectives ?

Ainsi, un établissement soucieux de la qualité des données pourrait, au lieu de s’épuiser dans des corrections tous azimuts, se concentrer sur un corpus précis et apporter des enrichissements sur des données clairement identifiées ;

Ainsi, l’ABES, reconnaissante de cet investissement pour le bien du réseau, pourrait, au lieu de se perdre dans des vérifications ponctuelles et uniques, s’engager à fournir à cet établissement une assistance privilégiée, en termes de consignes et d’outils.

Avec quatre établissements qui s’étaient manifestés un peu plus précisément que d’autres, l’ABES a donc lancé l’expérimentation « CERCLES » : Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur.

L’objectif de cette expérimentation est simple : tester une structure d’encadrement souple et facile à mettre en place, autant pour l’ABES que pour l’établissement, mais rapidement opérationnelle. Elle repose sur :

  • un cadre administratif léger : pas de convention ABES / établissement, mais uniquement un « acte d’engagement » signé par les directions des deux parties ;
  • un binôme opérationnel : un responsable du chantier dans l’établissement et à l’ABES, pour des contacts rapides et directs ;
  • un corpus bien délimité : tout corpus est éligible, pas uniquement les corpus de ressources électroniques ;
  • des conditions de participation libres : la nature des enrichissements, le délai, le temps et les moyens humains affectés au chantier sont laissés à l’appréciation de l’établissement.

Voilà  les 4 premiers établissements du « CERCLES » et les corpus retenus :

 

Les établissements et les corpus choisis

Les établissements et les corpus choisis

 

Selon la taille des corpus choisis par ces quatre établissements pionniers, leurs moyens d’investissements, le bilan de chaque expérimentation n’aura pas lieu au même moment. Mais dès les prochaines journées ABES, nous disposerons d’éléments d’informations, à partager avec vous.

Ce sera probablement l’occasion pour d’autres établissements de se positionner : nous espérons ainsi créer un cercle vertueux et intégrer ce dispositif dans un fonctionnement naturel de travail en réseau.

iln2td3 : un nouveau web service pour le suivi des propositions Rameau

Lors de la Journée des correspondants Autorités du 2 octobre dernier,  le besoin d’un outil dédié pour faciliter le suivi souvent fastidieux des Propositions Rameau avait été exprimé. C’est chose faite grâce au dernier né des webservices proposés par l’ABES. Nom de code :  « iln2td3″.
Si ce webservice a bien entendu pour objectif premier de faciliter le traitement et le suivi des Propositions Rameau par les correspondants Autorité, il entre également dans le cercle vertueux des Chantiers Qualité orchestrés par l’ABES.
Comment ça marche ?
Simple d’utilisation, le webservice s’enclenche en saisissant dans son navigateur l’URL :  http://www.idref.fr/services/iln2td3/X  –  dont on remplacera  le X situé à la fin par le numéro de son ILN, comme par exemple, pour l’ILN 15 (DDoc Bordeaux) : http://www.idref.fr/services/iln2td3/15
 A partir de cette requête, le webservice récupère dans la base Sudoc la liste des notices ayant le statut « Td3″ (= Propositions Rameau) et génère un fichier tabulé qui s’ouvre – et peut s’enregistrer – sur le poste de travail. Ce fichier comporte 6 colonnes  :
  1. PPN des notices Td3
  2. ILN concerné (iLN 15 dans cet exemple)
  3. RCR créateur de la Proposition
  4. Date de création de la Proposition
  5. Zone 250
  6. Zone 830
 Quelques exemples de suivi que devrait faciliter ce webservice  :
  • s’assurer que les Propositions RAMEAU sont pertinentes ;

  • saisir les Propositions dans le FNPR avec le numéro PPN des notices Td3 créées ;

  • en cas de refus du CNR : alerter le catalogueur à l’origine de la Proposition ;  supprimer la notice Td3 et procéder à la ré-indexation de l’ouvrage.

Vos retours d’usage sont bienvenus en commentaire.  Mais avant cela… « Bonnes fêtes à tous !!! »

CheckSUDOC, un nouvel outil de contrôle qualité des notices du SUDOC

CheckSUDOC est une nouvelle application en ligne développé en PHP  permettant d’effectuer un contrôle qualité sur les notices du SUDOC. Ce contrôle peut être effectué chaque jour une fois vos notices bibliographiques importées dans votre SIGB local.

Le fonctionnement est simple. Il s’agit de saisir une liste de PPN (identifiants des notices du SUDOC), un par ligne, et de lancer le traitement. Il existe deux modes d’affichage des résultats : simple et avancé.

Formulaire de Check Sudoc

Formulaire de Check Sudoc

Quelles vérifications sont effectuées sur chaque notice ?

 CheckSUDOC  :

  • contrôle la cohérence des années de publication saisies dans les   zones Unimarc  100  et 210 (sous-champ $d)
  • vérifie si une zone 410 (« appartient à la collection ») est présente à partir du moment où une zone 225 (« collection ») existe dans la notice
  • vérifie également la cohérence entre les champs 181-182  (« type de contenu et type de médiation ») et le sous-champ 200$b (« Indication générale du type de document »). CheckSUDOC indique si un 200$b est présent dans la notice alors que avez saisi des zones 181 et 182. En effet, à partir du 4 novembre 2014, les zones 181 et 182 se substituent à la sous-zone 200$b.
  • contrôle les vedettes matière (zones 601,602,604,605,606,607,608) ainsi que les mentions de responsabilité ( zones 700,701,702). Il vérifie en particulier la présence de liens vers les notices d’autorité qui se trouvent dans le sous-champ $3. Pour les auteurs, CheckSUDOC vérifie si le code fonction est présent ou pas.

Comment exploiter le rapport d’erreur envoyé par CheckSUDOC ?

En mode avancé, les résultats sont affichés dans un tableau dans lequel les anomalies sont signalées en rouge.

Visualisation des anomalies détectées

Visualisation des anomalies détectées

 

A partir du tableau, il est possible de visualiser la notice bibliographique dans un format abrégé en cliquant sur le numéro de PPN.  Pour chacune des zones Unimarc, il est possible d’en afficher le contenu.

Visualisation d'une zone 606

Visualisation d’une zone 606

 

En mode simple, les résultats sont présentés textuellement  sans possibilité de rebonds. Les anomalies  sont signalées en rouge.

Présentation des anomalies en "mode simple"

Présentation des anomalies en « mode simple »

En mode simple comme avancé, les résultats peuvent être téléchargés dans un fichier csv pour être exploités dans un tableur.

Plus de fonctionnalités … ?

ChekSUDOC est un outil évolutif. D’autres contrôles pourront être ajoutés sur la base de vos suggestions.

Pour utiliser CheckSUDOC : http://domybiblio.net/check_sudoc/

 

CheckSUDOC est développé par Yves Tomic, Ingénieur d’études à l’Université Paris Dauphine.

 

 

 

Un chantier qualité sur les n° FRBNF multiples

Dans un catalogue de bibliothèque, quel qu’il soit, chaque notice dispose de son propre identifiant. Dans le Sudoc, c’est un numéro appelé « PPN ». Il identifie les notices bibliographiques et les notices d’autorités.

Ces dernières, dans l’environnement BnF, disposent de leurs propres identifiants : les numéros FRBNF, visibles en zone 001 des notices BnF.

Lorsqu’un catalogueur Sudoc ne trouve pas une notice pour le point d’accès qu’il veut normaliser, il a l’opportunité de chercher si une notice pour cette autorité existe dans la base d’appui (=DIS CHE de WinIBW) où l’on trouve les notices d’autorité de la BNF, laquelle nous les offre gracieusement depuis l’origine du Sudoc.

Sinon, il devra la créer nativement dans le Sudoc.

Dans le cas où il la trouve dans la base d’appui, la commande F5 lui permet de dériver la notice : celle-ci se voit alors dotée d’un PPN et l’identifiant FRBNF passe de la 001 notice BNF à la 035 notice Sudoc. Au moment de dériver, la question de conserver ou pas le numéro FRBNF se pose.

Faut-il conserver le n° FRBNF ?

Cas n° 1 : S’il s’agit de décrire la même personne, la même entité, le même concept dans l’environnement « Sudoc » que dans l’environnement « BnF », il est logique de le conserver. En conservant ce numéro, on indique à tout système qui viendrait « lire » la notice Sudoc : « cette notice a une jumelle dans l’environnement BnF, c’est ce n° FRBNF qui te permettra au besoin de l’identifier et de reconstituer la paire« .

Cas n° 1

Cas n° 1 : dériver pour décrire une même personne

Cas n° 2 : S’il s’agit de dériver la notice BnF pour s’en servir, dans l’environnement Sudoc, comme d’un modèle pour la création d’une personne, d’une entité, d’un concept qui, au final, sera différent, il est logique de ne pas conserver ce n° FRBNF. Après sa validation dans le Sudoc, la notice d’autorité produite s’avèrera différente de celle qui, par commodité, aura servie de modèle. Elles ne sont pas jumelles, il n’y aura jamais lieu de les apparier.

Cas n° 2

Cas n° 2 : dériver un modèle pour décrire une autre personne

Il arrive cependant que des catalogueurs, dans cas n° 2, négligent de supprimer la zone 035 de la notice utilisée comme modèle. Et après validation, il est délicat de revenir en arrière (seuls les logins de type TA disposent désormais de cette habilitation). La notice d’autorité Sudoc hérite alors d’un numéro identifiant BnF  :

  • qui n’a rien à voir avec l’entité qu’elle décrit,
  • qui peut se trouver ailleurs, dans une autre notice d’autorité Sudoc  créée dans le cas n° 1 où sa présence est justifié.

On se retrouve alors en présence de notices qui ne sont pas des doublons (elles décrivent bien des entités différentes) mais qui, pour être distinctes l’une de l’autre, conservent néanmoins un n° FRBNF identique. Ce sont des « doublons de FRBNF ».

2 notices distinctes avec un FRBNF commun

2 notices distinctes avec un FRBNF commun

Combien de notices étaient dans ce cas ?

En septembre 2014, l’ABES en a dénombré quelques centaines (auxquelles il convient d’ajouter des « vraies » notices doublons, créées par copies intempestives ou suite à une recherche négligée).  Pourtant, en décembre 2013, l’ABES avait déjà procédé à un nettoyage. Ces centaines de « doublons FRBNF » avaient été créés au cours des 8 derniers mois !  Il y avait une certaine urgence à alerter le réseau, pour éviter l’hémorragie et pour sensibiliser à la question des identifiants.

Une prise de conscience sur l’importance des identifiants.

La question des identifiants (PPN, FRBNF, etc.) est de plus en plus présente dans les priorités de l’ABES car ils interviennent dans les alignements de « nos » données avec celles d’autres catalogues, à commencer par nos applications STAR, STEP ou Calames et plus loin BNF, VIAF, ISNI. En effet, les identifiants contenus dans les notices sont bien souvent l’unique clé permettant à une application extérieure de venir retrouver les informations des autorités du Sudoc.

En octobre 2014, 74 correspondants Autorités d’établissements identifiés comme ayant créé une ou plusieurs notices d’autorité « avec FRBNF multiples » ont été invités à rectifier ces anomalies, à l’aide d’un fichier listant les n° PPN des notices concernées et de consignes de résolution :

  • s’il s’agit d’un vrai doublon : signalement sur le guichet ABESstp pour traitement par l’ABES
  • s’il s’agit d’une notice avec un FRBNF qui n’a pas lieu d’être présent : suppression de l’intrus en zone 035

Un réseau très réactif !

Il faut ici saluer la promptitude, voire l’enthousiasme avec lesquels les établissements concernés se sont empressés de répondre à notre invitation. Seulement 3 jours après le lancement du chantier, déjà 33 % des notices concernées avaient été vérifiées. Cet élan a été freiné par l’impossibilité technique de supprimer la zone 035 pour les détenteurs d’un login de type TA (groupe des « tcatalogueurs », soit les correspondants Autorités). Elle a été levée, en élargissant les habilitations liées à ce login, et le travail a pu alors reprendre.

Pour ce chantier, le risque ne résidait pas dans le nombre de notices à traiter, mais dans le mode de traitement. Contrairement aux précédents chantiers qualités (voir ici et ), le travail de correction ne reposait pas uniquement sur l’ABES : le réseau devait participer. Il a répondu présent ! Cette réactivité atteste non seulement de l’intérêt des correspondants Autorités et de leurs équipes pour les questions liées à la qualité des données, mais plus globalement de la vitalité du réseau, ainsi que de sa modernité. L’enjeu majeur de ce chantier a bien été perçu : il s’agit de ne plus concevoir nos données dans un contexte isolé, mais comme appartenant à un écosystème où elles vivent, s’échangent et interagissent.