IdRef : chantier qualité autour des notices d’autorité Personnes physiques de statut 1

Logo Chantier Qualité IdRefL’Abes sollicite la participation des Correspondants Autorités pour enrichir des notices d’autorités beaucoup trop succintes,

Le problème et la finalité du chantier

Le chantier concerne des notices de personnes physiques Tp1, issues de chargements de notices élémentaires d’origine BnF faits il y a quelques années. Le plus souvent, elles sont réduites à un point d’accès, sans données codées, sans mention de source, liées à peu de notices bibliographiques (voire mal liées).

Notice exemple
Notice PPN 057140057 en format professionnel, sans données codées, ni 340, ni 810.

 

L’existence de ces notices d’autorité pauvres est un problème pour la qualité globale du catalogue :
– elles génèrent du bruit pour le catalogueur qui souvent, faute d’élément discriminant, ne les traite pas ;
– elles perturbent le fonctionnement des programmes automatisés, notamment d’alignement, que l’Abes a développé depuis quelques années.
L’Abes souhaite aboutir à la disparition de ces notices au profit de notices enrichies et fiabilisées, basculées en statut 5 pour acter ces améliorations.
La finalité du chantier est de faire disparaitre le statut 1 dans les notices d’autorité Personnes physiques.

Ampleur du chantier, global et par ILN

Par le passé, il y a eu jusqu’à 100 000 notices Tp1. Elles sont aujourd’hui au nombre de 24 000, environ.
L’Abes va prendre à sa charge, de manière manuelle et pendant plusieurs mois, 80% de ces notices.

Nous sollicitons les Correspondants Autorités pour traiter environ 4 800 notices qui ont d’ores et déjà été réutilisées par les catalogueurs, hélas sans être améliorées. Le dernier RCR modificateur de ces notices nous a permis de ventiler les notices.
134 Correspondants Autorités sont concernés par ce chantier (voir la liste des ILN ci-dessous).
Certains établissements auront près de 200 notices à traiter ; d’autres une dizaine. La médiane du nombre de notices à traiter par ILN est de 16 notices d’autorité.

Liste des ILN concernés : 4, 5, 6, 8, 9, 10, 11, 12, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 27, 29, 30, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 45, 46, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 80, 81, 82, 83, 84, 85, 86, 88, 90, 91, 94, 95, 96, 97, 98, 99, 100, 102, 104, 105, 106, 107, 108, 110, 120, 124, 129, 130, 134, 135, 137, 138, 144, 145, 146, 155, 156, 159, 161, 165, 167, 168, 170, 172, 73, 174, 175, 176, 178, 180, 185, 189, 193, 194, 209, 212, 222, 229, 310, 311, 313, 314, 402, 404, 405, 406, 408, 411, 416, 418, 424, 427, 428, 429.

à noterla ventilation par ILN est une modalité pratique qui permet de rendre le chantier « acceptable » en répartissant son poids sur plus d’acteurs.
Cela étant, un ILN n’est pas propriétaire des notices même quand il en est le dernier modificateur. Si des Correspondants Autorités volontaires souhaitent donner un coup de main à d’autres (ou aider l’Abes à résorber les lots des 19 000 notices d’autorité restantes), c’est tout à fait possible !

Modalités pratiques du chantier

La liste des notices Tp1 concernées se trouve dans un fichier de travail collaboratif, qui a été communiqué aux Correspondants Autorités, via la liste de diffusion qui leur est dédiée.

Les Correspondants volontaires sont invités à filtrer « leurs » notices (avec le n° ILN), les enrichir, puis renseigner la colonne « A compléter » en y inscrivant « OK ».

La fin de la participation du réseau, pour ce chantier, est prévue pour le 30 juin 2022.

Méthodologie

Attention : pour traiter une Tp1, il ne suffit pas d’aller sur la notice, d’ajouter quelques zones et de modifier la A008. Si l’Abes fait appel à votre expertise c’est bien parce qu’une analyse est indispensable pour faire disparaitre correctement les Tp1.

Avant de modifier la notice Tp1, des recherches préalables sont nécessaires, car plusieurs cas de figure peuvent se rencontrer :

  • identités mêlées et erreurs de liens derrière une Tp1,
  • doublons entre une notice Tp1 et une notice Tp5,
  • homonymes mal désambiguïsés,
  • absence de liens,
  • notice Tp1 correcte mais pourtant typée Tp1, etc.

Ce chantier nécessite de faire des recherches dans WinIBW. L’usage de Paprika est recommandé pour vérifier la qualité des liens.
Des recherches complémentaires externes seront aussi parfois nécessaires pour compléter la notice d’autorité.

Exemple 1 : Lizz Wagstaff (http://www.idref.fr/057370877)

La notice Tp1 est très pauvre (pas de données codées exploitables, pas de zone de source A810).
Elle est liée à deux notices bibliographiques qui traitent de décoration.
Par ailleurs, une recherche dans WinIBW avec la commande CHE AUT WAGSTAFF LIZ ne remonte aucune autre notice d’autorité.
Enfin, rechercher Wagstaff‎ Liz dans Paprika me permet de découvrir une troisième notice du Sudoc non liée, qui traite également de décoration.

Conclusion : dans le monde réel, il existe une Wagstaff‎, Liz qui écrit des livres de décoration. Je dois transformer la notice Tp1 en notice Tp5 (ajout d’une A810, ajout d’une A103$a19XX et d’une A200$c19..-….., etc.) Je fais le lien manquant soit via WinIBW soit via Paprika.
Une fois les enrichissements effectués, j’indique que le traitement pour cette notice est OK dans le fichier collaboratif.  

Exemple 2 : Catherine Canu (http://www.idref.fr/057140057)

La notice Tp1 est très pauvre (pas de données codées exploitables, pas de zone de source A810).
Elle est liée à deux notices bibliographiques qui n’ont rien à voir l’un (un dictionnaire d’histoire) avec l’autre (une thèse de médecine).
Par ailleurs, une recherche dans WinIBW avec la commande CHE AUT CANU CATHERINE ne remonte aucune autre notice d’autorité.
Enfin, rechercher Canu Catherine dans Paprika confirme que les liens sont incertains.

Conclusion : dans le monde réel, il y a deux personnes distinctes. Je dois transformer la notice Tp1 en notice Tp5 en la liant à une seule notice bibliographique du Sudoc (le dictionnaire) et je dois créer une autre notice pour le docteur en médecine.
Une fois les enrichissements effectués, j’indique que le traitement pour cette notice est OK dans le fichier collaboratif.  

Exemple 3  : Georges Raux (http://www.idref.fr/06704705X)

La notice Tp1 est très pauvre (pas de données codées exploitables, pas de zone de source A810).
Elle est liée à cinq notices bibliographiques (quatre éditions distinctes d’un essai en science politique ; une thèse de droit).
Par ailleurs, une recherche dans WinIBW avec la commande CHE AUT RAUX GEORGES remonte une autre notice d’autorité, celle d’un homonyme médecin.
Enfin, rechercher Raux Georges dans Paprika confirme que les liens sont corrects.

Conclusion : dans le monde réel, il y a deux personnes distinctes. Je dois transformer la notice Tp1 en notice Tp5 en l’enrichissant (ajout A103$a18XX$b19XX et ajout A200$f18..-19…, ajout A103$c avec la date de publication du document le plus ancien, ajout d’un qualificatif en A200$c, ajout A810). Je vais aussi intervenir sur la notice de l’homonyme médecin pour ajouter un qualificatif en A200$c.
Une fois les enrichissements effectués, j’indique que le traitement pour cette notice est OK dans le fichier collaboratif. 

L’accompagnement

L’Abes, et plus particulièrement le service Autorités et Référentiels, sont à la disposition des Correspondants Autorités via le guichet ABESstp > IdRef > domaine « Données ».

Un J.e-cours aura lieu sur le sujet le 7 avril 2022. D’autres exemples y seront donnés, ainsi que le rappel des modalités.

Enfin, un point d’étape sur ce chantier sera fait lors de la journée d’étude « Les autorités étoilées : partageons nos recettes pour des données de qualité ! » le mardi 24 mai 2022.

Cet article a 3 commentaires

Laisser un commentaire

Aller au contenu principal