Ce billet est le second d’une série de deux :
1. la partie 1 détaille la modélisation des règles de vérification
2. la partie 2 détaille l’architecture de l’application et ses interfaces
Afin d’améliorer la qualité de son catalogue et de rendre le contrôle qualité des notices bibliographiques plus efficace, le SCD de l’UCBL a souhaité se doter d’un outil de diagnostic, KaliDoS (Qualité des Données du Sudoc). Après une présentation sur la modélisation des règles, nous décrivons dans ce second billet l’architecture de KaliDoS ainsi que les fonctionnalités et les interfaces de l’application.
Architecture de KaliDoS
L’application suit une architecture client-serveur : sur la figure suivante, le serveur stocke les jeux de règles et les résultats dans des fichiers JSON. En plus de la présentation des interfaces, le côté client est en charge d’exécuter le contrôle qualité, après avoir récupéré les notices auprès de deux fournisseurs (IdRef et Sudoc) ainsi que le jeu de règles depuis le serveur. La dockerisation facilite le déploiement de l’application ainsi que son redémarrage en cas d’arrêt critique.
Fonctionnalités et interfaces de KaliDoS
L’application KaliDoS a été développée avec le souci de proposer une interface la plus épurée mais aussi la plus ergonomique possible. Elle est notamment responsive design afin de s’adapter aux différents dispositifs et permet d’exécuter l’ensemble des règles, d’afficher les résultats et offre l’accès à un éditeur de règles.
Quatre interfaces la composent :
Saisie des identifiants
Cette interface permet la saisie d’un ou plusieurs PPN à contrôler, soit par copier-coller, soit en glissant un fichier txt. Avant de lancer la vérification, un menu déroulant propose de choisir le type de règles à appliquer aux notices selon le type de document qu’elles décrivent (voir la partie 1). Les contrôles s’effectuent par une interrogation de la base XML du Sudoc et d’IdRef pour les zones qui attendent un lien vers des autorités (mentions de responsabilité et sujets).
L’interface offre des temps de réponse très courts (500 notices sont analysées en moins d’une minute). En revanche, elle rend complexes, voire impossibles, certains contrôles du fait des différences entre le format de production dans le Sudoc et le format d’export XML, et surtout par l’absence de certaines données.
Interface de vérification
Lorsque l’utilisateur lance un contrôle, il bascule sur l’interface de vérification. Les résultats s’affichent au fur et à mesure de l’analyse et une jauge permet de suivre le pourcentage de notices contrôlées.
Une fois le contrôle terminé, celle-ci est remplacée par un résumé du nombre de PPN testés et du nombre d’erreurs identifiées. La liste de notices comportant des erreurs s’affiche à gauche de l’écran (n° PPN et nombre d’erreurs) et il est possible de cliquer sur chacune des notices pour afficher, à sa droite, le détail des erreurs détectées.
Un export Excel de ces résultats est également possible pour une analyse globale.
Interface des règles
La véritable plus-value de KaliDoS réside dans son éditeur de règles, résultat d’un travail de modélisation. Celui-ci permet d’afficher, de tester et de modifier les règles existantes mais également d’en créer de nouvelles sans avoir de compétences en informatique. Avec les évolutions permanentes des règles et des consignes de catalogage dans le cadre de la Transition bibliographique, cette fonctionnalité s’est révélée essentielle afin de garantir la mise à jour des règles.
Par défaut, toutes les règles s’affichent dans cette interface mais un champ de recherche permet d’affiner l’affichage à partir d’une zone UNIMARC (par exemple, tous les contrôles qui interviennent sur la zone de la collation B215) ou d’un mot clé (par exemple, « rameau » affichera les contrôles sur les zones B6XX avec une sous-zone $2rameau).
Pour l’ajout d’une nouvelle règle, l’utilisateur doit choisir parmi les différents types de règles. Enfin, une aide dynamique explique simplement comment doivent être remplis les différents champs de chaque règle.
Historique
Il est possible de retrouver l’ensemble de contrôles effectués. Chacun d’eux peut être relancé, par exemple après la correction des notices erronées, ou supprimé de l’historique.
Conclusion et perspectives
L’application KaliDoS répond aux enjeux prévus au départ. Elle est utilisée régulièrement au SCD de l’UCBL depuis février 2021 pour l’identification des notices à corriger mais aussi pour les besoins en formation lorsque des erreurs sont récurrentes. Son éditeur de règles offre à l’application une réelle évolutivité. Il pourrait aussi permettre à un autre établissement d’adapter les règles à ses besoins, ceci d’autant plus que le code est disponible sous licence libre : https://github.com/abes-esr/kalidos
En dehors des aspects fonctionnels, ce projet a également permis une collaboration enrichissante entre deux services de l’Université et ses étudiants, ce qui n’est malheureusement pas très fréquent. Il a également ouvert la porte à une collaboration avec l’Abes puisque, face au développement de différents outils au sein des établissements du réseau et au besoin croissant des catalogueurs de disposer d’un outil fiable et conforme aux évolutions des règles de catalogage RDA-FR, l’Agence s’est engagée dans le développement d’un outil unique de contrôle bibliographique qui permettra l’accompagnement des catalogueurs du réseau.
Nuria Pastor Martinez, responsable du Pôle Données et Signalement (SCD de l’UCBL)
Fabien Duchateau, enseignant-chercheur (UCBL et laboratoire LIRIS) |
Ping : KaliDoS, un outil de vérification des règles de catalogage bibliographique - partie 1 - PUNKTOKOMO