SudocToolkit, une application pour faciliter l’utilisation des web services de l’Abes

Cet article est proposé par Géraldine Geoffroy (SCD Université Nice Sophia Antipolis) en tant que porteuse de l’application SudocToolkit,  première contribution partagée via la toute récente communauté Github « abes-esr« . Qu’elle en soit ici vivement remerciée !

Lors d’une session parallèle des dernières Journées Abes (2019), l’équipe informatique de l’Abes a présenté son projet de co-construction d’applications, basé sur l’ouverture des codes sources et le respect des méthodes de l’open source pour le développement et la diffusion des applications, web services, prototypes etc… C’est un changement de braquet notable sur le chemin de la collaboration intra-réseau… et maintenant que l’Abes a fait le premier pas, c’est à nous, membres des réseaux – “bibliothécaires-systèmes” des BU (pour reprendre la terminologie de l’Abes) – d’emprunter le même chemin en partageant, autant que faire se peut, dans un espace commun les codes des applications que nous développons autour des données du Sudoc (et d’Idref, et de theses.fr…), dans et pour nos établissements respectifs.

C’est chose faite pour le SCD de Nice avec la création d’une team azur-scd dans l’espace Github abes-esr, et le transfert d’une première application répondant au nom de SudocToolkit.

L’esprit de cette application…

… est de fournir, via l‘installation d’un utilitaire sur son PC, une interface utilisateur pour faciliter l’accès et l’usage des web services du Sudoc, notamment pour ceux qui ne sont pas  « bibliothécaire-système » mais ont tout de même besoin d’obtenir de manière automatisée certaines données au-delà du niveau local, par exemple dans le cadre d’opérations de gestion de collection (ex : nombre de bibliothèques localisées dans le catalogue Sudoc, correspondance entre ISBN et ppn(s) …). 

Techniquement (enfin, plutôt non techniquement justement !), le recours à une API de type REST, est relativement simple : il suffit de construire l’URL de sa requête en associant l’URL racine de l’API et les paramètres souhaités (en clair : il faut lire la documentation de l’API), puis d’envoyer sa requête par le protocole HTTP au serveur (en clair : taper l’URL dans la barre d’adresse de son navigateur). 

Là où les choses se corsent, c’est au moment d’exploiter les données structurées – en général sérialisées en XML et/ou JSON – renvoyées par le serveur : on peut interroger manuellement une API avec quelques requêtes et examiner de visu les flux de résultats (voir par exemple cette requête issue de la documentation dans l’espace pro de l’Abes). Cependant, ces standards sont avant tout dédiés à l’échange de données entre machines, l’intervention humaine consistant éventuellement à écrire le programme intermédiaire qui explore, reformate, transforme ou enrichit les données. 

L’accès (automatisé et en autonomie s’entend) à des données, pourtant ouvertes et distribuées par ce type de services, ne va donc pas forcément de soi pour la plupart des bibliothécaires. Pourtant, comme c’est le cas pour les données du Sudoc, celles-ci peuvent s’avérer indispensables aux opérations de gestion courante des collections – hélas non disponibles facilement, car non gérées par les SIGB (c’est le cas des localisations Sudoc par exemple).

Parmi les configurations concrètes possibles…

… citons par exemple le cas où la bibliothèque a besoin de connaître le taux de recouvrement de sa collection avec le Sudoc sur la base d’un listing d’ISBN (traitement de dons, rétro-conversion) ; de vérifier les ppn de sa base locale qui auraient été fusionnés depuis leur intégration (quand le SIGB ne gère pas les mises à jour de fusion) ; de disposer des RCR localisés dans le Sudoc lors d’opérations de désherbage…

SudocToolkit constitue une réponse possible (et modeste) à ce type de problématiques, même s’il en existe d’autres, plus complètes, qui répondent à la même logique d’intermédiation entre flux de données structurées et utilisateur “lambda” (voir par exemple la plateforme EzLibrAPI réalisée, et présentée lors de cette même session parallèle, décidément très instructive, par les collègues lillois de la BU Vauban de l’université Catholique de Lille).

Installation et utilisation

SudocToolkit se présente comme une application de bureau, développée en Javascript avec le framework Electron, installable sous Windows avec un exécutable accessible en téléchargement ici : https://github.com/abes-esr/SudocToolkit/releases (choisir la version la plus récente).

Après avoir téléchargé et dézippé l’archive n’importe où sur votre poste, il suffit de double-cliquer sur SudocToolkit.exe pour lancer l’application. Vous pouvez également créer un raccourci depuis votre bureau par un clic droit sur SudocToolkit.exe puis « Envoyer vers -> Bureau » (et renommer le dossier dézippé).

L’utilisation de l’application est censée être simple (sinon ça signifie que c’est raté !) et logique : on part de l’import d’un fichier au format .csv comportant a minima une colonne d’identifiants sources (ppn, ISBN ou ISSN) et on aboutit à la fourniture en sortie d’un fichier de résultats (au format csv) comportant une colonne supplémentaire générée avec les données récupérées grâce à l’API utilisée.

A noter quelques fonctionnalités additionnelles :

  • après avoir importé un fichier de départ, l’application analyse les différentes colonnes : il est alors possible de sélectionner la colonne des identifiants sur lesquels on souhaite faire tourner le web service choisi, puis les colonnes qu’on souhaite conserver dans le fichier produit en sortie.

                                      

  • permet de suivre en temps réel la progression des appels successifs au web service

                                        

  • propose une visualisation synthétique consolidée de la répartition des résultats

                                   

Pour l’instant (mais ce n’est qu’un début !), 4 API sont interrogeables via le SudocToolkit. Elles permettent de réaliser les opérations suivantes :

  • « isbn2ppn : compter le nombre de ppn renvoyés par isbn » : permet, sur la base d’ISBN (10 ou 13, tirets acceptés), de compter le nombre de ppn renvoyés par le web service isbn2ppn
  • « isbn2ppn : obtenir les ppn uniques par isbn » : utilisé dans le cas où, via l’opération précédente, on sait déjà qu’un ppn unique correspond à chaque ISBN, ce web service permet, sur la base d’ISBN, d’obtenir la valeur de chaque ppn
  • « issn2ppn : obtenir les ppn uniques par issn »: idem, sur la base d’ISSN (avec ou sans tirets) ;
  • « merged : obtenir les ppn préférés en cas de fusion »: sur la base de ppn, obtenir le ppn actif si fusion par le web service merged ;
  • « multiwhere : compter les localisations par ppn » : sur la base de ppn, compter le nombre de RCR localisés et renvoyés par le web service multiwhere.

C’est une première version, cette application est possiblement amenée à s’enrichir avec d’autres web services ou des fonctionnalités supplémentaires, notamment en fonction des besoins exprimés. Et justement, pour vous exprimer,  vous pouvez :

Géraldine Geoffroy, SCD-BU Université Nice Sophia Antipolis, Département Sidoc, chargée d’ingénierie documentaire


 

 

 

Continuer la lecture

L’Abes soutient la recherche en humanités numériques (2) : retours sur une coopération fructueuse avec le LARHRA

NB – Ce billet prolonge et détaille le billet FilAbes publié à la même date.

Le 1er juillet 2019, le conseil d’administration de l’Abes a validé la convention de coopération entre l’Abes et le LARHRA – Laboratoire de Recherche Historique Rhône-Alpes (UMR CNRS 5190) situé à Lyon et à Grenoble.

Cette convention formalise une coopération déjà ancienne qui, depuis 2014, vise à promouvoir la réflexion et les actions en faveur de l’interopérabilité des données. Ainsi du projet  Siprojuris – Système d’information des professeurs de Droit (1804-1950), dans lequel les éléments descriptifs des professeurs de droit référencés ont été nativement enrichis par un identifiant IdRef, ce qui permet d’accéder, par rebond, aux références bibliographiques associées dans le Sudoc, comme l’illustre la page ci-dessous

 

Continuer la lecture

Paprika, une interface pour des liens aux autorités de qualité


Lors des Journées Abes 2018, certains participants ont pu assister à une démonstration de Paprika, interface dédiée à la visualisation, la création et la correction de liens d’autorité. Cette interface reprend les principes du démonstrateur présenté lors des Journées 2017.

.Pour que chacun puisse prendre connaissance de ce nouvel outil, l’équipe a produit deux petites vidéos qui donnent un aperçu rapide des fonctionnalités de Paprika. Précisons qu’elles ont été présentées lors du dernier congrès ELAG.

Continuer la lecture

Univ-Droit et IdRef : une coopération ambitieuse et réciproque


Retours sur une coopération fructueuse entre  l’équipe IdRef de l’Abes et l’équipe d’Univ-Droit dans le cadre de l’UNJF – Université Numérique Juridique Francophone, dont Gilles Dumont, professeur de droit public, est le directeur.

Le portail Univ-Droit

univ-droit_logoUniv-Droit, site dédié au Droit et aux Sciences Politiques, porté par la Conférence des doyens des Facultés de droit, est un outil incontournable pour aborder le champ juridique national. On y trouve des informations sur l’ensemble des formations juridiques universitaires, des structures de recherche et des instances professionnelles ainsi qu’une offre conséquente de ressources pédagogiques (cours en ligne).

Continuer la lecture

Déploiement d’OATAO dans IdRef : une nouvelle visibilité sur le web


logo_oatao      idrefOSMOATAO – l’archive institutionnelle et mutualisée des établissements Toulouse INP (Institut National Polytechnique de Toulouse), ENVT (École Nationale Vétérinaire de Toulouse), ISAE-SUPAERO (Institut Supérieur de l’Aéronautique et de l’Espace) et ENSFEA (École Nationale Supérieure de Formation de l’Enseignement Agricole) – et IdRef – application qui permet d’attribuer des identifiants fiables et pérennes, notamment aux membres de la sphère ESR – viennent de réussir leur connexion.  Autrement dit, les dépôts dans OATAO s’accompagnent désormais d’un liage des auteurs à leur autorité dans IdRef ; corrélativement, le cercle des contributeurs IdRef s’élargit pour accueillir en production une Archive Institutionnelle, une première !

Continuer la lecture

Quand ScanR et IdRef s’associent pour identifier les acteurs de la recherche et de l’innovation


ScanR, moteur de la Recherche et de l’Innovation, outil désormais bien connu dans la sphère ESR, propose à la réutilisation de nombreux jeux de données sous licence ouverte. Ces données, également accessibles via la plateforme OpenData du MESRI sont synchronisées avec data.gouv.fr, plateforme des données publiques françaises mis à disposition par Etalab.

S’inscrivant dans la logique d’ouverture portée par ScanR, l’Abes a utilisé les données IdRef et ses algorithmes d’identification afin de lier 3 jeux de données exposés et utilisés dans ScanR via son référentiel auteurs.

Continuer la lecture

Autorités vs référentiels : 3 questions aux experts de l’Abes


arabesques85Autorités, identifiants, entités : L’expansion des référentiels. Tel est le titre du dossier de la revue Arabesques n°85 consacré aux référentiels d’autorités.

Le volume et la diversité des métadonnées en circulation dans les systèmes d’information – de l’enseignement supérieur, de la recherche, de la culture-  exigent de repenser le rôle des référentiels d’autorité. Considérés comme données de confiance au service du développement de l’open data et du web sémantique, ils constituent un capital précieux, une garantie d’indépendance, tout en interrogeant en profondeur les pratiques catalographiques classiques.

Continuer la lecture

Mettre nos données en réseau – un démonstrateur. [4h] La fédération a de l’avenir


[ Lire le billet qui introduit cette série « Mettre nos données en réseau – un démonstrateur » ]

Une des forces de SPARQL est d’être non seulement un langage de requêtes, comme SQL, mais aussi un protocole, s’appuyant sur des requêtes http. Un sparql endpoint fonctionne donc comme un web service. Mais il y a mieux : comme il est standard, il permet à un endpoint d’en interroger n’importe quel autre, distant. A condition, bien entendu, que chacun d’eux ait été configuré pour cela. Cet appel distant est introduit par une sous requête SERVICE {…}

Continuer la lecture

Mettre nos données en réseau – un démonstrateur. [4g] Le Bouquet des ebooks dalloz


[ Lire le billet qui introduit cette série « Mettre nos données en réseau – un démonstrateur » ]

Avec Bacon, le bestiaire ABES s’enrichit d’une nouvelle espèce : le bouquet. Un bouquet (package) n’est pas une collection de titres de périodique, mais une collection de TIPP : “Title Instance, Package, and Platform”. En effet, ce qu’on achète ou loue à travers un bouquet, en général, ce n’est pas une revue dans l’absolu, mais telle revue sur telle plateforme selon les conditions de telle offre commerciale. Ainsi, quand on achète les droits d’accès aux archives d’une revue, les dates de la revue ne coïncident pas avec les dates du TIPP correspondant : la revue peut être encore vivante alors que le TIPP s’arrête en 2014.

Continuer la lecture

Mettre nos données en réseau – un démonstrateur. [4f] Matrice des fascicules pour conservation partagée


[ Lire le billet qui introduit cette série « Mettre nos données en réseau – un démonstrateur » ]

Dans le cadre d’ISTEX, les éditeurs nous livrent des données plutôt riches : un fichier par article, comprenant, outre le full text, des informations sur l’article mais également le fascicule, le volume et la revue. Or, ces différents niveaux reflètent le mode de publication imprimée. Il est donc tentant de vouloir extraire de ces métadonnées ISTEX des informations utiles à la conservation des revues papier correspondantes.

Continuer la lecture