Les documents iconographiques décrits dans Calames (1) : contours d’une analyse globale

  • Auteur/autrice de la publication :
  • Post category:Non classé

Ce billet est le premier d’une série qui sera publiée au fil de l’analyse des données extraites de la base de production Calames, alimentée et consolidée par d’autres requêtes complémentaires. Cette série accompagne un recueil de besoin auprès des établissements du réseau Calames pour alimenter les documents produits par le GT EAD(B) national. Les établissements les plus concernés ou volontaires seront notamment incités à partager leurs besoins du point de vue de la description de ces fonds et leur expérience des données sur lesquelles les chercheurs s’appuient pour trouver et consulter ces documents. Parfois jugés non prioritaires pour le signalement en bibliothèque, parfois au centre des attentions lors de projets de numérisation ou de valorisation, les documents iconographiques constituent un ensemble aux contours parfois difficile à définir. Leur volumétrie qui excède souvent les moyens disponibles pour un signalement fin scientifiquement et à la pièce, leur importance pour la recherche et leur place dans les politiques de patrimonialisation souvent de plus en plus étendues en font cependant un ensemble plein d’enseignements sous de multiples aspects.  Depuis son lancement en 2008, l’application Calames a été choisie par de nombreux établissements de l’ESR pour décrire leurs documents iconographiques. Partie intégrante d’un fonds d’archives mêlant différentes typologies de documents ou formant une collection constituée en dehors de toute production d’archives, la description en EAD offre certains avantages pour les signaler, notamment par rapport à UNIMARC.   En 2025 et à la demande du Comité Stratégique Bibliographique (CSB), le GT EAD(B), réunissant l’Abes, la BnF et des représentants des réseaux Calames et TapIR, consacre l’année à la production de fiches pratiques pour aider à la description de ces documents en EAD. Ces travaux donnent l’occasion d’analyser les 379 310 <archdesc> ou composants repérés dans la base Calames comme décrivant au moins en partie des documents iconographiques, représentant 23% des composants publiés fin 2024 dans Calames, et d’en dégager quelques grandes lignes.  Avant toute analyse : quelle définition des documents iconographiques ?  Parcourir en diagonale quelques fichiers EAD (expression employée dans ce billet pour "instrument de recherche", car plus proche de la réalité technique dans Calames) ou composants comportant des <genreform> (voir plus bas pour les spécificités de cette indexation) se rapportant à l’iconographie, donc indexés - ce qui n’est pas toujours le cas (voir plus bas), suffit pour tomber sur des cas difficiles à trancher : les dessins ou gravures scientifiques en relation avec un texte ou des notes rédigées par le savant ou le chercheur sont-ils des documents iconographiques ? Que faire de certaines valeurs de <genreform> qui peuvent recouvrir de l’iconographie comme des documents textuels, comme « publicité » ? Les cartes géographiques ou les plans, souvent manuscrits et toujours non édités dans Calames, en sont-ils ?   Pour effectuer cette analyse, le parti pris a été de considérer comme documents iconographiques toute unité documentaire ou ensemble d’unités documentaires qui s’est vu attribué un <genreform> « type de document », « technique » ou « genre, forme et fonction » dont la valeur en attribut NORMAL a été considérée comme propre à une certaine typologie de documents iconographiques, ou…

Continuer la lectureLes documents iconographiques décrits dans Calames (1) : contours d’une analyse globale

Calames : l’IA au service des chantiers qualité  #1

  • Auteur/autrice de la publication :
  • Post category:Non classé

Chantiers qualité dans Calames : contexte et objectifs Dans la seconde moitié des années 2010, plusieurs chantiers qualité ont été menés en concertation avec le groupe de travail Calames. Ces opérations reposaient principalement sur des modifications de masse réalisées par l’Abes, avec une simple information communiquée au réseau. En 2020, dans le contexte particulier du confinement, un chantier qualité ciblant les autorités et leurs liens avec les notices IdRef s’est déroulé sur plusieurs mois. Pour la première fois, les établissements du réseau ont été sollicités pour améliorer ces liens, grâce à l’envoi par l’Abes d’un tableau de diagnostic détaillé. En 2023, lors de la journée réseau Calames intitulée « Le Voyage des données », ces chantiers qualité ont été évoqués à nouveau. Il a été annoncé qu’ils seraient relancés afin de préparer la migration des données Calames vers un nouvel outil destiné à remplacer l’actuel. Cette attention à la qualité des données est également essentielle pour anticiper d’éventuelles conversions vers de nouveaux modèles, comme EAD 4 (dont la publication est prévue en 2026) ou RiC (publié fin 2023). Identifier les chantiers pertinents  En 2024, l’équipe Calames a identifié les chantiers qualité pertinents en procédant au requêtage de la base de production. Deux types de cas ont été privilégiés :  Des cas repérés dans la base avec une certaine régularité lors d’interventions sur les données ou de traitements de tickets d’assistance Des éléments EAD estimés "stratégiques" du fait qu'ils alimentent des index de recherche dans l’interface publique de Calames : ID de composant, cotes, dates, indexation de personne physique, collectivité, famille, lieu géographique, sujet ou langue.  Une trentaine de chantiers qualité potentiels ont ainsi été identifiés et classés en ordre de priorité selon le degré d’importance de l’élément ou de l’attribut EAD concerné dans les index de recherche Calames et du nombre de formes erronées à corriger sur l’ensemble des données publiées dans Calames, les données présentes en base de production, mais non publiées, ayant été systématiquement écartées de l’analyse.  S’aider de l’intelligence artificielle pour modifier les données en masse  Pour réaliser des modifications de masse  sur les données, l’Abes utilise deux outils internes : l’un dédié au Sudoc et à IdRef, l’autre à Calames. Ces outils reposent sur des scripts développés en langage Java, s’appuyant sur l’API standard du DOM W3C. Cette bibliothèque permet de créer, manipuler et analyser des documents XML, en offrant une navigation fine au sein de la structure arborescente des nœuds XML. Grâce à cette technologie, il est possible, en théorie, d’accéder à tout élément ou attribut EAD contenu dans les composants d’un fichier, afin de les modifier de manière ciblée. L'IA à la rescousse de la qualité des données Calames La production de ces scripts peut toutefois s’avérer fastidieuse pour des non-informaticiens, notamment selon la complexité des éléments ou attributs EAD à modifier. Afin d’accélérer ce processus et de limiter la sollicitation récurrente des informaticiens, il a été décidé de recourir à un modèle d’intelligence artificielle. A cette fin, un agent LLM (Large Language Model) a été entraîné pour permettre…

Continuer la lectureCalames : l’IA au service des chantiers qualité  #1

Homologation de sécurité des systèmes d’information : l’Abes s’engage avec MonServiceSécurisé

  • Auteur/autrice de la publication :
  • Post category:Non classé

La cybersécurité est devenue un enjeu central pour les établissements publics, notamment depuis la parution de l’Instruction générale interministérielle n°1337 du 26 octobre 2022, qui impose une obligation d’homologation des systèmes d'information (SI) pour toutes les structures concourant aux missions de l’État ou placées sous sa tutelle. Consulter : Texte officiel sur Légifrance Une obligation réglementaire à l'horizon 2025 Depuis avril 2023, les établissements disposent d’un délai de deux ans pour se mettre en conformité. Passé ce délai, les pénalités seront encadrées par l’ANSSI, comme précisé dans la section 6.3 de l’Instruction. Consulter : Section 6.3 sur Légifrance Qu’est-ce que l’homologation de sécurité ? L’homologation est un acte formel par lequel une autorité qualifiée (l’AQSSI ou son délégataire) atteste que : les risques de sécurité ont été identifiés les mesures de maîtrise des risques ont été mises en œuvre les risques résiduels sont acceptés en pleine connaissance de cause. Ce processus doit précéder toute mise en production d’un nouveau service numérique. Il s’applique à tous les SI relevant du périmètre de l’État ou de réglementations spécifiques, et est adapté en fonction de la sensibilité des systèmes concernés. Une gouvernance assumée L’autorité d’homologation doit occuper une position hiérarchique suffisamment élevée pour porter la responsabilité de la mise en ligne des services. Dans le cas de l’Abes, c’est le directeur qui fixe la durée de validité de l’homologation selon une échelle d’évaluation (ex. : note de 4,5 ➝ 3 ans d’homologation). L’Abes engagée avec MonServiceSécurisé En tant que DPO et RSSI de l’Abes, nous avons engagé début 2024 une démarche ambitieuse d’homologation, en nous appuyant sur MonServiceSécurisé, la plateforme développée par l’ANSSI pour faciliter cette mise en conformité. Ce chantier a mobilisé plusieurs parties prenantes en interne : les responsables applicatifs, un expert sécurité. l'AQSSI (rôle assumé par le directeur de l'Abes), la Déléguée à la Protection des données (DPO), le Responsables de la Sécurité des Systèmes d'Information (RSSI). Au total, plus de 50 applications ont été intégrées à la plateforme. Cette dynamique illustre une volonté forte de structurer la sécurité numérique à l’échelle de l’établissement. Retour d’expérience dans la communauté ESR Le 26 juin 2024, nous avons eu le plaisir de partager notre retour d’expérience lors d’un webinaire consacré aux synergies entre urbanistes SI, RSSI et DPO. Organisée par la communauté urbaESR, coanimée par l’Amue et le Csiesr, cette rencontre a rassemblé plus de 50 participants issus de ces trois domaines d’expertise. À cette occasion, Maria Castillo (DPO, Abes), Frédéric Pouilloux (RSSI, Abes)  et Catherine Balleydier (Grenoble INP) ont présenté des exemples concrets de collaboration au sein de leurs établissements.  Nous avons notamment présenté : les apports concrets de MonServiceSécurisé la méthodologie d’évaluation des applications l’intérêt d’une collaboration étroite entre urbanistes SI, DPO et RSSI Consulter : Les liens entre urbanistes SI, DPO et RSSI : retour sur un webinaire urbaESR Une reconnaissance inspirante Notre engagement a été salué en avril 2025 par l’équipe de MonServiceSécurisé, qui nous a adressé un message de remerciement chaleureux, soulignant notre rôle d’ambassadrice et d'ambassadeur des…

Continuer la lectureHomologation de sécurité des systèmes d’information : l’Abes s’engage avec MonServiceSécurisé

Lenteurs des applications Abes : retour sur un incident aux multiples pistes

  • Auteur/autrice de la publication :
  • Post category:Non classé

Incident survenu du 19 au 28 mai 2025 Quand on ne trouve pas, c’est qu’en général on ne cherche pas au bon endroit Tout a commencé vers la mi-avril, avec quelques signaux faibles : des retours isolés, des lenteurs sporadiques, parfois impossibles à reproduire, des utilisateurs gênés… mais rien de franchement alarmant. Puis, le 19 mai, la situation s’accélère : les alertes se multiplient. Calames devient poussif, le moissonnage des entrepôts de données rame, l’autocomplétion des auteurs sur idref.fr prend une pause-café, et même le Sudoc public (sudoc.abes.fr) débouche parfois sur un message "délai dépassé". Pour ne rien arranger, certaines de nos sondes de surveillance se sont mises à faire le yoyo (en ligne, hors ligne, de nouveau en ligne, puis encore hors ligne), accentuant la confusion et renforçant le sentiment d’instabilité générale. Le plus déconcertant ? À l’Abes, ou via notre VPN, tout fonctionne parfaitement. Aucune lenteur, rien à signaler. Impossible de reproduire le problème. En revanche, à distance, les soucis sont présents mais pas de façon constante. D’où cette impression étrange : ce n’est pas l’application qui flanche, mais l’accès. Et pourtant, côté réseau, tout semble en ordre. Aucun indicateur suspect, aucune alerte. Rien. Alors, on creuse. On mène des tests en direct avec un établissement impacté (la bibliothèque de l’Académie Nationale de Médecine). On inspecte les trames avec les outils de développement du navigateur, puis avec Wireshark. Les lenteurs sont tangibles. Et pourtant, dans les logs, aucune anomalie liée aux IP publiques des utilisateurs concernés. Le vide. Alors, on continue à chercher. On redémarre des services, on inspecte le DNS, les interfaces réseau, les journaux système, les pares-feux, le débit, la mémoire, la CPU, la couche de virtualisation, les bloqueurs de pub (oui, vraiment), et même Matomo, notre outil de statistiques web. Mais rien. Les lenteurs persistent, réelles, mesurables… et insaisissables. Comme si le problème s’amusait à jouer à cache-cache avec nous. Alors, où chercher maintenant ? Quand on finit (enfin) par chercher au bon endroit C’est en basculant notre application exemple « hello.abes.fr » sur un autre reverse proxy que l’on a le déclic. Lente et poussive derrière le reverse proxy central, elle devient fluide et réactive lorsqu’on la place derrière un autre proxy. Ce contraste nous met sur la piste. On met donc en place un nouveau reverse proxy central, puis on y migre l’application Calames. Résultat sans appel : sans VPN, tout fonctionne parfaitement. La source du problème se précise nettement. En creusant la piste du reverse proxy, on s’intéresse de plus près au pare-feu présent sur la machine, on analyse les différentes règles iptables présentes, dont certaines n’ont pas été modifiées depuis des années, sans jamais avoir été réellement réévaluées. En particulier, une règle limitait le nombre de connexions entrantes pour contrer les attaques DoS. Sauf qu’en 2025, avec plus d’applications, plus d’usagers, plus de moissonnages… ces seuils ont fini par faire du zèle. Trop de trafic ? Hop, on bloque. Résultat : un effet de seuil inattendu, où le trafic légitime se…

Continuer la lectureLenteurs des applications Abes : retour sur un incident aux multiples pistes

Indexation RAMEAU assistée par IA : le décryptage du Labo

  • Auteur/autrice de la publication :
  • Post category:Non classé

À l’issue d’une expérimentation conduite entre octobre 2024 et janvier 2025, l’Abes a publié le rapport « Indexation  RAMEAU assistée par IA ». Retour en détail sur la façon dont fonctionne cette IA prometteuse. Lire aussi le Billet Fil'Abes : L'indexation RAMEAU assistée par IA : retour sur une expérimentation prometteuse Contexte : du projet Labo à l'expérimentation in vivo En 2023, le Labo de l’Abes a mené un projet dont l’objectif était d'évaluer la faisabilité d'une indexation RAMEAU de qualité satisfaisante au moyen d'une intelligence artificielle (IA), à partir du titre et du résumé d’une monographie en français. Encore fallait-il définir ce qu'est une indexation "satisfaisante", question délicate.... Les particularités de cette tâche nous ont tout d’abord conduits à adopter plusieurs stratégies d'évaluation complémentaires : Évaluation des indexations machines avec les métriques classiques adaptées à la classification multilabel (= Sudoc comme la vérité). Évaluation des indexations machines en les comparant à plusieurs indexations humaines, et pas seulement à l'indexation humaine du Sudoc (= pluralité des vérités). Pour ce faire, nous avons demandé à 6 collègues de l'Abes (nommés les “réindexeurs”) d'indexer une centaine de documents déjà indexés dans le Sudoc, sélectionnés de manière aléatoire. Évaluation qualitative de toutes les indexations, humaines et machines, au moyen d'une grille de notation (= notation comme la vérité). Selon cette grille, noter une indexation, c'était, d'une part, noter chaque sujet retenu pour une notice donnée (on notait l'exactitude et la spécificité de chaque sujet) et, d'autre part, noter le bloc des sujets retenus pour une notice donnée (on notait la complétude et la redondance de chaque bloc). Les évaluations menées nous ont permis de conclure que l'indexation RAMEAU par une IA est aujourd'hui réalisable en garantissant un niveau de qualité suffisant et un temps de traitement satisfaisant. Cependant, du fait de la grande difficulté à évaluer la qualité d’une indexation et de la nouveauté que présente l’assistance d’une IA, l'Abes a souhaité prolonger ce travail de recherche & développement interne sous la forme d'une expérimentation in vivo, en situation réelle, c'est-à-dire dans WinIBW, l'environnement de catalogage dans le Sudoc. Dans le cadre de cette expérimentation, il s'agissait d'évaluer à la fois la qualité ressentie du service de suggestion d’indexations et la qualité ressentie de l'intégration de ce service dans l'outil de travail quotidien. L'évaluation de ces deux dimensions a permis de mesurer la satisfaction globale des collègues ayant participé aux tests et d'envisager les améliorations pertinentes. Le rapport final publié récemment décrit les modalités et les conclusions de cette expérimentation. Dans ce billet, nous nous concentrerons sur la solution technique mise au point et retenue par le Labo de l'Abes pour rendre possible ce nouveau service d'indexation RAMEAU assisté par l’IA. De fait, celui-ci prend la forme d'un web service classique : la requête est une URL qui prend en paramètre le titre+résumé d'un document (outre d'autres paramètres) et renvoie des suggestions sous une forme structurée en JSON. Les détails de ce web service seront présentés plus loin, mais nous souhaitons avant tout…

Continuer la lectureIndexation RAMEAU assistée par IA : le décryptage du Labo

Les identifiants des structures de recherche de l’université de Strasbourg : retour d’expérience

  • Auteur/autrice de la publication :
  • Post category:Non classé

En 2024, le service des bibliothèques de l’université de Strasbourg s’est lancé dans un chantier autour des identifiants des structures de recherche dans le référentiel ROR et par extension dans IdRef et AuréHAL. Pourquoi ce chantier ? Depuis plusieurs années,…

Continuer la lectureLes identifiants des structures de recherche de l’université de Strasbourg : retour d’expérience
Aller au contenu principal