Dans la continuité du projet ArchéoRef …
Entre 2014 et 2016, le réseau des Écoles Françaises à l’Étranger (EFE), l’Institut français d’archéologie orientale du Caire (Ifao), l’École française d’Athènes (EFA), l’École française de Rome (EFR), l’École française d’Extrême-Orient (EFEO) et la Casa de Velázquez (CVZ) ont mené un premier projet ayant abouti à l’enrichissement de 475 notices d’autorité IdRef décrivant des sites archéologiques. Il s’agissait principalement d’ajouter des coordonnées géographiques dans les notices afin de permettre la géolocalisation des sites.
Consulter les deux billets publiés à ce sujet sur le blog Punktokomo : ici et ici
…en exploitant la méthodologie du projet RefDivinités
En 2019-2020, l’Abes a été sollicitée par la Bibliothèque interuniversitaire de la Sorbonne et FRANTIQ, Fédération et Ressources sur l’Antiquité (GDS 3378), dans le cadre d’un autre projet CollEx-Persée : RefDivinités. Il s’agissait de travailler sur des divinités et héros du monde méditerranéen antique, décrits à la fois dans IdRef et dans PACTOLS, thésaurus de référence pour les Sciences de l’Antiquité et l’Archéologie. Ce travail d’enrichissement et d’alignement IdRef <-> PACTOLS a porté sur 663 notices de personnes physiques.
Consulter le billet Punktokomo qui retrace les étapes de ce projet
ArchéoAl : partenaires et finalités du projet
En 2020, sous la houlette de l’Ifao, les mêmes acteurs sont lauréats d’un nouvel appel à projet Collex-Persée : ArchéoAl commence. Le projet a été mené en deux phases :
- au sein de chaque école, collaboration entre chercheurs et professionnels de l’IST dans l’objectif d’améliorer les notices IdRef
- recours à un personnel recruté sur financement Collex-Persée et hébergé par Bibracte afin d’aligner IdRef au thésaurus PACTOLS porté par FRANTIQ et, ainsi, l’ouvrir à d’autres référentiels.
Améliorer la couverture d’IdRef relative aux sites de fouilles menées par les Écoles françaises à l’Étranger
La création de nouvelles notices dans IdRef afin de décrire la production scientifique des écoles constitue l’un des objectifs d’ArcheoAl. Mais quel site décrire et selon quelle granularité (chantiers et sous-unités de chantiers) ? La collaboration étroite entre professionnels de l’IST et chercheurs, en tenant compte des sources à disposition et des usages futurs de la notice d’autorité, a permis à chaque école d’établir sa propre politique de signalement :
- l’Ifao a choisi de décrire dans IdRef les nouveaux chantiers archéologiques ouverts entre 2015 et 2020 ; d’étendre, à la demande des chefs de chantiers, la description dans IdRef à des sous-unités d’anciens chantiers ; d’ajouter des chantiers historiques (1881-1930)
- l’EFA s’est concentrée sur les toponymes issus des trois sites archéologiques pour lesquels elle avait mis en ligne des WebSIG
- l’EFR s’est appuyée sur les publications scientifiques, listes établies par le service archéologique et les archives de l’école pour décrire des fouilles menées dans quatre pays (Italie, Albanie, Tunisie et Maroc) à partir de la fin du 19e siècle
- la CVZ s’est appuyée sur la bibliographie produite pour les chantiers de 1917 à 1980. Les données plus récentes jusqu’en 2022 ont été validées par chaque archéologue responsable des chantiers archéologiques localisées en Espagne, au Maroc et en Algérie
- l’EFEO s’est concentrée sur le site d’Angkor, du fait de son importance pour les études archéologiques mais aussi du fait des problèmes d’homonymies créés par la guerre civile au Cambodge qui engendrent encore aujourd’hui des controverses entre chercheurs
Au final, 410 nouvelles notices IdRef ont été créées.
Améliorer la complétude de chaque notice d’autorité et établir des liens entre notices d’autorité Nom géographique et Personne
Le second objectif d’ArchéoAl consistait à améliorer, de manière globale, la qualité des notices IdRef. A cette fin, toutes les notices du corpus ArchéoRef, reprises pour l’occasion, ainsi que les nouvelles autorités créées ont fait l’objet d’une attention particulière sur les zones suivantes :
- la géolocalisation et les notes géographiques (zones Unimarc A123 et A356) : parfois, la géolocalisation n’a pas été renseignée volontairement ou des chantiers ont été écartés pour des raisons de sécurité (protection des objets archéologiques contre les pillages) ou politiques (zones sensibles comme la Corée du Nord).
- les variantes de noms (zone A415) : la particularité des EFE dont les personnels sont de nationalités et de langues diverses a été précieuse pour enrichir les variantes en langue originale (italien, espagnol, catalan, berbère, grec moderne, grec ancien, latin, arabe, khmer…) ou gérer les systèmes de translittération.
- les mentions de sources (zone A810) : conformément aux préconisations de l’Abes, les catalogueurs ont veillé à la présence systématique de sources pour étayer le contenu des notices. Ces sources sont de nature variables : références aux archives des EFE ; liens vers Wikipédia ; URL renvoyant sur la description du chantier sur le site institutionnel ; URL renvoyant vers le secteur et le WebSIG (Système d’Information Géographique) correspondant…
- les liens entre notices d’autorité : au cours du projet, il est apparu pertinent à plusieurs écoles (l’Ifao, l’EFR et la CVZ) de valoriser le rôle de chef de chantier. L’Abes a préconisé de saisir, dans la notice Nom géographique, un lien vers la notice Personne physique du chef de chantier avec une formule introductive. 273 notices du corpus ArchéoAl contiennent ce précieux enrichissement.
- exemple : la notice https://www.idref.fr/256127484 qui décrit le lieu Jijel (Algérie) — Nécropole de la Pointe Noire est liée à la notice https://www.idref.fr/057475555 qui décrit la personne Astruc, Miriam, archéologue (1904-1963). Ce lien est réalisé grâce à l’ajout dans la notice Nom géographique d’une zone A500 ##$0chef de chantier$3057475555Astruc, Miriam (1904-1963 ; archéologue)
La plus-value d’ArchéoAl : l’interopérabilité entre référentiels
La seconde phase du projet, pour laquelle FRANTIQ a joué un rôle majeur, visait à enrichir PACTOLS sur la base d’IdRef, qui a servi de source. 601 entrées ont ainsi été ajoutées à PACTOLS, non sans poser certains problèmes du fait de la granularité très fine choisie par les écoles pour leur signalement dans IdRef.
D’autres alignements ont ensuite été réalisés dans PACTOLS vers :
- Geonames, base de données géographiques des découpages administratifs actuels
- Wikidata, base de connaissances libre éditée de manière collaborative et hébergée par la Wikimedia Foundation
- Pleiades, gazetier des lieux anciens, alimenté par les spécialistes du domaine.
Enfin, l’interopérabilité réciproque entre IdRef et PACTOLS est acquise depuis le printemps 2023 : l’Abes a chargé 692 identifiants PACTOLS dans des notices Noms géographiques, l’immense majorité étant des notices du corpus ArchéoAl.
Et maintenant ?
Le projet ArchéoAl est formellement terminé. Les notices IdRef, choyées à cette occasion, vont vivre leur vie, les données étant accessibles à tout un chacun, notamment aux chercheurs.
Elles sont en outre « la corbeille de la mariée » que l’Abes apporte au projet RAPIDO, autre projet porté par Persée et financé par le Fonds national pour la science ouverte (FNSO). Le projet « RAPIDO – Rendre Accessibles des Publications scientifiques Indexées et liées à des DOnnées certifiée » vient de fêter sa première année. L’INIST-CNRS apporte son expertise en matière de repérage d’entités nommées et d’annotations automatisées pour extraire, d’un ensemble de revues numérisées et disponibles via Persée, les toponymes des sites archéologiques et les mettre en regard avec les notices d’autorité Noms géographiques d’IdRef. De fait, les revues concernées par le projet sont celles des Écoles françaises à l’étranger qui bénéficieront pour leur indexation de tout le travail réalisé dans le cadre de ArchéoAl.