Satisfaction et besoins autour de l’application Step et de ses services : résultats de l’enquête 2015

Depuis son ouverture en 2011, en parallèle de celle de theses.fr, l’application Step a évolué avec l’apport de nouveaux services (export de données vers Star, programme d’import de données commun aux deux applications thèses, interconnexion avec des outils de gestion en local …) et son réseau s’est agrandi pour atteindre aujourd’hui 103 établissements habilités à délivrer le doctorat.

En 2015, l’activité de signalement des thèses en préparation semble avoir atteint sa vitesse de croisière. C’était l’occasion pour l’ABES  de recueillir auprès des correspondants Step leurs avis sur l’application et ses services associés, de connaître leurs éventuelles difficultés ainsi que les évolutions souhaitées. C’est à cette fin qu’une enquête a été menée du 3 mars au 15 avril 2015. En voici les principaux résultats.

Participation des établissements en production dans Step

graphique1Sur les 103 visés par l’enquête, l’ABES a reçu les réponses de 70 établissements, soit une participation de 67%. Parmi les répondants, 10 personnes déclarent que leur établissement n’a pas encore produit de données dans Step bien que la valorisation de leurs recherches doctorales sur theses.fr était une motivation pour rejoindre le réseau.

Une production de données aléatoire

Les principaux obstacles à la production de données dans Step sont liés, soit à une incohérence dans le circuit des thèses (22%), soit à des raisons techniques (22%), soit à un manque de volonté politique (11%). Autres problèmes à la marge soulevés : le manque de personnel et de temps, les changements de statut des établissements (fusion, COMUE) ou le désintérêt des services de scolarité ou des écoles doctorales pour le signalement des thèses en préparation au profit d’autres tâches jugées prioritaires.

Pour les établissements produisant dans Step, les éventuelles difficultés rejoignent celles cités ci-dessus. Elles sont d’ordre technique notamment autour des imports de données avec le module thèse d’Apogée (28%) puis organisationnel : le circuit des thèses entre services au sein de l’établissement est jugé « insatisfaisant » (12%). Viennent ensuite, les difficultés liées au manque de volonté politique de l’établissement (6%), au refus de l’école doctorale (4,5%) et au manque de formation des différents acteurs (4%).

Une application ergonomique et facile à utiliser

Pour 80% d’entre eux, les utilisateurs des formulaires de l’application Step sont satisfaits  et ne rencontrent pas de difficultés particulières.

Un service d’import de données perfectible

graphique239% des répondants affirment alimenter Step en utilisant les imports de données depuis le logiciel de gestion administrative des doctorants en vigueur. La majorité (73%) utilise ces imports de données pour la création et la mise à jour des fiche des thèses en préparation dans Step tandis qu’une minorité des répondants (27%) utilise les imports uniquement pour la création, les données étant ensuite complétées manuellement dans les formulaires.

Le plus grand nombre (69%) des utilisateurs du service d’import de données effectue ses imports depuis le module thèse d’Apogée de l’AMUE (import par Web services), l’autre partie les effectuant depuis l’application ADUM (26,9%).

9 personnes ont décrit en détail les problèmes rencontrés, particulièrement avec les imports depuis le logiciel de l’AMUE, Apogée :

  • créations de doublon pour certains établissements ayant un double circuit d’alimentation (import depuis Apogée dans Step et saisie manuelle uniquement dans Star) ;
  • difficulté d’avoir un scénario d’import en « multiflux » (import depuis une source A dans Step et depuis une source B dans Star) : création de doublon et problème lors de l’export des données vers Star ;
  • problème lié au workflow de l’application Step : écrasement des données saisies manuellement par le doctorant (résumé, mots-clés..) et des liens IdRef (directeur, partenaire de recherche..) dans l’éditeur de Step, à chaque nouvel import de données.

Des pistes d’amélioration pour les imports

Des propositions d’amélioration ont émergé et vont être étudiées par l’ABES comme, par exemple, la protection de certaines zones dans l’éditeur de Step (résumés et des mots-clés) et l’envoi par mail au correspondant Step des messages d’erreur du service d’import, fonctionnant par web service.

D’autres améliorations sont liées à l’utilisation d’Apogée et ne relèvent pas de l’ABES (comme la possibilité d’accepter des codes SISE non présents dans la liste fermée fournie par Apogée ou l’amélioration de la gestion des doublons quand les saisies sont très différentes entre deux sources de données).

Améliorer le cercle vertueux de la communication

11 personnes ont émis des suggestions pour améliorer les échanges d’information :

  • rappel aux doctorants via leur adresse mail personnelle et institutionnelle pour la mise à jour de leurs données diffusées sur theses.fr
  • information par mail des doctorants sur les fonctionnalités de Step et la visibilité des données de thèses en préparation sur theses.fr (plaquette d’information sur Step, interactions avec l’application Star pour les thèses soutenues, sensibilisation en amont sur la nécessité de fournir un document archivable au Cines…).

Une liste de discussion peu utilisée

graphique3Comme pour les autres réseaux de l’ABES (ex : Star, coordinateurs thèses…), une liste de discussion est à la disposition des correspondants du réseau Step pour favoriser les échanges entre établissements sur les pratiques. La moitié des répondants (49%) ne se sent pas concernée par cet outil et signale le manque de temps comme frein à son utilisation (pour 38%).

Des pistes d’informations à partager

Des suggestions ont été apportées concernant le type d’informations que les établissements souhaiteraient que l’ABES diffuse :

  • constituer un argumentaire en faveur du signalement des thèses en préparation à destination des doctorants et aussi en direction des écoles doctorales et des services de la Recherche, notamment pour une généralisation de ce signalement aux « sciences dures » ;
  • mettre en avant, sur le site web de l’ABES ou la FAQ d’ABESstp, les réponses aux questions posées fréquemment sur le guichet d’assistance par les établissements de soutenance et les doctorants ;
  • informations sur la règlementation (bien qu’il existe déjà le Guide du Doctorant 2013 – versions pdf et .doc – qui donne ces informations…) ;
  • indications typographiques à l’intention des doctorants en cours de rédaction de leur thèse ;
  • informations sur l’exhaustivité du signalement des thèses en préparation sur theses.fr. Il existe toutefois une liste des établissements habilités et l’indication de leur participation ou non à STEP. Précisons qu’à la différence du signalement des thèses soutenues qui est une obligation légale, le signalement des thèses en préparation est une option stratégique pour valoriser la recherche doctorale d’un établissement habilité sur le moteur de recherche theses.fr ;
  • faire un état des établissements en production dans STEP avec leurs paramétrages (type d’alimentation, source d’import de données…).

« Rien à signaler sur les données de theses.fr ? »

graphique4Ce bouton permet à un utilisateur de theses.fr de signaler dans un formulaire une erreur sur la description d’une thèse en préparation. Un mail est alors envoyé directement au correspondant Step de l’établissement concerné pour traitement de la demande. La moitié des établissements affirme recevoir plusieurs fois par mois ce type de demande et les traite dans 75% des cas. Ceux qui ne traitent pas les demandes évoquent comme raison une orientation de la demande vers un mauvais destinataire (or, c’est bien au destinataire, correspondant Step, d’orienter la demande vers la personne habilitée) ou le manque de temps. L’autre moitié des établissements n’en reçoit jamais. L’hypothèse explicative serait que la moitié des données des établissements sont de bonne qualité et n’ont pas besoin de mises à jour tandis que l’autre moitié serait perfectible.

Conclusion et suite à l’enquête

Au regard des réponses à cette enquête et aux nombreux commentaires détaillés fournis, les attentes vis-à-vis de l’ABES semblent être davantage d’ordre stratégique (ex : argumentaire et communication sur l’intérêt de diffuser les données de thèses en préparation sur theses.fr) que fonctionnelle (ex : aide à l’utilisation de l’application ou évolution de celle-ci), si ce n’est sur l’amélioration du service d’import de données. C’est dans ce sens que l’ABES envisage les suites à donner à cette enquête auprès du réseau Step.

Être un service libéré, tu sais c’est pas si FACILE…

Synthèse de l’enquête sur les pdf de thèses valides pour un archivage au CINES

velo_facile

Dans le cadre d’un échange entre l’ABES et le CINES, une enquête a été menée auprès des correspondants STAR du 17 au 31 mars 2015. Celle-ci avait pour but de mieux connaître comment les établissements procèdent pour fournir des pdf valides de thèses soutenues pour un archivage au CINES.Le service FACILE mis en place par le CINES a pour objet de valider le format d’archivage du CINES par analyse et expertise et comprend 2 niveaux.
Les demandes d’analyse de niveau 2 de FACILE [https://www.cines.fr/archivage/des-expertises/expertise-formats/facile/] ayant connu ces derniers mois une forte augmentation,  le CINES a souhaité pouvoir réfléchir à un accès possible sur authentification pour ses utilisateurs. Cette piste d’un accès sur authentification a finalement été abandonnée par le CINES qui reste sur le même principe qu’auparavant c’est-à-dire un accès … libre, libéré…

En effet, des améliorations ont été constatées dans l’usage de FACILE suite aux dernières modifications du service (ajouts de tutoriels notamment). Le CINES reste toutefois attentif au nombre de sollicitations via FACILE2.

Que cela ne vous empêche pas de prendre connaissance des résultats de l’enquête :

  • Participation des établissements en production dans STAR à l’enquête menée par l’ABESparticipation

L’ABES a reçu 68 réponses sur les 97 réponses attendues de la part des établissements en production dans STAR soit une participation active des établissements avec un taux de réponse de 70%. Merci à eux !

Quatre questions étaient posées aux correspondants STAR des établissements habilités à délivrer le doctorat :

1) Quelle utilisation d’Adobe Acrobat Pro faites-vous, en tant que correspondant STAR de votre établissement?

Utilisation_Adobe

L’utilisation dans les établissements d’Adobe Acrobat pro pour les besoins du correspondant STAR est assez répandue. 47 établissements sur les 68 ayant répondu l’utilisent ce qui signifie une utilisation par 69% des établissements. Toutefois 2 établissements ont l’outil dans leur établissement mais ne l’utilisent pas en tant que correspondant Star tandis que 2 établissements signalent ne pas être pleinement satisfaits de cet outil.
L’équipement et l’utilisation d’Adobe Acrobat Pro par tous les établissements ne suffirait donc certainement pas à réduire à son minimum le recours au service Facile niveau 2. Le recours à Adobe Acrobat Pro n’est donc pas suffisant pour régler tous les problèmes de format rencontrés par les établissements.

2) Mettez-vous à disposition des doctorants un accès à un PC équipé d’Adobe Acrobat Pro dans votre établissement?
Mise_disposition_doctorants

Peu d’établissements, 7 sur 68, soit un taux de 10%, offrent cette possibilité aux doctorants. Cette possibilité est jugée peu adaptée aux pratiques des doctorants par un établissement.

3) Si oui, quelle version d’Adobe Acrobat Pro est utilisée par vous ou vos doctorants ?

Versions_Adobe

Parmi les 47 établissements utilisant l’outil Adobe Acrobat Pro, la version 11 est utilisée majoritairement par 22 établissements soit un taux d’utilisation de 46%. C’est ensuite la version 10, utilisée par 15 établissements, soit 31%, qui arrive en seconde position tandis que les versions 7, 8 et 9 arrivent en fin de peloton.

4) Si non, quel autre outil est utilisé par vous ou vos doctorants ?

Autres_Outils

Les établissements cumulent en général l’utilisation de plusieurs outils pour résoudre les problèmes rencontrés pour obtenir un pdf valide. Il s’agit principalement de deux outils :

  • l’outil développé par l’Ecole des Mines de Paris https://pdfstar.mines-paristech.fr/ est utilisé par 27 établissements soit une utilisation de l’ordre de 39%,
  • pdf Creator est utilisé par 23 établissements soit une utilisation par les répondants à l’enquête de l’ordre de 33%.
    Les imprimantes virtuelles (Word, Libre Office …) sont utilisées par 11 établissements. A la marge sont également cités d’autres outils : Imprimantes virtuelles, Latex, Ghost Script, Small pdf…

Sonate_facile_la_majeur

Sonate facile la majeur (Mozart)

BACON et la labellisation des données : à quelle aune mesure-t-on la qualité d’un fichier KBART ?

rvb-sloganLa recommandation KBART  , portée par la NISO, a une immense qualité : elle est relativement simple à comprendre et à implémenter. Un fichier KBART doit répondre à des exigences très peu contraignantes de prime abord : des intitulés de colonnes normalisés et parlants (‘publication_title’, ‘first_author’, …), une sortie sous la forme d’un fichier .txt, format universel s’il en est, encodage en UTF-8,… Faire un fichier KBART à la main  n’est donc pas compliqué en soi. La première vérification faite  à l’ABES consiste donc à vérifier que le fichier fourni par un éditeur remplit bien toutes les obligations pour qu’il soit conforme à la recommandation KBART. Sans entrer dans les détails de la recommandation, soulignons ici que nous sommes particulièrement vigilants sur les points suivants :

•    Nom du fichier normalisé (Editeur_consortium/région_package_date.txt)
•    Encodage UTF-8
•    Fichier tabulé (.tsv, .csv, .ssv)
•    Présence des 25 colonnes obligatoires
•    Colonnes correctement nommées
•    Colonnes correctement remplies (respect de la norme ISO 8601 pour les dates, de la description de la volumaison, des valeurs fermées le cas échéant,…)

Les difficultés émergent lorsque l’on essaye de confronter la simplicité apparente de la recommandation avec la réalité, parfois tordue il est vrai, des plates-formes   de périodiques et ou de livres en ligne. KBART est simple, simpliste si on le compare au MARC. La version 2 de la recommandation améliore sa précision (prise en compte des livres électroniques, de l’open access, de l’histoire d’un périodique), sans doute au détriment de sa facilité d’implémentation qui heureusement reste élevée, mais elle n’est toujours pas en mesure de décrire les cas complexes  .
Ce n’est pas un problème en soi : KBART se focalise sur l’accès à des ressources qui peuvent – et doivent – être décrites dans des formats adaptés si on veut en présenter toute la richesse et la complexité. Pour autant, pour que cette complémentarité     entre description bibliographique (MARC) et métadonnées permettant l’accessibilité aux documents (KBART) puisse se faire, deux éléments sont impératifs au niveau du fichier KBART:

•    La description de l’accès à la ressource doit être pertinente : le champ title_url doit effectivement pointer vers la ressource, le champ title_id doit permettre de comprendre comment se structurent les liens d’accès aux volumes, fascicules, articles ou chapitres de la ressource.
•    Les identifiants utilisés (ISSN et ISBN) doivent être corrects et le découpage de l’histoire d’une revue en ses différents avatars doit se retrouver en ligne, comme d’ailleurs le stipule une autre recommandation, PIE-J.

L’analyse effectuée par l’ABES pour vérifier la qualité de ces données débouche sur un diagnostic transmis à l’éditeur qui sait alors précisément par où ses métadonnées pèchent. S’ensuit un dialogue avec ce dernier, voire un accompagnement de ses équipes techniques qui doit aboutir à une mise à jour de la plate-forme, processus qui peut être long et difficile (sous-traitance, restructuration de certains contenus,…). A l’issue de ce dialogue et au vu des améliorations apportées par l’éditeur, l’ABES peut alors attribuer le label de qualité de données, preuve de l’engagement de l’éditeur dans sa démarche globale d’amélioration de description et de signalement de son contenu. Si un éditeur ne peut que fournir un fichier KBART syntaxiquement correct mais ne respectant pas les recommandations plus fines de description, il verra ses fichiers intégrés dans BACON  tels quels et sans label, puisqu’il n’est pas question de modifier les fichiers se rapportant à des produits en abonnement courant.
La démarche est un peu différente pour les bouquets ISTEX. Dans ce cas, les fichiers KBART sont générés non pas par l’éditeur mais par l’équipe du Hub de métadonnées de l’ABES. Les découpages de revues qui ne sont pas présents sur le site de l’éditeur sont quand même indiqués sur le fichier KBART  . L’inconvénient de cette pratique est que la matière première utilisée, les listes contractuelles et le SUDOC, ne permettent pas par exemple de retrouver systématiquement toutes les informations de volumaison , notamment le numéro du premier volume/fascicule appartenant à une revue que l’éditeur n’a pas identifié comme telle (l’équipe du HUB est cependant en train de tenter de régler ce problème en agrégeant les informations trouvées dans les métadonnées d’articles). Son avantage en revanche est de pousser les éditeurs à s’interroger sur leurs pratiques  et à les faire éventuellement évoluer, comme est en train de le faire la Royal Society of Chemistry. En ce sens la démarche adoptée par le HUB rejoint celle de BACON.

Dans un prochain billet, nous expliquerons en détail comment nous réalisons les différentes vérifications.

CERCLES : un corpus supplémentaire

L’expérimentation CERCLES (Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur) s’est construite à partir de la demande formelle de 4 établissements, qui portaient un projet sur un corpus bien défini. Pourtant, il y a déjà deux ans, avant même que ces demandes soient formulées, la Fondation Maison des Sciences de l’Homme (FMSH) de Paris avait émis le souhait de participer à un travail collaboratif d’enrichissement des notices Sudoc, si d’aventures l’ABES mettait en place un tel dispositif.

Un corpus supplémentaire

by Horia_Varlan_CC_BY_2_0_via Flick’r

La finalisation de cette participation a duré un petit plus de temps qu’avec les 4 établissements déjà cités dans les précédents billets, mais aujourd’hui, la FMSH a bel et bien rejoint le dispositif, comme prévu dès l’origine, et a commencé son travail, en suivant les mêmes méthodes et consignes que ses « co-cerclés » : signature de l’acte d’engagement, définition des axes d’enrichissements, complétude d’un journal de bord collaboratif.

Voici le détail de son engagement dans CERCLES :

Fondation Maison des Sciences de l’Homme

  • Corpus : e-books Cambridge University Press – 877 notices
  • Période de travail : février 2015 – mai 2015
  • Responsables du chantier : Jeanne Longevialle et Fabrice Mouillot
  • Référents ABES : Ilhem Addoun Poliakow
  • Points forts du chantier : création ou amélioration des liens 452, 6XX, 7XX ; création des notices d’autorités et de collection électronique manquantes ; émission des demandes de numérotation ISSN.
  • Méthodologie : pas de division du travail en « type de correction », chaque notice est traitée et enrichie dans sa globalité.
  • Les « + » du chantier :
    • collaboration avec l’éditeur en amont pour qu’il fournisse des notices conformes aux demandes du Sudoc
    • création d’un script
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • expertise, conseil et dépannage

Quels sont donc les corpus pris en charge ?

Les 5 corpus CERCLES (au 01/05/2015)

Comment participer à CERCLES ?

Rappel de la consigne :

Si vous souhaitez intervenir sur des notices d’un des corpus CERCLES, vous le pouvez, à condition d’en informer l’établissement en charge du corpus, avant toute action, et d’y travailler de concert avec lui.

Un très bel exemple de collaboration s’est ainsi mis en place, entre le SCD de Picardie et le SID2 Grenoble, sur le corpus Cairn : Grenoble s’est chargé d’une partie des créations des notices de collection liées aux notices d’e-books pris en charge par Amiens.

Ce corpus, très volumineux (près de 5000 notices à traiter), aurait besoin qu’un autre établissement s’associe au SCD de Picardie. Y aurait-il des volontaires ?

Il est temps de réfléchir ensemble à l’organisation du dispositif CERCLES  au-delà de la période d’expérimentation. Il semble remporter l’adhésion des établissements Sudoc : des établissements nous ont déjà fait part de leur envie d’y participer. Il serait logique que le dispositif soit maintenu, élargi et qu’il trouve sa place dans le fonctionnement normal du réseau Sudoc. Quel rôle souhaiteriez-vous que l’ABES endosse ? Pensez-vous qu’elle devrait assurer, en plus de la coordination, l’expertise sur les données, sachant que celle-ci se retrouve de plus en plus dans un réseau où les compétences des catalogueurs pourraient être mieux exploitées ? Seriez-vous favorable à une intégration à CERCLES par parrainage, où un établissement actif du dispositif dirigerait le travail d’un nouveau-venu ? Devrait-on créer la fonction « correspondant CERCLES », ou renforcer d’une mission « contrôle qualité » la fonction du correspondant catalogage ?

Les Journées ABES nous donneront l’occasion d’engager le débat, avec la séquence « Actualités » (qui proposera un bilan du dispositif) et l’atelier collaboratif « JABESCamp », où chacun pourra partager son avis. Mais d’ores et déjà, les commentaires que vous déposerez sous ce billet alimenteront la réflexion.

IdRef : ORI-OAI, première application externe cliente

La plate-forme ORI-OAI, conçue pour gérer la production numérique institutionnelle d’établissements de l’Enseignement supérieur et de la recherche, propose une nouvelle version du module ORI-OAI-md-editor (version 1.8.3). L’une des nouvelles fonctionnalités de l’outil permet, tout en restant connecté à ORI-OAI, de rechercher, trouver ou créer dans IdRef les autorités Personnes, Collectivités, etc. nécessaires à la description catalographique des thèses.

Pour récupérer cette nouvelle version, il suffit de faire un checkout du module ORI-OAI-md-editor depuis la version 2.0 du projet ORI-OAI.

Principes et fonctionnements

Le principe est similaire à celui utilisé dans l’interfaçage de STAR à IdRef : si un n°PPN est requis dans un champ du formulaire de thèse, l’icône « Lier à l’autorité Sudoc »  est proposée. Ce lien ouvre l’application IdRef dans une iframe (fenêtre intégrée à la page de travail). Le cartouche de recherche est préparé pour que l’opérateur lance la recherche.

Si la recherche est fructueuse, il suffira de cliquer sur le bouton « Lier la notice » en bas de la notice. Alors l’iframe se ferme. Le formulaire de thèse revient en avant-plan et les données utiles sont maintenant présentes dans les champs à remplir.

Dans le cas où l’autorité recherchée n’existe pas encore dans le référentiel, il convient de la créer. Cela se fait avec beaucoup de facilité puisque les données présentes dans la fiche de thèse et intéressant l’autorité sont pré-remplies automatiquement : PPN, date de naissance, nom, prénom, etc. A l’inverse, si les données sont saisies durant la création de l’autorité, elles seront poussées dans les champs correspondants du formulaire TEF d’ORI-OAI lors du liage.

Comprendre le workflow 

ori01

ori-02

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ori-03

ori-04

ori-05

ori-07

Qui est concerné ?

Cette fonctionnalité est déjà en production à Valenciennes. Tous les établissements qui référencent leurs thèses depuis ORI-OAI peuvent utiliser ce service, comme par exemple, l’Université de Lorraine, l’Université Lille 1 Sciences et Technologies, l’Université de Rennes 1, l’Université Paris 2 Panthéon-Assas…

Jacques Brassart, coordinateur fonctionnel du projet ORI-OAI,

Yohan Colmant, coordinateur technique du projet ORI-OAI

Comment « CERCLES » se met en place

by_Horla_Varlan__CC_BY_2_0_via Flick'r

by_Horla_Varlan__CC_BY_2_0_via Flick’r

Il y a un mois, ce billet dévoilait les grands principes de l’expérimentation CERCLES (Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur). Les 4 établissements pilotes se sont mis en ordre de bataille, et l’ABES les accompagne : l’accord de participation (qui valide les engagements de chaque partie) est signé, les référents « ABES » pour chaque établissement et chaque corpus sont désignés, les premiers contacts ont été pris, et le chantier est parfois bien avancé. Voici des nouvelles des 4 premiers « cercles » :

SCD de l’université Paris Est Créteil

  • Corpus : périodiques Oxford University Press – 250 notices
  • Période de travail : janvier 2015 – mars 2015
  • Responsables du chantier : Ewa Nieszkowska, Hélène Pipet
  • Référent ABES : Ilhem Addoun Poliakow
  • Points forts du chantier : création ou amélioration des liens 4XX , 6XX, 7XX ; émission des demandes de numérotation ISSN
  • Méthodologie :
    • phase 1 : les liens 4XX.  À 20 liens par heure, 408 liens ont été établis, sur 20,5 heures de travail (3 jours ETP)
    • phase 2 (en cours)  : les liens 6XX et 7XX. Ce sont les liens aux autorités collectivités (et les créations afférentes) qui se révèlent les plus complexes (5 Tb créées à l’heure, en moyenne).
    • phase 3 (à venir) : numérotation ISSN, et déjà un questionnement sur la possibilité de fusions de notices pré-existantes lors des chargements de notices ISSN.
  • Les « + » du chantier :
    • création d’un journal de bord, partagé avec l’ABES, pour consigner au jour le jour son travail, ses questions à poser à l’ABES, ses galères, ses joies
    • collaboration avec d’autres établissements : le CR 26, pour les demandes de numérotation ; des SCD du réseau, lorsqu’au hasard d’une notice, on propose une délocalisation
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • export de notices à la demande du SCD
    • liaison avec des SCD concernés par des délocalisations
    • expertise, conseil et dépannage

Bibliothèque Diderot de Lyon

  • Corpus : e-books Classiques Garnier – notices des imports mensuels
  • Période de travail : 6 mois après le premier import
  • Responsables du chantier : Marion Ringot
  • Référent ABES : Dominique Esmenjaud
  • Points forts du chantier : création ou amélioration des liens 452 , 6XX, 7XX
  • Méthodologie :
    • réunion de cadrage avec l’ABES : accord sur les collections à inclure dans le périmètre
    • la BDL enrichit les notices du fichier d’import mensuel
  • Les « + » du chantier :
    • collaboration ABES / Garnier pour mettre en place les imports mensuels
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • mise en place d’une procédure d’import mensuel des mises à jour
    • expertise, conseil et dépannage

SCD de l’université Jules-Verne Picardie

  • Corpus : e-books Cairn- 4864 notices
  • Période de travail : avril 2015 – avril 2016
  • Responsables du chantier : Aurélie Bec
  • Référent ABES : Kattialyn Gossiaux
  • Points forts du chantier : création ou amélioration des liens 7XX : création des notices d’autorités si nécessaire
  • Les « + » du chantier :
    • collaboration avec le SID2 de Grenoble, pour la création de notices Od associées à certains titres du corpus et avec le CR 69, pour les demandes de numérotation
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • mise en relation avec le SCD « partenaire »
    • expertise, conseil et dépannage

SCD de l’université François-Rabelais Tours

  • Corpus : e-books Open Edition- 1621 notices
  • Période de travail : février 2015- à préciser
  • Responsables du chantier : Véronique Lacan
  • Référent ABES : Olivier Rousseaux
  • Points forts du chantier : création ou amélioration des liens 4XX , 6XX, 7XX ; création des autorités auteurs
  • Méthodologie :
    • phase 1 : analyse des corrections et propositions d’actions à valider par l’ABES
    • phase 2 : définition des priorités en concertation avec l’ABES
  • Les « + » du chantier :
    • analyse raisonnée et préalable
  • L’apport de l’ABES :
    • constitution d’un ficher témoin, pré-chantier, pour pouvoir établir ensuite un différentiel
    • expertise, conseil et dépannage

Trop tôt pour le bilan, mais déjà des pistes …

À chaque établissement sa méthode, son rythme et son calendrier ! Conduire le chantier seul ou à deux, définir un plan d’action préalable ou avancer en faisant, il n’y a pas de règles définies. L’heure des bilans viendra, il s’agit pour l’instant de ne pas freiner cet élan positif. Ce qui commence à se dessiner, c’est le rôle de l’ABES : plutôt que de valider, il consiste à faciliter (export de notices à la demande, mise en relation avec d’autres établissements, résolution de problèmes sur une notice) et à accompagner (compte-rendu au réseau, mise à disposition d’outils). Il sera à consolider à la lumière des premiers retours effectués par les établissements CERCLES eux-mêmes.  Mais l’ABES commence à anticiper sur ce qui suivra cette phase d’expérimentation, et sur la façon d’élargir « CERCLES » aux autres réseaux. Aux établissements du réseau Thèses, par exemple, il est actuellement proposé d’enrichir les notices de thèses du Sudoc pour améliorer leur visibilité dans theses.fr (plus d’infos ICI).

Que peuvent faire les autres établissements Sudoc intéressés, pendant cette expérimentation ?

  • contacter l’ABES pour rejoindre le dispositif CERCLES ?

OUI. Des établissements se sont manifestés via twitter, via ce blog ou par mail. Des consignes précises pour contribuer seront données, lors des Journées ABES. D’ici-là, un autre établissement va rejoindre le dispositif : la Fondation Maison des Sciences de l’Homme de Paris, qui travaillera sur le corpus des e-books Cambridge University Press (plus d’infos ici).

  • participer, indirectement ?
Image Un cercle dans le cercle

Un cercle dans le cercle (By Lucy Nieto CC-BY-NC 2.0 via Filck’r)

OUI. C’est déjà le cas pour Grenoble 2 (cf plus haut) qui, souhaitant travailler sur un corpus CERCLES, a pris contact avec l’ABES pour savoir dans quelle mesure il était « autorisé » à intervenir. Ne risquait-il pas de doublonner avec le SCD de Picardie, ce qui aurait été contraire au but même poursuivi par CERCLES : la mutualisation ? Certes, la priorité est donnée à l’établissement qui porte le chantier, mais rien n’interdit de lui prêter main forte. L’établissement porteur peut ainsi devenir à son tour un référent, pour l’établissement qui souhaite collaborer. Et prendre la tête d’un petit cercle de contributeurs. La dynamique du cercle vertueux, qu’on souhaite créer avec ce dispositif, s’en trouve facilitée.

La consigne suivante est donc à passer dans les établissements :

 « Si vous souhaitez intervenir sur des notices d’un des corpus CERCLES, vous le pouvez, à condition d’en informer l’établissement en charge du corpus, avant toute action, et d’y travailler de concert avec lui ».

Webservice AlgoSudoc : prendre connaissance et remédier aux anomalies de chargement des données Sudoc dans theses.fr

Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

« Nous sommes en 2015 après Jésus-Christ. Toutes les thèses de doctorat soutenues en France depuis 1985 sont recensées dans theses.fr… Toutes ? Non ! Un lot d’irréductibles notices Sudoc résiste encore et toujours à l’algorithme de chargement. Et la vie n’est pas facile pour les garnisons de catalogueurs des bibliothèques retranchés dans les établissements de soutenance.« 

En mai 2013, les données du Sudoc ont été chargées dans le moteur de recherche theses.fr. Un précédent billet liste (de manière non exhaustive) les raisons pour lesquelles certaines notices n’ont pas pu être chargées.
Au-delà de l’énoncé de ces quelques principes, le programme de versement des données Sudoc restait une boite noire pour les catalogueurs. Vous avez été nombreux à nous réclamer via le guichet d’assistance des explications sur le non-chargement de telle ou telle notice, souvent à la demande d’un directeur de thèse qui constatait que theses.fr ne recensait pas la totalité des thèses qu’il a dirigées. Nous vous avons répondu au cas par cas, en vous promettant une liste de toutes les notices en erreur.

Ce service est désormais (enfin !) disponible. L’ABES a développé un webservice baptisé AlgoSudoc permettant de générer à la demande un « rapport dynamique de chargement des données Sudoc dans theses.fr ». Ce rapport est un fichier .csv contenant les résultats des tests de l’algorithme. Ces tests portent principalement sur la qualité de la notice décrivant la thèse originelle (codée 105$bm) et sont divers et variés (présence, structure et unicité du numéro national de thèse, structure de la note de thèses…). Pour chaque PPN en anomalie, le catalogueur est invité à corriger la notice dans WinIBW ; le rapport dynamique lui suggère d’intervenir à tel ou tel endroit de la notice.
Aujourd’hui, des dizaines de milliers d’anomalies sont détectées, y compris pour les thèses soutenues après 1985. Face à l’ampleur de la tâche, il est nécessaire d’organiser le travail de correction. En utilisant des paramètres dans l’url de génération du rapport dynamique, il est possible de définir un lot précis (par exemple, toutes les notices de thèses localisées avec un RCR donné).

La documentation sur ce webservice est ici. Un J-e.cours de présentation de ce service aura lieu le 12 mars.

Nous espérons que ce webservice sera l’occasion pour les établissements de mettre en place des chantiers de corrections ciblés, un peu comme le traitement des ebooks de droit international achetés dans le cadre d’ISTEX  ou plus récemment comme dans la démarche des CERCLES (Correction et Enrichissement par le Réseau de Corpus de L‘Enseignement Supérieur) .
Il est évident que dans un corpus centré sur les thèses, composé de notices qui bien souvent sont des unicas, les bibliothèques des établissements habilités à délivrer le doctorat ont une responsabilité particulière.
L’ABES vérifiera régulièrement l’avancement des corrections de manière globale. Par ailleurs, l’ABES prend à sa charge un certain nombre de traitements (qui n’apparaissent pas dans les rapports dynamiques) et ne s’interdit pas de mettre en place de nouveaux contrôles, notamment sur l’absence de liens entre notices bibliographiques et notices d’autorité (tests qui eux apparaitront dans les rapports dynamiques).

Un jour, à terme, ce webservice devrait être inutile : plus aucune anomalie ne devrait être détectée par l’algorithme.

Les irréductibles notices Sudoc n’ayant pas de potion magique, elles seront vaincues par les armées de catalogueurs !

IMR