CERCLES : tous concernés !

  • Auteur/autrice de la publication :
  • Post category:Sudoc

 Mon établissement n’est pas dans CERCLES. En quoi suis-je alors concerné par ce dispositif ?

Le dispositif CERCLES est le premier dispositif formalisé d’enrichissement collaboratif au sein du réseau Sudoc. Les établissements volontaires prennent en charge un corpus, et concentrent leur activité d’enrichissement des notices sur ce seul corpus. Au niveau du réseau, la charge de travail est mieux répartie, et les corpus qui bénéficient d’un travail d’enrichissement programmé sont mieux identifiés.

Le résultat sert la communauté. Tout membre du réseau Sudoc est donc concerné par CERCLES, que son établissement soit actif dans le dispositif ou pas.

Continuer la lectureCERCLES : tous concernés !

Synthèse de l’enquête sur la fonction de coordinateur thèses

20160115_163200

L’enquête auprès des coordinateurs thèses : raison d’être et accueil

Le dispositif de valorisation des thèses de doctorat s’est consolidé en 2011 avec la mise en production du moteur de recherche theses.fr et de l’application Step, venues compléter les services déjà apportés par l’application Star et le Sudoc. La fonction de coordinateur thèses a été mise en place au même moment. L’objectif de cette fonction est qu’un établissement dispose d’une vue globale sur la gestion des thèses et d’un interlocuteur assurant la transmission de l’information entre les différents intervenants dans les applications liées aux thèses. L’ABES a donc ressenti le besoin, 4 ans après la mise en place de ce dispositif, de faire un bilan sur les retours d’expérience des établissements et de recenser les suggestions sur les moyens de faciliter l’action des coordinateurs thèses.
L’enquête à destination des coordinateurs thèses a été lancée par l’ABES du 15 septembre au 31 octobre 2015. L’enquête comportait 21 questions.
71 réponses exploitables ont été obtenues soit un taux de participation à l’enquête de 63%. 112 coordinateurs thèses sont en effet comptabilisés en janvier 2016. Les coordinateurs thèses ayant répondu à l’enquête ont majoritairement été nommés en 2011 (30%) et 2013 (22%). Voici une synthèse des réponses obtenues :

Continuer la lectureSynthèse de l’enquête sur la fonction de coordinateur thèses

CERCLES : Retour d’expérience de La Sorbonne & l’École Française d’Athènes

  • Auteur/autrice de la publication :
  • Post category:Sudoc

[ndlr : ce post concerne un chantier précis : De Gruyter Classical Studies 2011-2014. Depuis, un autre chantier a été engagé, et terminé : De Gruyter Classical Studies 2015-2016. Le récit de ce dernier chantier est disponible ici.]

L’engagement BIS / EFA

CERCLESLa Bibliothèque Interuniversitaire Sorbonne (BIS) et l’École Française d’Athènes (EFA), rejoignent le dispositif CERCLES en juillet 2015 et s’engagent à corriger les notices des bouquets 2011 à 2014 des Classical Studies publiés par De Gruyter. Ces e-books ont été acquis par le CADIST Antiquité pour les usagers des deux établissements.

Délimitation du périmètre d’action :

  • Corpus De Gruyter, Classical studies : 288 notices à traiter
  • Bouquets 2011, 2012, 2013 et 2014
  • Répartition par établissements :
    •      EFA : bouquet 2014
    •      BIS : bouquets 2011, 2012, 2013
  • Calendrier prévisionnel établi d’après une estimation du temps de travail par notice : 40 minutes en moyenne
  • Début du chantier : août 2015
  • Fin du chantier : fin novembre 2015
Continuer la lectureCERCLES : Retour d’expérience de La Sorbonne & l’École Française d’Athènes

CERCLES : retour d’expérience de la FMSH

  • Auteur/autrice de la publication :
  • Post category:Sudoc
Un premier chantier terminé
Un premier chantier terminé

Pour un signalement collectif des ebooks

À la bibliothèque de la Fondation Maison des sciences de l’homme, l’accroissement de l’achat d’ebooks à titre pérenne en bouquets, et la volonté de valoriser ces achats par un signalement titre à titre qui soit à la fois de qualité et partagé dans le catalogue collectif du Sudoc, nous a amené à rejoindre en mars 2015 l’expérimentation CERCLES lancée par l’ABES.

Une question sur SUCAT…

Dès novembre 2014, sur la liste SUCAT, en réponse à une question au sujet de la complétude des notices de ressources électroniques, nous avions en effet pointé le risque pour le réseau des bibliothèques universitaires et de recherche, de voir le Sudoc rater le tournant numérique pour les ouvrages, si les bibliothèques qui y participent n’y signalaient pas leurs bouquets d’ebooks, et souligné l’utilité du catalogue collectif national pour toute politique documentaire cohérente quel que soit son niveau (local, COMUE, national, …). Nous ne pouvions que soutenir la volonté de l’ABES d’associer les forces du réseau à sa propre action en promouvant  le partage du travail au sein du réseau.

Continuer la lectureCERCLES : retour d’expérience de la FMSH

CERCLES : 4 nouveaux corpus

  • Auteur/autrice de la publication :
  • Post category:Sudoc
by_Horla_Varlan__CC_BY_2_0_via Flick'r
by_Horla_Varlan__CC_BY_2_0_via Flick’r

Ceux d’entres vous qui ont assisté à la séquence « Actualités de l’ABES », lors des Journées ABES 2015, se rappellent qu’il a beaucoup été question de qualité des données et de mutualisation du travail.

Le dispositif CERCLES a fait l’objet d’un premier bilan (pour revoir la séquence, c’est ICI – à partir de 21mn20s).

Il est possible que ce bilan ait convaincu de nouveaux établissements, ou ait simplement conforté ceux qui s’étaient déjà inscrits sur une « liste d’attente ». Quel que soit l’élément déclencheur, nous pouvons annoncer aujourd’hui l’entrée de 4 nouveaux établissements dans le dispositif, et de 4 nouveaux corpus.

Continuer la lectureCERCLES : 4 nouveaux corpus

OpenRefine ou comment passer des listes aux applications Abes : illustration avec IdRef et theses.fr ?

  • Auteur/autrice de la publication :
  • Post category:Non classé

Problématique de départ : Comment passer une liste de paramètres à IdRef en entrée afin d’obtenir en sortie un type d’informations recherchées ? Par exemple, comment obtenir les identifiants IdRef d’une liste de personnes pour lesquelles on dispose du nom et du prénom ?

Condition : Il va de soi qu’il est exclu pour résoudre ce problème de passer ces noms-prénoms un à un dans l’interface de recherche IdRef.

Hypothèse : IdRef dispose d’un service d’interrogation sous forme de web services Solr à l’adresse suivante : http://www.idref.fr/Sru/Solr

Résolution

import   La première étape consiste à importer les données de base.

 

 

 

 

 

 

import2

 

Un premier traitement,  simple mais essentiel, consiste, pour chacune des colonnes de départ, à « ôter tous les espaces en début et fin de chaine de caractères ». Ensuite, on construit une colonne NomComplet dans laquelle le nom et le prénom sont séparés par une virgule et un espace. Si  ce n’est déjà fait, il convient également de passer le tout en minuscule.

 

 

 

import3A partir de cette mise en forme – opération indispensable du fait que l’index Solr est construit ainsi – il sera possible de requêter l’index « Personne » d’IdRef avec la fonctionnalité « by fetching URL » et une expression rédigée dans le langage GREL propre à OpenRefine dans le menu « Apply » :

 

Exemple de code GREL :

{

"op": "core/column-addition-by-fetching-urls",

"description": "Create column jsonidref at index 3 by fetching URLs based on column NomComplet using expression grel:\"http://www.idref.fr/Sru/Solr?q=persname_s:\"+replace(value, ' ', '\\\\%20')+\n\n\"*&sort=score%20desc&version=2.2&start=0&rows=30&indent=on&fl=id,ppn_z,recordtype_z,affcourt_z&wt=json\"",

"engineConfig": {

"facets": [],

"mode": "row-based"

},

"newColumnName": "jsonidref",

"columnInsertIndex": 3,

"baseColumnName": "NomComplet",

"urlExpression": "grel:\"http://www.idref.fr/Sru/Solr?q=persname_s:\"+replace(value, ' ', '\\\\%20')+\n\n\"*&sort=score%20desc&version=2.2&start=0&rows=30&indent=on&fl=id,ppn_z,recordtype_z,affcourt_z&wt=json\"",

"onError": "store-error",

"delay": 50

},

La réponse obtenue en format json contient (ou pas) les paramètres recherchés. Ici, par exemple, seule la troisième ligne contient l’identifiant souhaité. Cette dernière colonne est obtenue en « parsant » le json.

La question essentielle est celle de la fiabilité de la réponse obtenue. Pour répondre à cette question, il faut revenir au point de départ : de qui est constitué mon corpus de personnes au départ ? S’il est composé de directeurs de thèses, comme c’est le cas pour les données ADUM pour lesquels l’opération d’alignement est en cours (Voir Fil’ABES), alors le requêtage de theses.fr peut donner des résultats dont le taux d’erreur est presque nul.

Et la suite ???

Pour disposer de toute une gamme d’idées et de codes OpenRefine dédiés au requêtage des données mises à disposition par l’ABES, vous pouvez vous reporter à http://www.bibliopedia.fr/wiki/OpenRefine . Si vous avez besoin d’obtenir des identifiants pour des « Personnes » ou d’autres types d’autorité, adressez votre demande à idref@abes.fr. Nous pourrons élaborer ensemble la meilleure façon d’y répondre.

Notons enfin que si OpenRefine s’avère pratique, l’outil connait des limites. Sur la base de l’expérimentation SudocAd, l’ABES développe un outil plus sophistiqué en parallèle du projet de recherche Qualinca qu’elle mène avec le LIRMM. Cet outil, en cours de développement, est bien plus ambitieux en termes de quantité et de qualité des paramètres pris en entrée pour un niveau de fiabilité réhaussé. Pour creuser cette question, nous recommandons la lecture de l’article passionnant d’Aline Le Provost dans le numéro 77 d’Arabesque : https://fil.abes.fr/2015/01/05/arabesques-n77-dialogues-avec-la-machine/

Continuer la lectureOpenRefine ou comment passer des listes aux applications Abes : illustration avec IdRef et theses.fr ?

Satisfaction et besoins autour de l’application Step et de ses services : résultats de l’enquête 2015

Depuis son ouverture en 2011, en parallèle de celle de theses.fr, l’application Step a évolué avec l’apport de nouveaux services (export de données vers Star, programme d’import de données commun aux deux applications thèses, interconnexion avec des outils de gestion en local …) et son réseau s’est agrandi pour atteindre aujourd’hui 103 établissements habilités à délivrer le doctorat.

En 2015, l’activité de signalement des thèses en préparation semble avoir atteint sa vitesse de croisière. C’était l’occasion pour l’ABES  de recueillir auprès des correspondants Step leurs avis sur l’application et ses services associés, de connaître leurs éventuelles difficultés ainsi que les évolutions souhaitées. C’est à cette fin qu’une enquête a été menée du 3 mars au 15 avril 2015. En voici les principaux résultats.

Continuer la lectureSatisfaction et besoins autour de l’application Step et de ses services : résultats de l’enquête 2015

Être un service libéré, tu sais c’est pas si FACILE…

Synthèse de l’enquête sur les pdf de thèses valides pour un archivage au CINES

velo_facile

Dans le cadre d’un échange entre l’ABES et le CINES, une enquête a été menée auprès des correspondants STAR du 17 au 31 mars 2015. Celle-ci avait pour but de mieux connaître comment les établissements procèdent pour fournir des pdf valides de thèses soutenues pour un archivage au CINES.Le service FACILE mis en place par le CINES a pour objet de valider le format d’archivage du CINES par analyse et expertise et comprend 2 niveaux.
Les demandes d’analyse de niveau 2 de FACILE [https://www.cines.fr/archivage/des-expertises/expertise-formats/facile/] ayant connu ces derniers mois une forte augmentation,  le CINES a souhaité pouvoir réfléchir à un accès possible sur authentification pour ses utilisateurs. Cette piste d’un accès sur authentification a finalement été abandonnée par le CINES qui reste sur le même principe qu’auparavant c’est-à-dire un accès … libre, libéré…

En effet, des améliorations ont été constatées dans l’usage de FACILE suite aux dernières modifications du service (ajouts de tutoriels notamment). Le CINES reste toutefois attentif au nombre de sollicitations via FACILE2.

Continuer la lectureÊtre un service libéré, tu sais c’est pas si FACILE…

BACON et la labellisation des données : à quelle aune mesure-t-on la qualité d’un fichier KBART ?

  • Auteur/autrice de la publication :
  • Post category:bacon

rvb-sloganLa recommandation KBART, portée par la NISO, a entre autre qualité, sa grande simplicité.  Un fichier KBART doit répondre à des exigences peu contraignantes, du type : intitulés de colonnes normalisés et parlants (ex : ‘publication_title’, ‘first_author’ …) ; sortie sous  forme d’un fichier .txt ; encodage en UTF-8 …

La première vérification réalisée à l’Abes consiste donc à vérifier que le fichier fourni par un éditeur remplit bien  les obligations de conformité à la recommandation KBART. Voici les principaux points de vigilance :

Continuer la lectureBACON et la labellisation des données : à quelle aune mesure-t-on la qualité d’un fichier KBART ?

CERCLES : un corpus supplémentaire

  • Auteur/autrice de la publication :
  • Post category:Sudoc

L’expérimentation CERCLES (Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur) s’est construite à partir de la demande formelle de 4 établissements, qui portaient un projet sur un corpus bien défini. Pourtant, il y a déjà deux ans, avant même que ces demandes soient formulées, la Fondation Maison des Sciences de l’Homme (FMSH) de Paris avait émis le souhait de participer à un travail collaboratif d’enrichissement des notices Sudoc, si d’aventures l’ABES mettait en place un tel dispositif.

Un corpus supplémentaire
by Horia Varlan CC BY 2.0 via Flick’r

La finalisation de cette participation a duré un petit plus de temps qu’avec les 4 établissements déjà cités dans les précédents billets, mais aujourd’hui, la FMSH a bel et bien rejoint le dispositif, comme prévu dès l’origine, et a commencé son travail, en suivant les mêmes méthodes et consignes que ses « co-cerclés » : signature de l’acte d’engagement, définition des axes d’enrichissements, complétude d’un journal de bord collaboratif.

Voici le détail de son engagement dans CERCLES :

Continuer la lectureCERCLES : un corpus supplémentaire
Aller au contenu principal