CERCLES : un corpus supplémentaire

  • Auteur/autrice de la publication :
  • Post category:Sudoc

L’expérimentation CERCLES (Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur) s’est construite à partir de la demande formelle de 4 établissements, qui portaient un projet sur un corpus bien défini. Pourtant, il y a déjà deux ans, avant même que ces demandes soient formulées, la Fondation Maison des Sciences de l’Homme (FMSH) de Paris avait émis le souhait de participer à un travail collaboratif d’enrichissement des notices Sudoc, si d’aventures l’ABES mettait en place un tel dispositif.

Un corpus supplémentaire
by Horia Varlan CC BY 2.0 via Flick’r

La finalisation de cette participation a duré un petit plus de temps qu’avec les 4 établissements déjà cités dans les précédents billets, mais aujourd’hui, la FMSH a bel et bien rejoint le dispositif, comme prévu dès l’origine, et a commencé son travail, en suivant les mêmes méthodes et consignes que ses « co-cerclés » : signature de l’acte d’engagement, définition des axes d’enrichissements, complétude d’un journal de bord collaboratif.

Voici le détail de son engagement dans CERCLES :

Continuer la lectureCERCLES : un corpus supplémentaire

Comment « CERCLES » se met en place

  • Auteur/autrice de la publication :
  • Post category:Sudoc
by_Horla_Varlan__CC_BY_2_0_via Flick'r
by_Horla_Varlan__CC_BY_2_0_via Flick’r

Il y a un mois, ce billet dévoilait les grands principes de l’expérimentation CERCLES (Correction et Enrichissement par le Réseau de Corpus de LEnseignement Supérieur). Les 4 établissements pilotes se sont mis en ordre de bataille, et l’ABES les accompagne : l’accord de participation (qui valide les engagements de chaque partie) est signé, les référents « ABES » pour chaque établissement et chaque corpus sont désignés, les premiers contacts ont été pris, et le chantier est parfois bien avancé. Voici des nouvelles des 4 premiers « cercles » :

Continuer la lectureComment « CERCLES » se met en place

Webservice AlgoSudoc : prendre connaissance et remédier aux anomalies de chargement des données Sudoc dans theses.fr

Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr
Expo Asterix BNF / Manuel F. Picaud / CC BY-NC-SA 2.0, via Flickr

« Nous sommes en 2015 après Jésus-Christ. Toutes les thèses de doctorat soutenues en France depuis 1985 sont recensées dans theses.fr… Toutes ? Non ! Un lot d’irréductibles notices Sudoc résiste encore et toujours à l’algorithme de chargement. Et la vie n’est pas facile pour les garnisons de catalogueurs des bibliothèques retranchés dans les établissements de soutenance.« 

En mai 2013, les données du Sudoc ont été chargées dans le moteur de recherche theses.fr. Un précédent billet liste (de manière non exhaustive) les raisons pour lesquelles certaines notices n’ont pas pu être chargées.
Au-delà de l’énoncé de ces quelques principes, le programme de versement des données Sudoc restait une boite noire pour les catalogueurs. Vous avez été nombreux à nous réclamer via le guichet d’assistance des explications sur le non-chargement de telle ou telle notice, souvent à la demande d’un directeur de thèse qui constatait que theses.fr ne recensait pas la totalité des thèses qu’il a dirigées. Nous vous avons répondu au cas par cas, en vous promettant une liste de toutes les notices en erreur.

Continuer la lectureWebservice AlgoSudoc : prendre connaissance et remédier aux anomalies de chargement des données Sudoc dans theses.fr

Enrichissement mutualisé de corpus : entrez dans le « CERCLES » !

  • Auteur/autrice de la publication :
  • Post category:Sudoc

Depuis l’apparition des ressources électroniques, les modalités de signalement de ces ressources dans le catalogue Sudoc n’apportait pas de véritable satisfaction.

L’ABES apportait au réseau ses compétences en matière d’imports de notices par lots, mais ne pouvait assurer un traitement « à la notice », notamment en termes de corrections de données, lorsqu’elles s’avéraient nécessaires.

Les établissements, disposant de la ressource, pouvaient intervenir sur ce travail d’enrichissement, mais hésitaient sans doute à le faire, ne disposant pour cela ni d’interlocuteurs précis à l’ABES (en cas de doute sur les actions à effectuer), ni de visibilité sur les prochains traitements automatiques envisagés par l’ABES.

Les éditeurs, enfin, fournisseurs de métadonnées, n’entendaient certainement pas les demandes isolées d’un établissement, un client parmi tant d’autres.

Il fallait que ça change, et une des solutions résidait sans doute dans ce qui constitue notre principale force : le réseau.

Continuer la lectureEnrichissement mutualisé de corpus : entrez dans le « CERCLES » !

CheckSudoc, un nouvel outil de contrôle qualité des notices du SUDOC

  • Auteur/autrice de la publication :
  • Post category:Sudoc

CheckSudoc est une application développée par Yves Tomic, Ingénieur d’études à l’Université Paris Dauphine.

CheckSudoc est une application en ligne développé en PHP  pour permettre d’effectuer un contrôle qualité sur les notices Sudoc. Ce contrôle peut être effectué quotidiennement une fois les notices bibliographiques importées dans le SIGB local.

Le fonctionnement est simple : il  s’agit de saisir une liste de PPN (identifiants des notices Sudoc) – un par ligne – et de lancer le traitement. Il existe deux modes d’affichage des résultats : simple et avancé.

Continuer la lectureCheckSudoc, un nouvel outil de contrôle qualité des notices du SUDOC

Un chantier qualité sur les n° FRBNF multiples

  • Auteur/autrice de la publication :
  • Post category:Sudoc

Dans un catalogue de bibliothèque, quel qu’il soit, chaque notice dispose de son propre identifiant. Dans le Sudoc, c’est un numéro appelé « PPN ». Il identifie les notices bibliographiques et les notices d’autorités.

Ces dernières, dans l’environnement BnF, disposent de leurs propres identifiants : les numéros FRBNF, visibles en zone 001 des notices BnF.

Lorsqu’un catalogueur Sudoc ne trouve pas une notice pour le point d’accès qu’il veut normaliser, il a l’opportunité de chercher si une notice pour cette autorité existe dans la base d’appui (=DIS CHE de WinIBW) où l’on trouve les notices d’autorité de la BNF, laquelle nous les offre gracieusement depuis l’origine du Sudoc.

Continuer la lectureUn chantier qualité sur les n° FRBNF multiples

Un chantier « qualité » sur les données d’autorités

  • Auteur/autrice de la publication :
  • Post category:IdRefSudoc

C’est un chantier modeste par le volume des notices concernées, mais important par ses impacts, que nous mettons ici en lumière.

Dans les notices d’autorités de la base Sudoc, les zones Unimarc 5XX permettent de faire des liens vers d’autres notices (lien de type « Voir aussi »). Sur un affichage public, cela se matérialise ainsi :

Continuer la lectureUn chantier « qualité » sur les données d’autorités

Un chantier « qualité » sur le 200$b

  • Auteur/autrice de la publication :
  • Post category:Sudoc

Avant (mars 2014), dans le Sudoc,  8 700 000 notices avaient une sous-zone 200 $b.

Sauf que celle-ci, qu’un catalogueur peut saisir à la main (même si, rappelons-le, un script « Ajout Texte imprimé » est disponible), contenait des valeurs très … différentes et hétéroclites.

Quelques exemples d’occurrences trouvées, pour la seule valeur « Texte imprimé » :

Continuer la lectureUn chantier « qualité » sur le 200$b

Le SUDOC en RDF : du nouveau ! 1/2

  • Auteur/autrice de la publication :
  • Post category:Sudoctechno

A propos du  web de données, et du Sudoc en RDF, voir notamment les billets précédents ici et .

L’été 2013 avait vu la mise en ligne d’une documentation sur l’exposition du SUDOC en RDF, et l’annonce d’un chantier visant à enrichir et affiner progressivement celle-ci. Ce chantier a produit ses premiers résultats au cours de l’année universitaire écoulée, par petites touches successives. Zoom sur les nouveautés.

Alignements

Dans un souci d’interopérabilité avec Data.bnf.fr, le FRBNF des notices BNF a été ajouté, à côté des OCN d’OCLC déjà présents : onto-bnf :FRBNF (propriété maintenue par la BnF elle-même). Les identifiants ark – présents dans une partie des notices du Sudoc, devraient suivre un peu plus tard.

Continuer la lectureLe SUDOC en RDF : du nouveau ! 1/2

Annuaire des Web Services Sudoc

  • Auteur/autrice de la publication :
  • Post category:Sudoc

Un annuaire des Web Services Sudoc est disponible à cette adresse : http://www.sudoc.fr/services/annuaire/.

Il permet  de prendre connaissance de l’ensemble des Web Services Sudoc existants et d’accéder à leur documentation.

L’annuaire et les Web Services Sudoc ont été présentés pendant les Journées ABES 2014 lors de la session « Des API, pour quoi faire ? » :
« Afin de rendre plus concrètes les possibilités offertes par ces API, Yves Tomic et Julien Sicot présenteront les réalisations de leurs établissements respectifs : enrichissement de l’OPAC, nouveaux outils pour les usagers (DoMyBiblio), mise en valeur des thèses…  »

L’ annuaire des Web Services Sudoc  est également disponible à partir de la page « Pour les développeurs » du site de l’ABES.

Continuer la lectureAnnuaire des Web Services Sudoc
Aller au contenu principal