OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [2] – Un outil : OpenRefine

  • Auteur/autrice de la publication :
  • Post category:bacon

[Lire le billet qui introduit cette série « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? »]

OpenRefine est un outil open source conçu pour manipuler des données dont la qualité nécessite un traitement. Mais il permet bien plus que de nettoyer un fichier tabulé des scories qu’il contient. Comparable à Excel, son principal intérêt est de permettre l’appel à des services web. Il est alors possible, et facile, de comparer le contenu d’un fichier avec une base de référence disposant d’une API.

Continuer la lectureOpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [2] – Un outil : OpenRefine

OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [1] – Introduction

  • Auteur/autrice de la publication :
  • Post category:bacondocelec

Cette série de billets exposera la méthode d’évaluation appliquée aux fichiers KBART, transmis à l’Abes par les éditeurs francophones ayant accepté de collaborer avec nous. Ce sera aussi l’occasion d’exposer une nouvelle déclinaison du dispositif CERCLES, appliquée à BACON.

  1. Introduction (ce billet)
  2. Un outil : OpenRefine
  3. Cas pratique
  4. Dispositif CERCLES dans le cadre de BACON

Logo BaconLa BAse de COnnaissance Nationale (BACON) est un entrepôt de métadonnées libres pour le signalement de la documentation électronique. Son contenu, exposé via bacon.abes.fr, peut être soit interrogé puis téléchargé par webservices soit interrogé via l’interface graphique du site.

Continuer la lectureOpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [1] – Introduction

Mettre nos données en réseau – un démonstrateur. [2] Inventaire des données.

[ Lire le billet qui introduit cette série « Mettre nos données en réseau – un démonstrateur » ]

Pour les besoins de la démonstration, nous avons agrégé des données diverses et variées, mais finalement cette auberge espagnole n’est pas si anarchique : tout mène à tout, et on peut regrouper les jeux de données de différentes manières :

  • Données descriptives vs Référentiels
  • Données produites par les réseaux ABES vs Données de tiers
  • Données du monde des bibliothèques vs Données d’autres mondes (science, administration, etc.)
  • Données récupérées en RDF vs Données produites en RDF

Mais dans ABES, il y a B : notre réseau de données se déploie autour des données bibliographiques, qui décrivent des livres, des revues, mais également des chapitres et des articles.

Continuer la lectureMettre nos données en réseau – un démonstrateur. [2] Inventaire des données.

BACON et la labellisation des données : à quelle aune mesure-t-on la qualité d’un fichier KBART ?

  • Auteur/autrice de la publication :
  • Post category:bacon

rvb-sloganLa recommandation KBART, portée par la NISO, a entre autre qualité, sa grande simplicité.  Un fichier KBART doit répondre à des exigences peu contraignantes, du type : intitulés de colonnes normalisés et parlants (ex : ‘publication_title’, ‘first_author’ …) ; sortie sous  forme d’un fichier .txt ; encodage en UTF-8 …

La première vérification réalisée à l’Abes consiste donc à vérifier que le fichier fourni par un éditeur remplit bien  les obligations de conformité à la recommandation KBART. Voici les principaux points de vigilance :

Continuer la lectureBACON et la labellisation des données : à quelle aune mesure-t-on la qualité d’un fichier KBART ?
Aller au contenu principal