Mettre nos données en réseau – un démonstrateur. [4f] Matrice des fascicules pour conservation partagée

[ Lire le billet qui introduit cette série « Mettre nos données en réseau – un démonstrateur » ]

Dans le cadre d’ISTEX, les éditeurs nous livrent des données plutôt riches : un fichier par article, comprenant, outre le full text, des informations sur l’article mais également le fascicule, le volume et la revue. Or, ces différents niveaux reflètent le mode de publication imprimée. Il est donc tentant de vouloir extraire de ces métadonnées ISTEX des informations utiles à la conservation des revues papier correspondantes.

Ainsi, la requête suivante permet de générer une grille qui liste tous les fascicules d’une revue (Oxford economic papers), répartis par année :

PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX rdaw: <http://rdaregistry.info/Elements/w/>
PREFIX bibo: <http://purl.org/ontology/bibo/>
PREFIX isbd: <http://iflastandards.info/ns/isbd/elements/>

SELECT ?year (group_concat(?sici, ' ---- ') as ?sici)

FROM <http://hub.abes.fr/oup/journals/oxecon>

WHERE {

?issue  dcterms:isPartOf ?vol ; rdaw:P10072 [isbd:P1003 <http://iflastandards.info/ns/isbd/terms/mediatype/T1010> ; dcterms:issued ?issuedate] ; bibo:issue ?numero.
?vol dcterms:isPartOf <http://hub.abes.fr/oup/periodical/oep/w> ; bibo:volume ?volume.
<http://hub.abes.fr/oup/periodical/oep/w> <http://rdaregistry.info/Elements/w/P10072> [bibo:issn ?pissn ; isbd:P1003	<http://iflastandards.info/ns/isbd/terms/mediatype/T1010>] .
BIND (year(?issuedate) AS ?year).    
BIND (replace(xsd:string(?issuedate), '-', '') AS ?date).
BIND (concat(?pissn, ' (', ?date, ') ', ?volume, ':', ?numero) as ?sici)

}
GROUP BY ?year 
ORDER BY ?year

Si vous avez copié puis collé la requête à cette adresse https://lod.abes.fr/sparql, vous voyez ça :
sici
Chaque fascicule est identifié par un identifiant SICI, qui contient l’ISSN, la date, le numéro de volume et le numéro de fascicule. (Oui, c’est pas faux, ce serait encore mieux si les fascicules de chaque année étaient dans l’ordre de parution … mais cela rendrait la requête encore plus compliquée…)

Une telle grille pourrait aider les gestionnaires de collections de périodiques imprimés à déclarer leurs états de collection et surtout les lacunes. Au lieu de partir d’une page blanche, ils interviendraient sur une grille qui, par défaut, pourrait être vide (« j’ai peu de lacunes ») ou pleine (« j’ai quelques années isolées »).

Encore faut-il que les données numérisées puis livrées par l’éditeur soient complètes et correctes ! Et précisément, on voit que les années 2006 et 2007 ont des … lacunes :
sici_lacunes
Quelques fascicules sont absents de notre base (et du moteur ISTEX) car les fichiers XML correspondants, livrés par l’éditeur, étaient mal formés… (soupir)

Advertisements

Les personnes disposent d’un droit d’accès aux informations contenues dans cette zone de texte. Les informations que vous y inscrivez doivent être pertinentes au regard du contexte. Elles ne doivent pas comporter d’appréciation subjective, ni faire apparaître, directement ou indirectement les origines raciales, les opinions politiques, philosophiques ou religieuses, les appartenances syndicales ou les mœurs de la personne concernée.

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s