Retours et explications sur la panne du 14 au 20 juin 2014

Contexte

L’intervention technique prévue les 12 et 13 juin derniers avait plusieurs objectifs :

  •   installer de nouveaux matériels (serveurs, mémoires, commutateurs réseaux, serveurs de stockage, …) et migrer des services sur ces nouveaux matériels
  •  réorganiser et sécuriser le réseau
  •   réorganiser les serveurs dans les baies.
  •   sécuriser l’alimentation électrique des serveurs

Certaines de ces interventions, délicates à mener, nécessitant une assistance extérieure, l’ABES a été obligée de programmer cet arrêt en semaine. De plus, une partie de ces interventions était un préalable à d’autres actions, planifiées durant l’arrêt prévu du 18 au 23 juillet – un arrêt imposé par notre hébergeur, le Cines, qui procède à de lourds travaux de sécurisation de son infrastructure électrique.

Le fait que cette intervention se soit révélée aussi « catastrophique » n’est pas dû à un manque de préparation – une équipe du DSI ayant travaillé depuis plusieurs mois à son organisation – mais à un malheureux jeu de pannes matérielles successives et improbables qui ont entrainé une impossibilité pour l’ABES de reprendre le service dans les délais annoncés.

Les faits marquants

  • jeudi 12 juin à 16h : l’intervention débute normalement
  •  nuit de jeudi 12 à vendredi 13 : lors du redémarrage des serveurs, 3 matériels essentiels tombent en panne : 2 commutateurs réseaux et le serveur de stockage principal. De plus, du fait d’une configuration erronée, certains nouveaux matériels refusent également de fonctionner normalement. La panne la plus grave est celle affectant le serveur de stockage. En effet, celui-ci héberge les bases de données des Thèses, la base miroir du Sudoc (la base XML), ainsi que tous les serveurs (virtuels) d’indexation associés à ces 2 bases de données.
  •  vendredi – samedi – dimanche : face à ces pannes, les équipes informatiques de l’ABES établissent une nouvelle stratégie afin de pouvoir reprendre le service et surtout éviter toute corruption de données.
  • lundi 16 juin : grâce à cette intervention, le service peut reprendre partiellement. Les applications du Sudoc (WinIBW, interface publique, Colodus) et Calames fonctionnent normalement, malgré quelques perturbations passagères durant les 2 jours suivants. Malheureusement, du fait de la panne du serveur de stockage, les applications des Thèses ainsi que les services autour de la base miroir du Sudoc (Périscope, SelfSudoc, webservices) ne reprennent pas.
  •  mardi 17 juin : l’ABES s’engage dans deux voies distinctes :
  • reconstruire l’ensemble de services en panne sur de nouveaux serveurs puis restaurer les données à partir des sauvegardes
  •  en parallèle, continuer à tenter avec notre prestataire de réparer le serveur de stockage.
  • mercredi 18 : après plusieurs tentatives infructueuses, le serveur de stockage est partiellement réparé. Cependant, une nouvelle intervention est nécessaire. Elle est planifiée par le prestataire le jeudi matin. Le mercredi soir, l’ABES décide donc logiquement de ne pas reprendre le service puisque l’intervention prévue le jeudi matin nécessite à nouveau un arrêt. Malheureusement, après avoir repoussé une première fois l’intervention au jeudi après midi, le prestataire l’annule car … il a commandé la mauvaise pièce ! Suite à cette mauvaise nouvelle, l’ABES prend la décision de reprendre au plus tôt le service sur des nouveaux serveurs, de restaurer les données et de faire fonctionner le serveur partiellement réparé pour les quelques services qui n’ont pu être migrés sur de nouveaux serveurs.
  •  soirée du jeudi et matinée du vendredi : après quelques ajustements, l’ensemble des services de l’ABES réouvrent le vendredi après midi.

Et la suite ?

L’ABES va maintenant s’atteler à :

  • terminer la migration des données encore présentes sur le serveur incriminé. Cette action est bien entendu déjà engagée.
  • se prémunir pour que cette suite d’évènements ne puisse plus se reproduire. Du matériel réseau en secours va être acquis et tous les matériels de stockage seront doublés. L’intervention du 12 juin avait d’ailleurs cet objectif – un objectif qui, comme vous le comprendrez, n’a pu être mené à son terme. Durant cette intervention, il était en effet initialement prévu de migrer la majeure partie des données du serveur de stockage tombé en panne sur 2 nouveaux serveurs, avec duplication des données sur ces serveurs.
  •  ajuster les procédures d’exploitation afin de pouvoir réagir au plus vite en cas de panne

Stéphane Rey, chef du Département Système d’Information

« Métarevues » : un outil dédié au traitement des périodiques

« Métarevues », quésaco ?

Comme son nom l’indique, « Métarevues » est un outil dédié aux périodiques, qui permet de générer l’historique complet – papier et électronique – d’une même métarevue, à partir d’un PPN (identifiant des notices du SUDOC) ou d’un ISSN papier ou électronique. Plus précisément, on appelle ici métarevue, l’ensemble des titres qui constitue un périodique depuis sa naissance. Car, comme on le sait, une revue est véritablement vivante ! Contrairement aux monographies, aux vies bien rangées, il est en effet possible qu’au cours de son existence, une revue change de nom (et ce parfois plusieurs fois), fusionne avec un titre cousin ou soit l’objet d’une scission en deux voire trois, quatre titres distincts…

« Métarevues » et ISTEX

Dans le cadre des achats en licence nationale (projet ISTEX), notamment durant la phase des négociations, ADELE (le département achat de documentation électronique de l’ABES) reçoit de la part des éditeurs des listes de revues. Bien souvent, ces listes ne sont pas correctes (bibliographiquement parlant, s’entend). Effectivement les données fournies par les éditeurs ne reflètent pas toujours l’historique exact des revues.

Par exemple, l’éditeur nous livrerait simplement l’élément …

  • La revue du blouson     1925   –   2008

… à la place des éléments suivants, qui correspondraient à la véritable histoire de la revue :

  • La revue de la blouse 1925 – 1960
  • La revue de la blouse grise A. Avec des boutons blancs   1961 – 1974
  • La revue de la blouse grise B. Avec des boutons bleus 1961 – 1974
  • La revue du blouson en jean 1975 – 1998
  • La revue du blouson en cuir 1999 – 2003
  • La revue du blouson 2004 -2008

A l’origine, l’ABES a donc développé le programme « Métarevues » pour aider à corriger les listes de périodiques proposées par les éditeurs dans le cadre des achats ISTEX.

Ce travail est particulièrement utile pour le signalement des exemplaires ABES Licence Nationale dans le catalogue SUDOC ; il permet en effet d’identifier l’ensemble des notices à exemplariser une fois les corpus de revues acquis.

De plus, le programme génère non seulement l’historique complet d’une même métarevue électronique mais aussi celui de sa métarevue papier correspondante. C’est donc également grâce à cet outil que le hub peut proposer les fameux fichiers d’aide au désherbage – listes des PPN des éditions imprimées liées aux ressources électroniques acquises – mis à disposition des établissements sur le site licencesnationales.fr.

« Métarevues » peut aussi servir aux négociateurs ADELE directement. Par exemple, si l’éditeur propose dans son offre le titre La revue du blouson en jean (1975-1998) et le titre La revue du blouson (2004-2008), l’outil permettra de repérer que ces deux titres appartiennent en fait à une même métarevue, et aux négociateurs alors de pointer les titres manquants (La revue de la blouse, la revue du blouson en cuir, etc) : « pourquoi ne pas les intégrer dans votre offre, cher éditeur, puisqu’ils appartiennent en réalité à la même revue ? » Et si le fournisseur ne détient pas (ou plus) les droits sur les titres en question, ce peut être éventuellement un argument pour rediscuter les tarifs… tout en gardant en tête l’idée qu’il sera peut-être possible de reconstituer le « puzzle » ultérieurement, en achetant les parties lacunaires auprès d’autres éditeurs avec lesquels il est prévu de faire affaire.

Comment ça marche ?

« Métarevues » repose sur les données du SUDOC. L’outil remonte les informations des notices liées à partir des zones :

  • 4XX
  • 440 Devient
  • 441 Devient partiellement
  • 442 Remplacé par
  • 443 Remplacé partiellement par
  • 444 Absorbé par
  • 445 Absorbé partiellement par
  • 446 Scindé en … et en …
  • 447 Fusionne avec … pour donner…
  • 43X :
  • 431 Suite partielle de
  • 432 Remplace
  • 433 Remplace partiellement
  • 434 Absorbe
  • 435 Absorbe partiellement
  • 436 Fusion de … et de …
  • 452 : a pour autre édition sur un support différent.

Les résultats peuvent être renvoyés sous deux formes, une forme tabulée (format xls) contenant les champs suivants : ISSN, PPN, Titre, Editeur, Date, et un schéma XML. C’est à partir de la sortie en format XML qu’il est possible de visualiser les données sous forme de graphe. Les données de lien peuvent ainsi être interprétées avec un logiciel comme Gephi (https://gephi.org/).

Ci-dessous le type de visualisations qu’il est possible d’obtenir ainsi :

metarevue1

Utilisation dans Périscope

Au-delà d’ISTEX, « Métarevues » est utilisé dans l’application Périscope, laquelle permet désormais de visualiser l’historique complet lié à une revue.

Exemple, pour le titre Physics world publié par IOP Publishing :

metarevue12

metarevue3

Y OCLC también

OCLC propose également des historiques de revues. Les résultats donnés se fondent sur les informations signalées dans son propre catalogue, WorldCat.

Le lien vers le service en ligne se trouve ici : http://xissn.worldcat.org/xissnadmin/index.htm

Marion Grand-Démery

Annuaire des Web Services Sudoc

Un annuaire des Web Services Sudoc est disponible à cette adresse : http://www.sudoc.fr/services/annuaire/.

Il permet  de prendre connaissance de l’ensemble des Web Services Sudoc existants et d’accéder à leur documentation.

L’annuaire et les Web Services Sudoc ont été présentés pendant les Journées ABES 2014 lors de la session "Des API, pour quoi faire ?" :
"Afin de rendre plus concrètes les possibilités offertes par ces API, Yves Tomic et Julien Sicot présenteront les réalisations de leurs établissements respectifs : enrichissement de l’OPAC, nouveaux outils pour les usagers (DoMyBiblio), mise en valeur des thèses… "

L’ annuaire des Web Services Sudoc  est également disponible à partir de la page "Pour les développeurs" du site de l’ABES.

 

 

Une zone 309 pour coordonner le travail collectif sur la qualité des données Sudoc

Au moment du chargement de nouvelles notices ou à l’occasion d’un chantier de contrôle qualité, l’ABES peut être amenée à effectuer des modifications de masse pour améliorer ou corriger des notices. Hélas, tout n’est pas automatisable – surtout si on tient à conserver un certain niveau de qualité bibliographique. Une fois que les algorithmes ont parlé et atteint leurs limites, l’ABES passe le relais au réseau, qui possède la force de frappe et l’expertise humaine pour continuer le travail, ne serait-ce qu’en se concentrant sur l’essentiel ou le prioritaire.

Mais, précisément, qu’est-ce qui est essentiel ? Qu’est-ce qui est prioritaire ? Sur quelles notices faut-il que le réseau se mobilise ? Et sur quels points précis dans les notices ? Étant donné la taille de la base, le volume des entrées et la richesse des règles, chaque catalogueur, chaque service de catalogage peut se sentir perdu devant l’ampleur de la tâche. C’est pourquoi l’ABES souhaite structurer d’avantage l’organisation de cet immense travail collectif. Cette volonté se traduit aujourd’hui sous une forme très concrète : la zone 309…

309_en_chantier
Cette "note d’information interne au Sudoc" existait déjà, mais elle ne possédait qu’une sous-zone ($a) :

309 ##$aCORRIGER LE(S) CODE(S) DE FONCTION = 000 EN 7XX, L7XX et/ou E7XX. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

Elle est désormais structurée, ce qui permet une meilleure exploitation.

309 et ToDoList

Ainsi, dans le cadre des travaux du hub de métadonnées sur les ebooks de droit international achetés dans le cadre d’ISTEX, certains traitements automatiques ont permis d’enrichir les données, notamment en ajoutant des liens aux autorités auteur. Quand le programme n’a pas su identifier la bonne autorité, une zone 309 a été injectée dans la notice bibliographique concernée, pour inciter les catalogueurs à poursuivre le travail et les guider.

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$d2014-04-09 11:15:01.894

Dans la sous-zone $b, on trouvera l’identifiant du chantier ou du corpus auquel correspond cette zone de note. Grâce à cet identifiant précis, il est aisé d’effectuer des statistiques plus fines sur les chantiers qualité en cours, mais surtout de fournir aux catalogueurs la liste toujours à jour des notices à traiter. Pour accéder à cette liste, il suffit de se rendre à une adresse web ainsi construite :

http://www.sudoc.fr/services/chantier/ + {contenu de la $b}.

Ce qui donne, pour l’exemple précédent :

http://www.sudoc.fr/services/chantier/BRILL-RADI-LN.

A cette adresse, on récupère un fichier à ouvrir dans Excel : il s’agit d’un tableau qui liste toutes les notices à corriger, en précisant la correction à effectuer. En entête du tableau, quelques chiffres et pourcentages permettent de mesurer la progression du chantier, pour voir si on tient le bon bout… Pour des raisons de fond ou des raisons techniques, ces tableaux ne seront pas disponibles quand les 309 concerneront des chantiers qui touchent à des notices importées ou à un trop grand nombre de notices.

L’ABES propose. Le réseau dispose.

Enfin, dans certains cas, le programme a travaillé mais n’ose pas trancher. Pour reprendre l’exemple précédent, son cœur peut balancer entre deux autorités. Voire considérer que, même si une seule autorité est en lice, il serait imprudent de conclure aveuglément qu’il s’agit de la bonne. On trouvera alors en $c le(s) PPN que le programme suggère sans oser le(s) retenir. Cette liste de PPN se présente sous la forme d’une requête WinIBW :

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$cche PPN1 ou PPN2$d2014-04-09 11:15:01.894

Il s’agit d’une aide à la décision pour le catalogueur, qui, s’il le souhaite, peut se contenter d’examiner les PPN proposés, sans s’attarder sur les autres PPN qu’une recherche sur le nom pourrait renvoyer.
Qu’il suive les suggestions du programme ou non, le catalogueur crée le lien manquant puis n’oublie pas de supprimer la 309 correspondante. La notice disparaît alors du tableau des notices à traiter pour tel chantier (sauf si cette notice contient une autre 309 pour ce même chantier).

Aller plus loin

Ce nouveau dispositif se veut très pragmatique. Il s’agit d’améliorer l’efficacité collective du réseau sans compliquer la vie des catalogueurs. On pourrait imaginer d’autres dispositifs et l’ABES n’exclut pas de proposer au réseau d’autres manières d’intervenir sur les données. D’avance, merci pour vos retours, vos suggestions et … votre chasse aux 309.

NB : les chantiers en cours sont listés dans la page du guide méthodologique qui documente la zone 309 : http://documentation.abes.fr/sudoc/formats/unmb/zones/309.htm.

Y. Nicolas

Politique de signalement des licences nationales ISTEX

logo-LN-ombre

[Ce billet reprend le message envoyé aux listes de discussion  Sudoc et Sudoc PS (Périodiques), le 24/2/2014. Il a été suivi d'une série de messages faisant le point sur le signalement de chaque corpus. Si vous n'appartenez pas aux réseaux ABES, le site licencesnationales.fr est le bon endroit pour se tenir informé. Il sera bientôt mis à jour pour intégrer les services évoqués dans le billet qui suit.]

En Janvier, l’ABES a annoncé l’acquisition de plusieurs corpus de ressources numériques en licence nationale, dans le cadre du projet ISTEX :

Au-delà de la négociation de ces ressources, l’ABES est responsable de leur signalement.
Pour chaque corpus, un message spécifique sera envoyé afin de détailler les opérations de signalement qui ont été réalisées ou qui le seront sous peu. A ce jour, malheureusement, il faut noter que le signalement des périodiques Elsevier (ISTEX) n’a pas été réalisé, et ce pour la raison suivante : la liste a été fournie telle quelle par l’éditeur et n’a pas pu être élaborée et vérifiée en amont et en partenariat ABES/éditeur.

La suite de ce message expose les principes généraux et les modalités concrètes du signalement des licences nationales ISTEX.

Signaler au sens large

Aujourd’hui, le signalement doit être entendu en un sens plus large qu’avant. En effet, si le signalement dans le Sudoc demeure un objectif prioritaire, il faut également travailler à signaler ces ressources dans d’autres environnements : aujourd’hui les bases de connaissance, sur lesquelles s’appuient les outils de découverte et les résolveurs de lien ; demain le web de données (LOD – Linked Open Data).
C’est pourquoi le signalement des licences nationales ISTEX est assuré par l’ABES dans le cadre du projet de hub de métadonnées, en collaboration avec les équipes responsables du circuit Sudoc habituel. Derrière le terme de « hub de métadonnées », il faut imaginer un espace de traitement des métadonnées indépendant des autres applications de l’ABES. L’équipe du hub récupère les métadonnées auprès des éditeurs, sans exiger de format particulier. En bout de chaîne, il s’agit de redistribuer des données de qualité, normalisées, exploitables dans différents environnements, dont le Sudoc.

Pour le Sudoc et vos SIGB

Comme c’est le cas depuis des années, afin d’assurer la visibilité de ces ressources dans le catalogue collectif, l’ABES crée systématiquement un exemplaire ABES – en l’occurrence un exemplaire « ABES Licence nationale ».
Les établissements qui souhaiteront ajouter leur propre exemplaire, notamment pour faire redescendre ces notices dans leur SIGB, pourront utiliser le service d’exemplarisation automatique. Pour ce faire, l’ABES fournira au réseau la liste complète des documents appartenant à un corpus ISTEX.

Pour les bases de connaissance

Fait nouveau, l’ABES fournira également des listes conformes à la recommandation KBART, prêtes à l’emploi dans les bases de connaissance qui alimentent les outils d’accès à la documentation électronique.
Les équipes de l’ABES s’efforceront de fournir des listes KBART qui soient bibliographiquement correctes. Souvent, sur la plateforme d’un éditeur, derrière une seule revue se cachent en fait plusieurs revues qui entretiennent entre elles des relations de succession, de scission, d’absorption, etc. Les fichiers KBART de l’ABES veilleront à respecter cette granularité bibliographique. Il faudra être attentif à l’impact de cette granularité sur les résolveurs de lien, par exemple.

Pour une gestion optimale des collections imprimées

Dans le cadre d’ISTEX, l’acquisition des ressources électroniques est adossée à un engagement de l’Etat et de ses opérateurs sur le long terme : le CINES assure la conservation à long terme et l’INIST garantira l’accès sur la plateforme qu’il développe. Dès lors, la politique nationale d’achat pérenne de documentation électronique peut déboucher sur des décisions locales relatives à la gestion des collections imprimées (désherbage, déménagement, etc.).
L’ABES souhaite faciliter ces décisions locales en fournissant, pour chaque corpus de ressources électroniques acquises, la liste des ressources imprimées correspondant. Pour les périodiques, en particulier, il s’agit de lister les documents imprimés en précisant les états de collection électroniques ISTEX.
Ce nouveau service de l’ABES s’inscrit dans une démarche d’ensemble qui vise à offrir aux établissements des outils d’aide à la décision en matière de conservation de l’imprimé, dans le cadre d’un plan de conservation partagée ou non. Une communication spécifique va suivre qui donnera un aperçu de cette nouvelle offre de services en construction.

Zoom : les périodiques ISTEX et le Sudoc

Même si l’ABES récupère auprès des éditeurs des métadonnées au niveau de l’article, c’est au niveau du périodique que se fait le signalement dans le Sudoc. Ces notices de périodique ne sont pas générées à partir des métadonnées d’éditeur, car, dans le Sudoc, ce sont les notices ISSN qui font autorité.
Pourtant, au-delà du travail d’exemplarisation sous ces notices ISSN,  certaines informations bibliographiques seront ajoutées ou modifiées par l’ABES. Il s’agit de la zone 859 (URL fournie par l’éditeur) mais surtout de la zone 207. Cette zone sert à préciser le numéro et la date du premier et du dernier volume d’un périodique. Cette zone est particulièrement importante pour les périodiques électroniques. En effet, la date de publication d’un périodique électronique ne permet pas de connaître sa couverture réelle. Seule la zone 207 permet de comprendre que le volume n°1 d’une revue électronique créée en 1999 remonte en fait à 1923, du fait d’une numérisation rétrospective. Or, disposant des métadonnées au niveau des articles, l’ABES est en mesure de générer ces informations de manière systématique, fiable et standardisée. Si, dans les faits, il n’est pas toujours possible d’effectuer complètement cette opération au moment de la création de l’exemplaire ABES, elle sera finalisée dans un second temps, une fois les métadonnées livrées par l’éditeur et acceptées.
Par ailleurs, une part non négligeable des périodiques acquis dans le cadre d’ISTEX n’a jamais fait l’objet d’une numérotation ISSN. Un message spécifique portant sur cette question sera bientôt adressé aux centres régionaux du Sudoc PS.

Zoom : les ebooks ISTEX et le Sudoc

Contrairement aux périodiques, c’est à partir des métadonnées fournies par les éditeurs que des notices MARC seront générées et chargées dans le Sudoc. Là encore, un exemplaire ABES leur sera associé.
La qualité des notices produites dépendra essentiellement de la qualité initiale des métadonnées, mais également des efforts fournis par l’ABES pour normaliser, corriger et enrichir ces métadonnées (normalisation de certains types d’information, vérification des DOIs ou des URLs, liens à des référentiels comme IdRef, Viaf, RAMEAU, etc.). Or, ces traitements complémentaires peuvent prendre du temps. C’est pourquoi le signalement des ebooks pourra se faire en deux étapes. Dans un premier temps, les notices chargées dans le Sudoc ne seront qu’un reformatage des éléments d’information présents dans les données des éditeurs. Dans un second temps, ces notices seront modifiées pour intégrer les corrections et enrichissements effectués par l’ABES, dans le cadre du hub de métadonnées. Entre temps, il sera demandé au réseau de ne pas modifier ces notices.
Une fois ces corrections et enrichissements effectués, c’est le réseau des catalogueurs qui reprendra la main. Dans la mesure du possible, l’ABES s’efforcera de guider les efforts des catalogueurs soucieux d’améliorer la qualité de ces nouvelles notices, en indiquant le plus précisément possible celles qui méritent des interventions particulières et les zones sur lesquelles ces interventions devraient porter en priorité.

Pour toute question, merci d’utiliser le guichet d’assistance : https://stp.abes.fr/assistance/domaines/3

Y. Nicolas

DoMyBiblio

Fonctionnalités

DoMyBiblio est un outil en ligne d’édition de bibliographie reposant sur les données du SUDOC. Développée en PHP, cette application permet, à partir d’une liste de numéros ISBN, d’obtenir l’affichage d’une bibliographie, contenant, pour chaque document :

  • 4 éléments de description (Titre / Auteur / Édition / Description)
  • une vignette représentant la couverture (lorsqu’elle est disponible) provenant du service Amazon.

Cette bibliographie peut être imprimée ou enregistrée au format PDF.

De plus, en mode simple, il est possible d’ajouter un commentaire pour chacun des ouvrages figurant dans la liste en respectant la syntaxe proposée : "978-2-84678-116-9*lire le chapitre 2"

Dans ce cas précis, un champ commentaire apparaîtra et contiendra « lire le chapitre 2 ». Ainsi, un professeur peut éditer une bibliographie en indiquant à ses étudiants quels chapitres lire en priorité.

En mode avancé, l’utilisateur peut ajouter plusieurs champs relatifs à chaque référence en suivant la syntaxe proposée par l’application : "0-12-391861-8*Commentaire|lire le chapitre 2*Localisation|Magasin"

Ici, un champ dénommé Commentaire contiendra « lire le chapitre 2 » et un champ Localisation contiendra « Magasin». L’astérisque annonce l’ajout d’un champ et le caractère | sépare l’intitulé du champ de son contenu.

domybiblio_advancedmode

Cette application peut être également utilisée afin d’éditer des listes de nouveautés si votre SIGB ne vous propose pas un outil pour le faire.

De l’utilisation des webservices

DoMyBiblio utilise deux services web proposés par l’ABES : isbn2ppn et Sudoc en RDF. Le premier permet d’obtenir le PPN d’une notice bibliographique à partir d’un ISBN, le second permet  d’afficher les données d’une notice bibliographique donnée. Si le premier est facile à manipuler dans la mesure où il présente une structure xml simple, le second l’est beaucoup moins. En effet, il comprend plusieurs espaces de nommage (namespaces) utilisés pour les différents éléments de la notice :

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot; xmlns:bibo="http://purl.org/ontology/bibo/&quot; xmlns:dc="http://purl.org/dc/elements/1.1/&quot; xmlns:dcterms="http://purl.org/dc/terms/&quot; xmlns:rdafrbr1="http://rdvocab.info/RDARelationshipsWEMI/&quot; xmlns:marcrel="http://www.loc.gov/loc.terms/relators/&quot; xmlns:foaf="http://xmlns.com/foaf/0.1/&quot; xmlns:gr="http://purl.org/goodrelations/v1#&quot; xmlns:owl="http://www.w3.org/2002/07/owl#&quot; xmlns:frbr="http://purl.org/vocab/frbr/core#&quot; xmlns:isbd="http://iflastandards.info/ns/isbd/elements/&quot; xmlns:skos="http://www.w3.org/2004/02/skos/core#&quot; xmlns:rdafrbr2="http://RDVocab.info/uri/schema/FRBRentitiesRDA/&quot; xmlns:rdaelements="http://rdvocab.info/Elements/"&gt;

Pour accéder à l’outil : http://mydk-tomic.net/biblio/do_biblio.php

Yves Tomic, Département du système d’information documentaire, Service commun de documentation de l’Université Paris Sud. Contact : yves.tomic[@]u-psud.fr ou yves[@]mydk-tomic.net

L’ABES remercie Yves Tomic pour sa contribution à l’enrichissement des outils du Sudoc. Le Pôle Formation Documentation vous informe que le tutoriel "La boîte à outils du catalogue Sudoc" a été mis à jour et une leçon "DoMyBiblio"  a été créée : http://moodle.abes.fr/course/view.php?id=40

PDFStar, un service bien utile pour les thésards

Logo_Mines_ParisTechAprès la soutenance de leur thèse, les doctorants ont besoin de fournir un exemplaire de leur mémoire de thèse sous forme électronique en conformité avec les normes d’archivage. Suite au besoin exprimé par le correspondant Star de la bibliothèque de l’École des Mines, PDFStar a été réalisé  afin de répondre au besoin de mise en conformité des documents PDF. Parmi les outils capables de répondre à ce besoin, on note Acrobat Pro, qui est l’outil de référence mais un logiciel propriétaire. Dans le domaine des logiciels libres, on trouve ghostscript et pdftk, disponibles sur les plateformes compatibles Unix (Linux, FreeBSD, …). Notre choix porte sur les logiciels libres. Néanmoins, ils ont les inconvénients de n’être compatibles qu’avec des systèmes d’exploitation qui ne sont pas toujours ceux des utilisateurs ciblés et aussi de n’être utilisables que par une machine à la fois.

De la connaissance que nous avons des utilisateurs ayant ce besoin, il fallait :

  • éviter tout outil en ligne de commande avec des options "tordues";
  • éviter d’avoir à dédier un outil à chaque utilisateur;
  • ne pas chercher un outil compatible avec la multitude de systèmes d’exploitation possibles et imaginables.

D’où l’idée d’encapsuler tout cela dans une interface web de façon à offrir un "service de mise en conformité", plutôt qu’un logiciel.

Organisation de pdfstar (le logiciel)

PDFStar est organisé en deux parties :

  • un moteur, qui effectue les travaux de mise en conformité, basé actuellement sur l’outil ghostscript version supérieure à 9. Il s’agit d’un script qui reçoit un fichier ".pdf" en entrée et lance l’appel à ghostscript avec les options qui vont bien pour la mise en conformité;
  • une interface web, développée en PHP, qui gère les interactions avec l’utilisateur : chargement et déchargement des fichiers, configuration générale du logiciel, configuration de contrôle d’accès, journalisation des l’activité, …

Le contrôle d’accès se fait sur un serveur web Apache, grâce à un fichier ".htaccess", habituel dans ce type de configuration. On peut soit laisser le serveur ouvert, soit le configurer avec les options de contrôle usuelles : par adresse IP ou ajouter une vérification de identité du genre basique, LDAP, CAS ou Shibboleeth. Le logiciel est disponible en téléchargement, sous licence GPL à l’adresse ci-dessous.

Organisation de pdfstar.mines-paristech.fr (le service de l’École des Mines)

L’École des Mines met à disposition PDFStar en tant que service à l’adresse : https://pdfstar.mines-paristech.fr

Ce service est disponible, après authentification avec login et mot de passe, à tous les utilisateurs des organismes faisant partie de la fédération d’identités de Renater (authentification faite à l’aide de Shibboleth).

Avenir du logiciel

Dans un proche avenir, nous allons intégrer d’autres outils permettant soit une conversion plus rapide, soit de traiter des cas où la mise en conformité ne se passe pas correctement à cause de polices de caractères propriétaires.

Liens utiles

José-Marcio Martins, Responsable technique au Centre de Calcul et Systèmes d’Information, École des Mines