CheckSudoc, un nouvel outil de contrôle qualité des notices du SUDOC

  • Auteur/autrice de la publication :
  • Post category:Sudoc
  • Commentaires de la publication :21 commentaires

CheckSudoc est une application développée par Yves Tomic, Ingénieur d’études à l’Université Paris Dauphine.

CheckSudoc est une application en ligne développé en PHP  pour permettre d’effectuer un contrôle qualité sur les notices Sudoc. Ce contrôle peut être effectué quotidiennement une fois les notices bibliographiques importées dans le SIGB local.

Le fonctionnement est simple : il  s’agit de saisir une liste de PPN (identifiants des notices Sudoc) – un par ligne – et de lancer le traitement. Il existe deux modes d’affichage des résultats : simple et avancé.

Formulaire de Check Sudoc
Formulaire de Check Sudoc

Quelles vérifications sont effectuées sur chaque notice ?

 CheckSudoc  :

  • contrôle la cohérence des années de publication saisies dans les   zones Unimarc  100  et 210 (sous-champ $d)
  • vérifie si une zone 410 (« appartient à la collection ») est présente à partir du moment où une zone 225 (« collection ») existe dans la notice
  • vérifie également la cohérence entre les champs 181-182  (« type de contenu et type de médiation ») et le sous-champ 200$b (« Indication générale du type de document »). CheckSudoc indique si un 200$b est présent dans la notice alors que avez saisi des zones 181 et 182. En effet, à partir du 4 novembre 2014, les zones 181 et 182 se substituent à la sous-zone 200$b.
  • contrôle les vedettes matière (zones 601,602,604,605,606,607,608) ainsi que les mentions de responsabilité ( zones 700,701,702). Il vérifie en particulier la présence de liens vers les notices d’autorité qui se trouvent dans le sous-champ $3. Pour les auteurs, CheckSudoc vérifie si le code fonction est présent ou pas.

Comment exploiter le rapport d’erreur envoyé par CheckSudoc ?

En mode avancé, les résultats sont affichés dans un tableau dans lequel les anomalies sont signalées en rouge.

Visualisation des anomalies détectées
  Visualisation des anomalies détectées

 

A partir du tableau, il est possible de visualiser la notice bibliographique dans un format abrégé en cliquant sur le numéro de PPN.  Pour chacune des zones Unimarc, il est possible d’en afficher le contenu.

Visualisation d'une zone 606
Visualisation d’une zone 606

 

En mode simple, les résultats sont présentés textuellement  sans possibilité de rebonds. Les anomalies  sont signalées en rouge.

Présentation des anomalies en
Présentation des anomalies en « mode simple »

En mode simple comme avancé, les résultats peuvent être téléchargés dans un fichier CSV pour être exploités dans un tableur.

Plus de fonctionnalités … ?

ChekSudoc  est un outil évolutif. D’autres contrôles pourront être ajoutés sur la base de vos suggestions.

 

 

 

 

Cet article a 21 commentaires

  1. Bonjour
    par quel moyen (accès VIP ?) ce service accède-t-il aux notices champ à champ, pour des infos qui ne sont pas présentes dans les notices RDF ?

    1. Bonjour,
      Il n’y a pas que les notices au format RDF qui peuvent être exploitées. L’interface web du catalogue de l’ABES fournit déjà un certain nombre d’éléments. Plusieurs des applications de DoMybiblio utilisent des techniques de parsage de l’interface web du catalogue de l’ABES. On peut récupérer d’autres éléments via une interrogation du serveur Z3950. Il existe plusieurs stratégies pour mettre en place un tel service.

  2. riou-genty

    Bonjour !
    Merci pour cet outil vraiment très pratique.
    par contre, est-ce qu’il y aurait moyen d’élargir le cadre car la navigation (verticale et horizontale) est contraignante…

  3. Nous avons mis en place un ensemble de contrôles sur les notices dans les rapports de chargement quotidien.
    Concrètement : lors du chargement des notices, notre SIGB fournit un fichier de rapport qui est une combinaison de fichier XML + XSL.
    Nous avons modifié la feuille XSL pour qu’elle aille fouiller à l’intérieur des notices bibliographiques chargées, afin de vérifier la conformité d’un certain nombre d’élément (présence d’un traducteur si le document est indiqué comme une traduction, etc.).
    Mais l’ensemble des contrôles ainsi mis en place fait finalement doublon avec ce que vous avez fait — sauf que pour l’instant je ne peux pas appeler dynamiquement vos contrôles dans ma feuille de style.
    Est-ce qu’une API CheckSudoc est prévue, qui me permettrait de simplement, pour chaque PPN chargé, demander à CheckSudoc si la notice est propre ?

  4. Francois Mistral

    Bonjour,
    quelle est la quantité maximale de lignes de PPN que supporte CheckSudoc
    en mode simple ?
    et en mode avancé ?

  5. Riou-Genty

    Bonjour,
    Je souhaitais savoir si l’outil CheckSudoc avait intégré les nouvelles règles de catalogage RDA-FR concernant la mention de publication. Par exemple, fait-il des recherches sur les éventuelles mentions latines S.l., s.n., s.d. ?
    Merci par avance pour votre réponse,

    1. filabes

      Voici la réponse apportée par Yves Tomic, créateur de CheckSudoc : « CheckSudoc n’effectue pas de recherche sur les mentions latines S.l., s.n., s.d.
      Pourriez-vous expliciter votre besoin afin d’ajouter un nouveau contrôle à l’outil ?
      Merci de l’intérêt que vous portez à CheckSudoc. »

      1. Riou-genty

        Bonjour,
        avec les nouvelles règles RDA-FR sur la mention de publication (210 en unimarc), on ne doit plus mettre ses mentions latines mais [lieu de publication inconnu], [éditeur inconnu],etc.

      2. Riou-genty

        il s’agissait d’intégrer les nouvelles règles d’application de RDA-FR sur la mention de publication (zone 210 unimarc) qui supprime ces mentions latines au profit de [lieu de publication inconnu], [éditeur inconnu].

    2. Yves Tomic

      Bonjour,
      Une mise à jour de CheckSUDOC a été effectuée de telle sorte à prendre en compte la présence des mentions latines « S.l. », « S.n. » et « S.d. » dans le champ unimarc 210 (sous-champs $a, $c, $d).
      Merci de l’intérêt que vous portez à CheckSUDOC.

      1. Riou-Genty

        Merci beaucoup ! Bonne journée

  6. Emilie

    Bonjour,
    Je vous remercie tout d’abord pour la mise en place de cet outil très pratique. Je voulais juste vous faire une suggestion. J’utilise le mode avancé et je me demandais s’il serait possible de pouvoir copier le PPN plus facilement. Actuellement il est en haut de la vignette sous la forme d’un lien vers le Sudoc, mais peut-être qu’il serait plus facile s’il était aussi indiqué sans lien afin qu’on puisse coller le PPN directement dans Winibw pour faire les corrections.
    Merci encore,
    Bien cordialement,

    1. Yves Tomic

      Bonjour,
      Le PPN a été ajouté dans la notice de résultat. Vous pourrez ainsi le récupérer plus facilement.
      Merci de l’intérêt que vous portez à CheckSUDOC.
      Yves Tomic

  7. Safia

    Bonjour,
    Est-il possible d’ajouter aux contrôles, le ‘premier indicateur de la zone 101’, notamment lorsqu’il y est indiqué ‘#’.
    Je vous remercie d’avance pour votre réponse.
    Safia

  8. E. Riou-Genty

    Bonjour,
    Une mise à jour de CheckSUDOC est-elle envisagée afin d’intégrer la présence de la zone 183 ? (cf nouvelles règles d’application de RDA-FR dans le Sudoc). En vous remerciant par avance pour votre réponse.

  9. E. Riou-Genty

    Bonjour,
    Je ne visualise pas mon dernier message… je me permets donc de réitérer ma demande : suite aux nouvelles consignes liées à RDA.FR à appliquer dans le Sudoc, pourriez-vous ajouter la présence de la zone 183 ? par ailleurs, je ne sais pas comment pourrait évoluer votre outil (très pratique !) par rapport à la zone 219 ? en effet, dorénavant, les notices du Sudoc peuvent soit comporter une zone 210, soit une zone 219, soit plusieurs zones 219 ? Comment peut être gérer l’inadéquation entre la date mentionnée en zone 100 $a et la date mentionnée en 210$d ou 219$d… ? En vous remerciant par avance,
    Emmanuelle

    1. Yves Tomic

      Merci de vos suggestions. Ces éléments seront intégrés prochainement.

Laisser un commentaire

Aller au contenu principal