PDFStar, un service bien utile pour les thésards

Logo_Mines_ParisTechAprès la soutenance de leur thèse, les doctorants ont besoin de fournir un exemplaire de leur mémoire de thèse sous forme électronique en conformité avec les normes d’archivage. Suite au besoin exprimé par le correspondant Star de la bibliothèque de l’École des Mines, PDFStar a été réalisé  afin de répondre au besoin de mise en conformité des documents PDF. Parmi les outils capables de répondre à ce besoin, on note Acrobat Pro, qui est l’outil de référence mais un logiciel propriétaire. Dans le domaine des logiciels libres, on trouve ghostscript et pdftk, disponibles sur les plateformes compatibles Unix (Linux, FreeBSD, …). Notre choix porte sur les logiciels libres. Néanmoins, ils ont les inconvénients de n’être compatibles qu’avec des systèmes d’exploitation qui ne sont pas toujours ceux des utilisateurs ciblés et aussi de n’être utilisables que par une machine à la fois.

De la connaissance que nous avons des utilisateurs ayant ce besoin, il fallait :

  • éviter tout outil en ligne de commande avec des options « tordues »;
  • éviter d’avoir à dédier un outil à chaque utilisateur;
  • ne pas chercher un outil compatible avec la multitude de systèmes d’exploitation possibles et imaginables.

D’où l’idée d’encapsuler tout cela dans une interface web de façon à offrir un « service de mise en conformité », plutôt qu’un logiciel.

Organisation de pdfstar (le logiciel)

PDFStar est organisé en deux parties :

  • un moteur, qui effectue les travaux de mise en conformité, basé actuellement sur l’outil ghostscript version supérieure à 9. Il s’agit d’un script qui reçoit un fichier « .pdf » en entrée et lance l’appel à ghostscript avec les options qui vont bien pour la mise en conformité;
  • une interface web, développée en PHP, qui gère les interactions avec l’utilisateur : chargement et déchargement des fichiers, configuration générale du logiciel, configuration de contrôle d’accès, journalisation des l’activité, …

Le contrôle d’accès se fait sur un serveur web Apache, grâce à un fichier « .htaccess« , habituel dans ce type de configuration. On peut soit laisser le serveur ouvert, soit le configurer avec les options de contrôle usuelles : par adresse IP ou ajouter une vérification de identité du genre basique, LDAP, CAS ou Shibboleeth. Le logiciel est disponible en téléchargement, sous licence GPL à l’adresse ci-dessous.

Organisation de pdfstar.mines-paristech.fr (le service de l’École des Mines)

L’École des Mines met à disposition PDFStar en tant que service à l’adresse : https://pdfstar.mines-paristech.fr

Ce service est disponible, après authentification avec login et mot de passe, à tous les utilisateurs des organismes faisant partie de la fédération d’identités de Renater (authentification faite à l’aide de Shibboleth).

Avenir du logiciel

Dans un proche avenir, nous allons intégrer d’autres outils permettant soit une conversion plus rapide, soit de traiter des cas où la mise en conformité ne se passe pas correctement à cause de polices de caractères propriétaires.

Liens utiles

José-Marcio Martins, Responsable technique au Centre de Calcul et Systèmes d’Information, École des Mines

Cette publication a un commentaire

Laisser un commentaire

Aller au contenu principal