theses.fr : l’API XML de recherche

logoThesesFrtheses.fr dispose d’une API permettant de récupérer les résultats d’une requête.

Construisez votre requête via l’interface http://www.theses.fr et ajoutez à l’URL de la page le paramètre &format= suivi du format choisi parmi les trois actuellement proposés : XML, JSON et ATOM.

Exemple : vous cherchez toutes les thèses soutenues à Aix-Marseille 2 entre 2010 et 2011 ayant comme discipline « Environnement et santé » et pour lesquelles le texte intégral est accessible en ligne. Dans l’interface, sélectionnez les filtres et facettes correspondants : filtre « Uniquement les thèses soutenues accessibles en ligne » ; date de soutenance entre 2010 et 2011 ; facette Etablissement « Aix-Marseille 2 »  et facette Discipline « Environnement et santé »
L’URL de votre requête est :

Continuer la lecture

theses.fr : les technologies utilisées

logoThesesFrtheses.fr a été développée en interne par l’ABES.

Il s’agit d’une application web Java, tournant sur le conteneur de servlet Tomcat, et dont les urls sont réécrites via Apache.
Nous avons choisi d’utiliser uniquement des JSP et Servlet, sans framework particulier ; voici les quelques librairies utilisées :  Saxon / JDOM / SolRJ / JSON …
La partie « visible » est constituée d’HTML (bien sûr!) et d’une feuille de style (créée par Oxynel), ainsi que de javascript (JQuery) pour les widgets présents : autocompleter, slider, checkers…
Mais theses.fr sait délivrer autre chose que de l’HTML, via ses Servlets. Les API XML de theses.fr vous permettent d’obtenir le contenu sous différents formats, tels que (pour l’instant !) :
– Flux Atom
– RDF
– XML

Continuer la lecture

theses.fr : l’API XML des personnes

logoThesesFrtheses.fr dispose d’une API dédiée aux personnes. Elle permet de récupérer les informations de la personne et la liste des thèses liées.

Repérez la page de la personne qui vous intéresse, et ajoutez le paramètre .rdf à l’URL de la page.

Exemples : http://www.theses.fr/034282297

et http://www.theses.fr/034282297.rdf

Vous obtenez un fichier RDF/XML.

Les données décrivant la personne utilisent le vocabulaire FOAF, les données décrivant les thèses utilisent BIBO et DC, les relations sont exprimées grâce aux MARC RELATORS PROPERTIES

theses.fr utilise les autorités du Sudoc : chaque personne possède un identifiant propre à theses.fr mais aussi son  identifiant pérenne issu du référentiel IdRef.

Attention : cet API ne permet pas de récupérer le nuage de mots de la personne disponible dans l’interface de theses.fr

Le dernier chapitre de la documentation de theses.fr est consacré aux API.

N’hésitez pas à utiliser le guichet d’assistance ABESstp pour nous faire part de vos remarques.

IMR

Continuer la lecture

theses.fr : l’API XML des thèses

logoThesesFrMoteur de recherche des thèses de doctorat françaises, theses.fr propose des API XML d’accès aux données.

Le principe est d’utiliser l’interface puis d’ajouter un paramètre à l’URL pour obtenir les données brutes.

Pour récupérer les données d’une thèse de theses.fr en RDF, repérez la thèse convoitée, récupérez son URL, ajoutez .rdf

Exemples :

http://www.theses.fr/2009PA040090

et

http://www.theses.fr/2009PA040090.rdf

Dans le fichier RDF/XML, les vocabulaires suivants sont utilisés

  • pour qualifier les éléments de la thèse : Dublin Core, BIBO, ISBD (vocabulaire en cours de normalisation par l’IFLA)
  • pour décrire les personnes et les organismes : FOAF
  • pour décrire les relations : MARC RELATORS PROPERTIES

Le dernier chapitre de la documentation de theses.fr est consacré aux API.

Les API de theses.fr démarrent modestement ;  n’hésitez à nous faire part de vos besoins via le guichet d’assistance ABESstp

IMR

Continuer la lecture

IdRef : des pages HTML et RDF plus riches

En Octobre 2010, l’ABES a inauguré IdRef, avec l’ambition de promouvoir l’utilisation des autorités Sudoc au-delà du Sudoc, et même au-delà des seules applications ABES comme Calames ou STAR.

Parmi les moyens techniques mis au service de cette stratégie, figurait l’exposition sur le Web des données d’autorité au moyen de pages HTML et RDF dédiées et d’une batterie d’URL pérennes associées. Depuis ce matin, ces pages sont considérablement enrichies.

Continuer la lecture

Le Sudoc sur le Web de données : plus de détails

Après d’autres catalogues, l’ABES publie aujourd’hui les 10 millions de notices bibliographiques du Sudoc sur le Web de données. Cette décision vient compléter les précédentes initiatives de l’Agence en matière de participation au Web sémantique :

  • En 2008, Calames, catalogue des archives et des manuscrits, devenait conforme à RDFa.
  • En octobre 2010, dès son ouverture, IdRef exposait en RDF/XML plus de 2 millions d’entités décrites par ses notices d’autorité. D’ailleurs, à partir d’aujourd’hui, ces données RDF/XML sont encore plus riches.
  • En octobre 2010, à l’occasion de l’ouverture de la nouvelle version de STAR, application professionnelle de gestion des thèses numériques, chaque thèse de STAR était décrite par une page HTML conforme à RDFa. D’ici quelques jours, ces milliers de pages seront refondues et absorbées dans theses.fr, le portail des thèses françaises. theses.fr restera conforme à RDFa et proposera également des pages RDF/XML.
Continuer la lecture

IdRef dans votre application

Depuis octobre 2010, les interfaces professionnelles de STAR et de Calames sont « branchées » sur IdRef. Pour sélectionner un concept Rameau ou pour créer une notice d’autorité pour un nouvel auteur, les catalogueurs de thèse ou de manuscrits cliquent sur un bouton IdRef de leur interface de saisie et basculent dans les formulaires Web d’IdRef pour y lancer une recherche ou saisir des informations qui seront enregistrées dans LA base centrale et unique des autorités Sudoc.

Continuer la lecture

Micro Web Service Biblio : quels sont les documents rattachés à cette personne ?

Biblio est le premier micro Web Service IdRef proposé par l’ABES : il permet de lister les documents signalés dans le Sudoc et rattachés à la notice d’autorité d’une personne.

A partir de l’identifiant d’une notice d’autorité de personne physique du Sudoc (« PPN » pour les intimes), Biblio fournit la liste des documents liés, en précisant pour chacun d’entre eux son titre et son identifiant Sudoc (PPN).

Continuer la lecture

Micro Web Service WHERE : où se trouve ce document ?

Il est désormais recommandé d’utiliser le service Multiwhere, au lieu de Where, déprécié.

Multiwhere est plus riche :

  • il peut traiter plusieurs PPN à la fois ;
  • il précise les coordonnées géographiques de chaque bibliothèque.

 

Where est le premier micro Web Service Sudoc proposés par l’ABES : il permet de lister toutes les bibliothèques du réseau qui ont déclaré posséder ce document.

A partir de l’identifiant d’une notice bibliographique du Sudoc (« PPN » pour les intimes), Where fournit la liste des bibliothèques, en précisant pour chacune d’entre elles un intitulé court et un identifiant, le RCR.

Continuer la lecture

Les Micro Web Services ABES

Un Web service est une solution technique basée sur les standards du Web (protocole HTTP, XML) qui vise à faciliter les interactions entre deux applications.
Le protocole SRU, par exemple, est un Web Service qui permet d’interroger à distance une base de données. C’est un Web Service relativement complexe car il propose plusieurs actions (décrire le service, rechercher, feuilleter) et prévoit plusieurs paramètres (format, nombre de résultats, pagination des résultats, etc). Son utilisation demande un certain apprentissage, qui passe par la lecture de la documentation et une série d’essais et d’erreurs.
Il en est de même pour des Web Services comme OpenURL, OAI-PMH ou encore les Web Services de HAL.

Continuer la lecture