theses.fr : comment fonctionne l’onglet « personnes » ?

(If libraries were like relational databases. Par Bpanulla. CC BY-NC-SA 2.0 . Source : Flickr)

Depuis le 17 janvier, www.theses.fr propose un nouveau périmètre de recherche : les personnes impliquées dans la recherche doctorale française (directeurs de thèse, auteurs de thèse et rapporteurs).

Pour mettre en place cette nouvelle fonctionnalité, l’ABES a dû résoudre plusieurs difficultés techniques.

En effet, theses.fr s’appuie sur SolR, un moteur de recherche proposant une API XML et JSON par HTTP. Les données exposées étant décrites par document (TEF), nous les avons naturellement indexées de cette manière. C’est-à-dire qu’une thèse (soutenue ou en préparation) correspond à un TEF et est indexée sous la forme d’un document SolR.
La description d’une thèse contient, entre autre, son auteur, son directeur de thèse, ses rapporteurs.

Continuer la lecturetheses.fr : comment fonctionne l’onglet « personnes » ?

PCP : gérer vos états de collection

Au premier semestre 2012, une interface de visualisation des plans de conservation partagée (PCP) sera ouverte. En exploitant les états de collection des périodiques, elle donnera à voir dans un premier temps les lacunes et les redondances existant dans un périmètre modulable de bibliothèques (PCP, département, région, toute la France, etc.).
Cette interface s’adresse principalement aux gestionnaires de PCP existants mais doit permettre aussi le développement  de nouveaux PCP.

Continuer la lecturePCP : gérer vos états de collection

Exemplariser sans WinIBW

  • Auteur/autrice de la publication :
  • Post category:Sudoctechno

Au second semestre 2012, l’ABES proposera une interface Web dédiée à l’exemplarisation. Cette nouvelle application s’adressera aux professionnels des réseaux Sudoc et Sudoc-PS pour exemplariser un document, sans modifier le niveau bibliographique des notices.

  • Ergonomie :

La connaissance du format MARC ne sera pas un pré-requis nécessaire à la saisie des données.
L’interface devrait s’articuler sur 4 écrans :
1-Onglet Recherche
2-Onglet Résultat (liste de notices bibliographiques)
3-Onglet Titre
4-Onglet Edition (modification, création)

Continuer la lectureExemplariser sans WinIBW

Le Sudoc sur le Web de données… Un petit pas de plus

  • Auteur/autrice de la publication :
  • Post category:Sudoc

Début juillet l’ABES annonçait la publication des 10 millions de notices bibliographiques du Sudoc sur le Web de données. Le seul bémol étant l’impossibilité d’obtenir la version sémantique de ces données via l’interface classique.

Afin d’harmoniser l’indexation par les moteurs de recherche une page canonique a été définie dans cette interface.
L’url canonique est donc déclarée dans l’entête des pages HTML <head>… </head>
Exemple :

<link rel=’canonical’ href=’http://www.sudoc.fr/153472472/’>

…avec en prime le lien de relation logique  vers la variante RDF de la notice.
Exemple :

<link rel=’alternate’ type=’application/rdf+xml’ href=’http://www.sudoc.fr/153472472.rdf’/>

En parallèle, l’URL canonique apparaît désormais dans la notice consultée.
La première ligne de chaque notice indique son identifiant pérenne et non plus le seul numéro ppn
Exemple d'identifiant pérenne de notice

Que les amateurs du script SUDOC+  se rassurent, symac  a eu le temps de le mettre à jour !

IAN

Continuer la lectureLe Sudoc sur le Web de données… Un petit pas de plus

theses.fr : l’API XML de recherche

  • Auteur/autrice de la publication :
  • Post category:theses.fr

logoThesesFrtheses.fr dispose d’une API permettant de récupérer les résultats d’une requête.

Construisez votre requête via l’interface http://www.theses.fr et ajoutez à l’URL de la page le paramètre &format= suivi du format choisi parmi les trois actuellement proposés : XML, JSON et ATOM.

Exemple : vous cherchez toutes les thèses soutenues à Aix-Marseille 2 entre 2010 et 2011 ayant comme discipline « Environnement et santé » et pour lesquelles le texte intégral est accessible en ligne. Dans l’interface, sélectionnez les filtres et facettes correspondants : filtre « Uniquement les thèses soutenues accessibles en ligne » ; date de soutenance entre 2010 et 2011 ; facette Etablissement « Aix-Marseille 2 »  et facette Discipline « Environnement et santé »
L’URL de votre requête est :

Continuer la lecturetheses.fr : l’API XML de recherche

theses.fr : les technologies utilisées

logoThesesFrLe moteur de recherche theses.fr a été développée en interne par l’Abes. Il s’agit d’une application web Java, tournant sur le conteneur de servlet Tomcat, et dont les urls sont réécrites via Apache.

Nous avons choisi d’utiliser uniquement des JSP et Servlet, sans framework particulier. Voici les quelques librairies utilisées :  Saxon / JDOM / SolRJ / JSON …
La partie « visible » est constituée d’HTML (bien sûr!) et d’une feuille de style (créée par Oxynel), ainsi que de javascript (JQuery) pour les widgets présents : autocompleter, slider, checkers…

Cependant, theses.fr sait délivrer autre chose que de l’HTML, via ses Servlets. Les API XML de theses.fr permettent d’obtenir le contenu sous différents formats, tels que (pour l’instant !) :

  • Flux Atom
  • RDF
  • XML
Continuer la lecturetheses.fr : les technologies utilisées

theses.fr : l’API XML des personnes

  • Auteur/autrice de la publication :
  • Post category:theses.fr

logoThesesFrtheses.fr dispose d’une API dédiée aux personnes. Elle permet de récupérer les informations de la personne et la liste des thèses liées.

Repérez la page de la personne qui vous intéresse, et ajoutez le paramètre .rdf à l’URL de la page.

Exemples : http://www.theses.fr/034282297

et http://www.theses.fr/034282297.rdf

Vous obtenez un fichier RDF/XML.

Les données décrivant la personne utilisent le vocabulaire FOAF, les données décrivant les thèses utilisent BIBO et DC, les relations sont exprimées grâce aux MARC RELATORS PROPERTIES

theses.fr utilise les autorités du Sudoc : chaque personne possède un identifiant propre à theses.fr mais aussi son  identifiant pérenne issu du référentiel IdRef.

Attention : cet API ne permet pas de récupérer le nuage de mots de la personne disponible dans l’interface de theses.fr

Le dernier chapitre de la documentation de theses.fr est consacré aux API.

N’hésitez pas à utiliser le guichet d’assistance ABESstp pour nous faire part de vos remarques.

IMR

Continuer la lecturetheses.fr : l’API XML des personnes

theses.fr : l’API XML des thèses

  • Auteur/autrice de la publication :
  • Post category:theses.fr

logoThesesFrMoteur de recherche des thèses de doctorat françaises, theses.fr propose des API XML d’accès aux données.

Le principe est d’utiliser l’interface puis d’ajouter un paramètre à l’URL pour obtenir les données brutes.

Pour récupérer les données d’une thèse de theses.fr en RDF, repérez la thèse convoitée, récupérez son URL, ajoutez .rdf

Exemples :

http://www.theses.fr/2009PA040090

et

http://www.theses.fr/2009PA040090.rdf

Dans le fichier RDF/XML, les vocabulaires suivants sont utilisés

  • pour qualifier les éléments de la thèse : Dublin Core, BIBO, ISBD (vocabulaire en cours de normalisation par l’IFLA)
  • pour décrire les personnes et les organismes : FOAF
  • pour décrire les relations : MARC RELATORS PROPERTIES

Le dernier chapitre de la documentation de theses.fr est consacré aux API.

Les API de theses.fr démarrent modestement ;  n’hésitez à nous faire part de vos besoins via le guichet d’assistance ABESstp

IMR

Continuer la lecturetheses.fr : l’API XML des thèses

IdRef : des pages HTML et RDF plus riches

En Octobre 2010, l’ABES a inauguré IdRef, avec l’ambition de promouvoir l’utilisation des autorités Sudoc au-delà du Sudoc, et même au-delà des seules applications ABES comme Calames ou STAR.

Parmi les moyens techniques mis au service de cette stratégie, figurait l’exposition sur le Web des données d’autorité au moyen de pages HTML et RDF dédiées et d’une batterie d’URL pérennes associées. Depuis ce matin, ces pages sont considérablement enrichies.

Continuer la lectureIdRef : des pages HTML et RDF plus riches
Aller au contenu principal