Récupérer les données de personnes en RDF

Récupérer des données via l'API XML

Les données d'une personne sont disponibles au format RDF/ XML.

Pour obtenir les données affichées sur la page descriptive d'une personne, vous devez :

  1. Lancez une requête dans la barre de recherche de theses.fr, dans l'onglet « Personnes » (voir rubriques « Utiliser la recherche simple de theses.fr » et « Utiliser la recherche avancée de theses.fr »).

  2. Sélectionnez une personne.

  3. Ajoutez à l'URL de la page de cette personne un paramètre pour obtenir les données brutes dans le format de votre choix : .xml ou .rdf (Ex : https://www.theses.fr/PPN.rdf)

  4. Les données brutes décrivant la personne s'affichent au format .rdf.

Il est à noter que vous ne pouvez pas récupérer par ce biais le nuage de mots clés qui apparaît sur la page de la personne. Vous récupérerez seulement les informations relatives aux thèses liées à la personne ainsi qu'aux rôles que cette dernière a tenus par rapport aux thèses de la liste.

Vocabulaires utilisés par l'API XML

L'ABES a fait le choix de réutiliser des vocabulaires déjà existants :

  • BIBO (Bibliographic Ontology) pour identifier les thèses ;
  • ISBD pour décrire des documents ;
  • FOAF (Friend of a friend) pour identifier les personnes et les organismes ;
  • Marc Relator Terms et Dublin Core pour caractériser les liens entre les personnes et organismes et les thèses.

Données récupérables via l'API XML

Les informations qui figurent dans les données RDF sont les suivantes

ComplémentDans le bloc <foaf>

<foaf:Agent> : L'URL de la page theses.fr de la personne. Cette URL est pérenne est fait office d'identifiant.

<foaf:name> : Le nom de la personne.

<owl:sameAs> : l'URL de la page IdRef de la personne. La base de données IdRef est la base des autorités utilisées pour indexer les documents référencés dans le Sudoc et dans theses.fr. C'est à partir de cette base qu'est attribué l'identifiant pérenne (PPN) d'une personne.

ComplémentDans les blocs <bibo:Thesis> : une description succincte de chacune des thèses liées au nom de la personne

<dc:title> : titre de la thèse

<marcrel:aut> : balise décrivant l'auteur de la thèse

  • <foaf:Person> : URL de la page de la personne dans theses.fr
  • <foaf:name> : prénom et nom de l'auteur de la thèse

<marcrel:ths> : balise décrivant le directeur de la thèse

  • <foaf:Person> : URL de la page de la personne dans theses.fr
  • <foaf:name> : prénom et nom du directeur de la thèse

<marcrel:dgg> : balise décrivant l'établissement de soutenance ou de préparation de la thèse

  • <foaf:Organization> : URL de la page de l'établissement de soutenance ou de préparation dans theses.fr
  • <foaf:name> : nom de l'établissement de soutenance ou de préparation de la thèse

<dcterms:contributor> : balise décrivant l'école doctorale à laquelle la thèse est rattachée

  • <foaf:Agent> : URL de la page de l'école doctorale dans theses.fr
  • <foaf:name> : nom de l'école doctorale à laquelle la thèse est rattachée

<dc:date> : date de soutenance de la thèse

<dc:identifier> : URL permettant d'accéder au texte intégral de la thèse lorsque celle-ci fait l'objet d'une diffusion en ligne