Date de création du document : 2019-09-24
Date de dernière mise à jour du document : 2024-09-26
En 2018, après avoir fait un premier bilan, il a été décidé de poursuivre l'expérimentation Sudoc FRBR. Des spécifications d'ajustement ont été fournies au prestataire (OCLC Pica) afin d'améliorer les performances qualitatives de l'algorithme. Entre-temps, OCLC a développé un nouvel algorithme qui a eu pour conséquence la révision des spécifications et le passage par un nouveau cycle de recette avant l'implémentation dans la base de production du Sudoc. Ce nouveau programme, surnommé "algoclc2", est passé en production le 14 octobre 2019. |
|
Historique : billets de blog à lire sur l'expérimentation. |
Des modèles de données… |
|
FRBR : Functional Requirements for Bibliographic Records / Fonctionnalités requises des notices bibliographiques *«Modèle conceptuel de données bibliographiques, validé en 1997 par l'IFLA. Il définit les entités sur lesquelles porte l'information catalographique ainsi que les relations qui existent entre ces entités. Il analyse toute ressource décrite comme l'imbrication de quatre entités distinctes (Œuvre, Expression, Manifestation, Item) dont la notice catalographique reflète les attributs et les relations. Ce modèle, comme le modèle FRAD, est désormais obsolète». |
|
IFLA LRM : Library Reference Model, Modèle de Référence pour les Bibliothèques *«Modèle conceptuel publié par l'IFLA en 2017, conçu pour être utilisé dans le web de données et promouvoir l'utilisation des données bibliographiques dans cet environnement. Ce modèle fusionne et remplace les 3 modèles : FRBR, FRAD et FRSAD. Il a vocation à résoudre les incohérences de ces trois modèles et facilite l'écriture d'un code de catalogage tel que RDA». |
|
… et des façons de les mettre en oeuvre |
|
FRBRisation *«Néologisme désignant les processus automatiques visant à rapprocher du modèle FRBR les données des notices bibliographiques d'un catalogue de bibliothèque n'ayant pas été produit suivant ce modèle». |
|
Expérimentation « Sudoc FRBR » : essai de FRBRisation de données du catalogue Sudoc par programme
|
* définitions issues du site Transition bibliographique
J.e-Cours du 28/11/19 : Expérimentation Sudoc FRBR/LRM - saison 2. | |
Présentation des enjeux de cette seconde expérimentation, de l'amélioration apportée aux résultats et à la visualisation des données par le nouvel algorithme, et de la manière dont tout catalogueur peut participer pour renforcer la qualité des données "regroupées. | |
Modélisation a minima |
|
|
|
Opérations entièrement automatisées |
|
|
|
Un leitmotiv : "Mieux vaut plusieurs clusters homogènes qu'un gros cluster attrape-tout" |
|
|
|
Création de notices autorité de regroupement et d'un point d'accès dans les notices bibliographiques |
|
Ces données sont générées par programme. Il n'est donc pas possible de les créer, les modifier ou les supprimer manuellement tant que l'algorithme tournera chaque nuit.
Notice autorité de regroupement (ou pré-notice d'oeuvre)
Exemple : les accès auteurs sont désormais présentés dans des zones A5X1
|
|
Point d'accès dans les notices bibliographiques La zone B579, créée lors de la première expérimentation, est conservée et sa structure demeure inchangée. Seul l'affichage est légèrement modifié :
Exemple
|
|
La notice de regroupement (Tr) et la zone B579 ne sont pas exportées (elles ne font pas partie du format d'échange) et ne sont pas visibles dans le catalogue public. |
|
Contraintes techniques et périmètre restreint des données traitées |
|
Le programme tourne sur les notices bibliographiques de la base de production du Sudoc. Certaines notices sont cependant exclues des calculs de regroupement de par leur type ou leur statut : Les agrégats, qui recouvrent :
L'algorithme ne peut pas lier une notice bibliographique à plusieurs grappes, il ne peut donc traiter correctement les agrégats. |
|
Les notices bibliographiques sans exemplaire Par choix, la nouvelle expérimentation se base uniquement sur les notices réellement utilisées par les établissements du réseau Sudoc. |
|
Les notices uniques ou isolées Le programme crée une notice de regroupement lorsqu'il existe au minimum deux notices bibliographiques avec localisation qu'il est possible de rassembler. Les notices de recueils factices sont de fait non traitées car uniques (elles sont de plus filtrées en amont par leur statut). |
|
Les notices de thèses bénéficient d'un traitement particulier de l'algorithme qui :
Exemple
|
Seule l'interface professionnelle de catalogage WinIBW permet de visualiser les résultats de ces traitements. Les commandes de recherche
Exemple
Exemple
|
|
Les données affichées
Exemple
Exemple
Exemple
|