Les doublons dans le Sudoc

Le dédoublonnage, un enjeu majeur depuis la création du Sudoc

Le Sudoc était, à son ouverture, le résultat de la fusion de cinq bases ou parties de bases bibliographiques : CCN-PS, Téléthèses, SIBIL, OCLC, BN-Opale, ainsi que des notices en provenance des bibliothèques ou issues des programmes de rétroconversion.

Les notices qui décrivaient la même ressource, issues de ces différentes bases, ont été fusionnées grâce à des outils de dédoublonnage mis en œuvre à cette époque, et toujours utilisés lors d'import de notices.

Les causes de l'existence de doublons dans le Sudoc

Doublons créés à l'occasion d'imports

A l'occasion d'imports dans le Sudoc (en provenance d'éditeurs ou d'établissement), des doublons de notices peuvent aujourd'hui encore être créés malgré la présence de programmes automatisés pour les détecter. Ces doublons surviennent notamment lorsque la notice existante présente des données trop incomplètes (cas de notices de rétroconversion anciennes), ou lorsqu'elle a été cataloguée selon des pratiques différentes.

Le cas des retirages

Pour éviter la multiplicité des notices en cas de retirages successifs, les règles de description en usage dans le Sudoc préconisent d'enregistrer une seule notice dans le cas de retirages, en indiquant la date de ce retirage en zone 305. C'est là une pratique très spécifique au Sudoc, la plupart des bases de données existantes privilégiant une notice par date de publication distincte. Il est donc fréquent que soient versées dans le Sudoc des notices de retirage, à charge pour le catalogueur de les repérer et de les fusionner ensuite avec la notice de l'édition initiale, après un examen attentif des ressources incriminées.

Erreurs de catalogage

Des doublons sont créés en ligne par des catalogueuses et catalogueurs qui n'ont pas bien identifié que le document qu'ils cataloguent est déjà décrit dans la base (voir Doublon créé en ligne).

Conseil

Le système central alerte à l'enregistrement de la notice du risque de doublon ; il envoie également tous les matins des messages d'alerte aux bibliothèques responsables de cette création.

Les outils de détection de doublon

Les programmes de comparaison de notices

Des programmes automatiques de détection de doublons sont lancés lors des imports de notices en provenance d'établissements ou d'éditeurs, pour comparer les notices importées avec les notices déjà présentes et pour les fusionner lorsqu'elles présentent un certain taux de similarité.

Ce sont ces mêmes programmes de détection automatique qui créent des notices de statut B, statut spécifique signalant un risque potentiel de doublon :

  • pour les notices de périodiques importées depuis le Registre de l'ISSN,

  • pour les notices de ressources électroniques émanant d'éditeurs,

  • pour les imports d'établissements.

Les notices créées par des catalogueurs sont également comparées de manière automatique par le biais de certaines entrées d'index (les identifiants - ISBN, ISSN, etc. - ou la clé « titre »). Les notices comportant des entrées d'index semblables sont ensuite comparées deux par deux.

Les 5 situations rencontrées par les catalogueuses et catalogueurs

  1. La catalogueuse ou catalogueur créent un doublon en ligne

    => une alerte immédiate leur permettent de corriger son erreur : ils suppriment la notice créée par erreur en double (commande SUP , ou bouton Supprimer) avant qu'elle ne soit versée dans son SGB (Voir procédure de dédoublonnage).

  2. La catalogueuse ou catalogueur sont confrontés à une notice en statut B

    => il peuvent eux-mêmes intervenir (commande WinIBW : DED). Il n'est pas nécessaire qu'ils soient dédoublonneuse ou dédoublonneur local pour son établissement, toute catalogueuse ou catalogueur peuvent intervenir sur une notice de statut B (Voir procédure de dédoublonnage).

  3. La catalogueuse ou catalogueur identifient eux-mêmes un doublon de notice bibliographique (hors ressources continues)

    => il doivent le signaler à la dédoublonneuse ou dédoublonneur local de leur établissement (Voir procédure de dédoublonnage).

  4. La catalogueuse ou catalogueur découvrent un doublon de notice de ressources continues

    => il doivent le signaler au responsable CR du Sudoc-PS de rattachement de leur établissement (Voir procédure de dédoublonnage).

  5. La catalogueuse ou catalogueur identifient eux-mêmes un doublon de notice d'autorité

    => il doit le signaler à la correspondante ou correspondant Autorités de leur établissement (Voir procédure de dédoublonnage).