Les doublons

On dit que deux notices d'autorité sont en doublon dès lors qu'elles identifient toutes deux la même entité : même personne, même collectivité, même lieu, même sujet. Il convient alors de fusionner les deux notices pour n'en conserver qu'une seule.

Pour détecter des doublons, l'un des outils est VIAF. En effet, agrégeant les données d'autorité et les liens bibliographiques de très nombreuses sources documentaires, VIAF est capable de confronter leurs entités et de faire des rapprochements à grande échelle et sur des données plus riches que n'en disposent les sources seules. Il peut ainsi placer dans un cluster[1] deux notices émanant de la même source : ce qui constitue un doublon selon VIAF.

Pour en savoir plus sur VIAF et les autorités, consulter la vidéo : Usage, pertinence et fonctions des identifiants VIAF et ISNI pour les autorités IdRef.

AlgoDoublons exploite les résultats des calculs de clusterisation[2] de VIAF afin de rendre visible une partie de la production mensuelle de notices en doublon par les réseaux ABES.

Ces doublons sont des doublons potentiels : VIAF est un outil : il met sur la voie mais ne dispense pas d'une analyse, fut-elle brève.

Remarque

Les doublons dans IdRef concernent à 95 % les Personnes. Fin 2017, environ 8 000 doublons sont détectés par VIAF. Ils se répartissent de façon hétérogène entre les établissements mais ne représentent jamais un volume tel qu'ils ne pourraient donner lieu à une prise en charge corrective.