Gérer les doublons

La détection de doublons éventuels est indispensable avant toute publication : la présence de doublons au sein de Calames entraîne l'échec de la publication.

La détection de doublons

La détection de doublons se fait à partir du volet gauche, clic droit sur le document EAD, puis Gestion > Détection doublons

La vérification par le système se fait en 2 étapes :

  • au sein du document EAD, entre composants

  • au sein de l'ensemble de la base Calames : ne sont alors examinés que les <c> publiés.

En l'absence de doublon

les traces affichent les mentions suivantes :

En cas de doublons

Les traces précisent les identifiants et les cotes des composants concernés :

La cote permet de retrouver rapidement le composant concerné dans le corps du fichier EAD

ExempleDans l'exemple ci-dessus, les traces signalent :

  • un couple de doublon dans le même document EAD, en l'occurrence les <c> du MS 1 et du MS 33 qui ont le même ID.

  • aucun autre doublon avec les autres documents EAD : l'opération « détection doublons de ce document par rapport à la base complète » n'affiche aucun <c> en erreur (0 ligne affectée). Cela signifie que ce document ne contient aucun ID déjà publié dans un autre document de la base.

Pour corriger les quelques ID en double

Il est nécessaire de supprimer l'ID à corriger de chaque paire de doublons :

  1. Editer le <c> à l'ID erroné

  2. Supprimer le contenu de l'attribut ID du <c>

  3. Enregistrer.

Le système attribue un nouvel ID unique au <c>. Il n'y a plus de doublons dans ce fichier.

S'il existe des doublons entre documents EAD, la procédure de correction est la même : supprimer le contenu de l'attribut ID du <c> non encore publié pour que le système en génère un nouveau.

ConseilPour retrouver les composants concernés

En cas de document EAD conséquent ou de doublons entre différents documents EAD, utilisez la fonction Rechercher sur l'ID problématique, puis Synchroniser (voir détails sur la recherche dans la base)

Pour corriger un gros volume d'ID en double dans un fichier à publier

Si les 2 conditions suivantes sont remplies :

- les doubles dans le nouveau fichier EAD à publier sont en grand nombre,

- le fichier ne contient que des composants jamais publiés dont tous les identifiants peuvent être changés (c'est notamment le cas quand les ID doublons ne sont que des scories de copie pour la création de nouveaux composants),

il est possible, pour supprimer tous les ID en double d'un seul coup, de faire un export kill-id de tout le fichier et de le ré-importer pour que le système attribue un nouvel identifiant à chacun des composants du fichier.