Surveiller la taille et savoir scinder des fichiers EAD

Connaître la taille d'un fichier EAD

  • La taille du fichier EAD est indiquée dans les propriétés du fichier

  • Le tableau d'arborescence permet de connaître la taille de chaque fichier EAD et de repérer ceux qui sont à diviser et lier car ils dépassent ou sont susceptibles de dépasser la taille critique.

  • Le système affiche un message d'alerte lors de l'édition d'un fichier EAD de plus de 1 000 ko en spécifiant sa taille exacte.

Attention

La taille des fichiers EAD « bruts » au format .xml (après export natif) est équivalente à la moitié seulement de la taille de référence dans l'éditeur Calames (en raison de l'usage d'UTF-16 qui double la taille de la plupart des caractères).

Toutes les valeurs indiquées sur cette page se réfèrent à la taille dans Calames

Attention

Un fichier EAD ne doit pas faire plus de 3,5 Mo (3 500 ko) dans Calames afin de rester maniable dans l'interface professionnelle (délais d'affichage, fiabilité de l'enregistrement, aboutissement du processus de publication).

  • Le système peut tolérer jusqu'à 4 Mo si le Document EAD est achevé, si les seules modifications attendues sont des éléments de détails au sein de composants existants et que le fichier EAD ne fait l'objet que de rares manipulations

Conseil

Tout fichier EAD de plus de 3,5 Mo doit impérativement être divisé au moins en deux.

  • Il est alors conseillé de faire, dans la mesure du possible des éditions partielles du nœud le plus précis qui nécessite une modification pour tout fichier EAD supérieur à 1000 ko afin de ne pas alourdir inutilement les volumes de données à traiter.

Savoir diviser un fichier EAD trop lourd

Si le document EAD de plus de 3,5 Mo dans Calames doit accueillir de nouveaux composants, il faut le scinder au moins en deux (selon la taille et les accroissements à prévoir) et lier les fichiers EAD entre eux.

Pour le bon fonctionnement de l'indexation par héritage l'ensemble des données du <archdesc> du Document EAD tête de liaison doit figurer dans le(s) document(s) EAD lié(s) => le copier-coller est le plus sûr moyen d'en garantir la cohérence.

La procédure de scission peut suivre trois scénarios distincts pour les étapes centrales du traitement, mais commence (étape 1 et 2) et s'achève (étape 7 à 9) toujours de la même manière.

  • scission externe dans un editeur xml : procédure A
  • copie puis suppression dans Calames : procédure B
  • déplacement dans Calames : procédure C

Procédure A : scission externe à Calames

Procédure
  1. Repérer les 2 composants de premier niveau de part et d'autre de la coupure à faire (unittitle et id)
  2. Exporter de Calames au format natif-Déclaration le fichier EAD à scinder
    Attention

    conserver une version de sauvegarde au cas où votre scission se passerait mal

    Voir Manuel lien à faire une fois clarifié les chapitres sur l'export

  3. Faire autant de copies du fichier EAD au format natif qu'il doit y avoir de Documents EAD
  4. Les renommer selon les 2 composants extrêmes couverts par chacun
  5. Dans l'editeur xml, pour chacun, supprimer les composants qui n'ont plus lieu d'y être
    Exemple

    par exemple, pour une division en deux :

    a. Supprimer les composants de la seconde partie dans le futur document EAD tête de liaison.

    b. Supprimer les composants de la première partie dans le futur document EAD lié.

    Attention
    • Bien conserver dans chaque Document le <eadheader> à mettre à jour et le <archdesc> du fichier EAD tête de liaison.
    • Vérifier la conformité [à l'xml] et la validité [au regard de la DTD] des 2 fichiers EAD obtenus avant l'import.
    Truc & astuce

    Faites indenter le document EAD par votre éditeur et utiliser la recherche (Ctrl+F) sur l'id du composant limite repéré à l'étape 1 pour démarrer sa sélection des composants à supprimer.

    Truc & astuce

    Dans l'éditeur xml, utilisez les triangles sur le côté pour « plier » les lignes d'une balise conteneur : pliez les balises des composants de 1er niveau et sélectionnez celles à supprimer.

  6. Ecraser le document d'origine par un import dans Calames de sa version tronquée dans l'éditeur xml.
  7. Copier l'intitulé du fichier EAD à scinder dans les propriétés
  8. Créer par import dans Calames le document lié, en important une version créée par copie partielle de l'export natif
    Compléments
    • dans son intitulé, copier celui du fichier EAD à scinder,

    • puis préciser sa spécificité (n° d'ordre, date, ordre alphabétique, etc.).

  9. Dans Calames corriger le haut niveau <eadheader> des deux fichiers EAD
    c. Dans le Document tête de liaison
    1
    <revisiondesc>
    2
       <change> 
    3
          <date era="ce" calendar="gregorian" normal="AAAA-MM-JJ" type="modification de l'IR">xx mois AAAA</date>
    4
          <item> Scindé en deux pour créer le FileId-XXXX</item>
    5
       </change>
    6
    </revisiondesc>
    d. Dans le nouveau Document
    1
    <filedesc>
    2
       <titlestmt>
    3
          <titleproper>Inventaire du Fonds Jean Tartampion. 2, ms 600 à ms 1200</titleproper>
    4
       </titlestmt>
    5
       <publicationstmt>
    6
          <publisher>Agence bibliographique de l'Enseignement supérieur</publisher>
    7
          <date calendar="gregorian" era="ce" normal="202306" type="publication de l'IR">Date de la primo publication de ce nouveau fichier</date>  
    8
       </publicationstmt>
    9
    </fildesc>
    10
    <profiledesc>
    11
       <creation>Créé par scission du FileId-XXXX qui avait été lui-ême créé selon la DTD EAD 2002</creation>
    12
    </profiledesc>
  10. Déclarer la liaison dans les propriétés du nouveau Document EAD
  11. Dé-publier le document EAD original, faire une vérification de doublon et republier tous les Documents EAD dans l'ordre d'affichage public

Procédure B : copie puis suppression dans Calames

Procédure
  1. Repérer dans Calames les 2 composants de premier niveau de part et d'autre de la coupure à faire (unittitle et id)
  2. Exporter de Calames au format natif-Déclaration le fichier EAD à scinder
    Attention

    conserver une version de sauvegarde au cas où votre scission se passerait mal

    Voir Manuel lien à faire une fois clarifié les chapitres sur l'export

  3. Copier l'intitulé du fichier EAD à scinder depuis les propriétés
  4. Créer dans Calames un nouveau Document EAD en copiant dans son intitulé celui du fichier EAD à scinder puis en précisant sa spécificité (n° d'ordre, date, ordre alphabétique, etc.).
  5. Importer la version de sauvegarde dans le nouveau fichier EAD
    Compléments

    a. La seconde partie du fichier EAD tête de liaison

    b. La première partie du fichier EAD suivant à lier

  6. Supprimer dans l'arbre de gauche à partir des composants repérés à l'étape 1

    a. Supprimer la seconde partie du fichier EAD tête de liaison

    b. Supprimer la première partie du fichier EAD suivant à lier

  7. Dans Calames corriger le haut niveau <eadheader> des deux fichiers EAD
    c. Dans le Document tête de liaison
    1
    <revisiondesc>
    2
       <change> 
    3
          <date era="ce" calendar="gregorian" normal="AAAA-MM-JJ" type="modification de l'IR">xx mois AAAA</date>
    4
          <item> Scindé en deux pour créer le FileId-XXXX</item>
    5
       </change>
    6
    </revisiondesc>
    d. Dans le nouveau Document
    1
    <filedesc>
    2
       <titlestmt>
    3
          <titleproper>Inventaire du Fonds Jean Tartampion. 2, ms 600 à ms 1200</titleproper>
    4
       </titlestmt>
    5
       <publicationstmt>
    6
          <publisher>Agence bibliographique de l'Enseignement supérieur</publisher>
    7
          <date calendar="gregorian" era="ce" normal="202306" type="publication de l'IR">Date de la primo publication de ce nouveau fichier</date>  
    8
       </publicationstmt>
    9
    </fildesc>
    10
    <profiledesc>
    11
       <creation>Créé par scission du FileId-XXXX qui avait été lui-ême créé selon la DTD EAD 2002</creation>
    12
    </profiledesc>
  8. Déclarer la liaison dans les propriétés du nouveau Document EAD
  9. Dé-publier le document EAD original, faire une vérification de doublon et republier tous les Documents EAD dans l'ordre d'affichage public

Procédure C : déplacement dans Calames 

Procédure
  1. Repérer dans Calames les 2 composants de premier niveau de part et d'autre de la coupure à faire (unittitle et id)
  2. Exporter de Calames au format natif-Déclaration le fichier EAD à scinder
    Attention

    conserver une version de sauvegarde au cas où votre scission se passerait mal

    Voir Manuel lien à faire une fois clarifié les chapitres sur l'export

  3. Copier l'intitulé du fichier EAD à scinder depuis les propriétés
  4. Créer dans Calames un nouveau Document EAD en copiant dans son intitulé celui du fichier EAD à scinder puis en précisant sa spécificité (n° d'ordre, date, ordre alphabétique, etc.).
  5. Depuis la fenêtre centrale de Calames, copier l' <eadheader> et le <archdesc> du Document tête de liaison pour le coller à la place de celui par défaut du Document EAD nouvellement créé (éventuellement via une copie dans un txt ou un notepad++) : tous les attributs seront bien pris en compte.
  6. Dans l'arbre de gauche, dans le document EAD à scinder :

    a. « Couper (déplacer) depuis » / « Couper (déplacer) jusque » les composants voués à basculer dans le Document lié

    voir manuel outil de catalogage > Modifier un document EAD > Modifier à partir du volet gauche

    b. Puis les « Coller dedans » le <dsc> du nouveau Document EAD lié.

    Attention

    Attention : les Copier/coller depuis l'arbre de gauche, changent les <c id>. Veillez à bien utiliser la fonction Couper.

  7. Dans Calames corriger le haut niveau <eadheader> des deux fichiers EAD
    c. Dans le Document tête de liaison
    1
    <revisiondesc>
    2
       <change> 
    3
          <date era="ce" calendar="gregorian" normal="AAAA-MM-JJ" type="modification de l'IR">xx mois AAAA</date>
    4
          <item> Scindé en deux pour créer le FileId-XXXX</item>
    5
       </change>
    6
    </revisiondesc>
    d. Dans le nouveau Document
    1
    <filedesc>
    2
       <titlestmt>
    3
          <titleproper>Inventaire du Fonds Jean Tartampion. 2, ms 600 à ms 1200</titleproper>
    4
       </titlestmt>
    5
       <publicationstmt>
    6
          <publisher>Agence bibliographique de l'Enseignement supérieur</publisher>
    7
          <date calendar="gregorian" era="ce" normal="202306" type="publication de l'IR">Date de la primo publication de ce nouveau fichier</date>  
    8
       </publicationstmt>
    9
    </fildesc>
    10
    <profiledesc>
    11
       <creation>Créé par scission du FileId-XXXX qui avait été lui-ême créé selon la DTD EAD 2002</creation>
    12
    </profiledesc>
  8. Déclarer la liaison dans les propriétés du nouveau Document EAD
  9. Dé-publier le document EAD original, faire une vérification de doublon et republier tous les Documents EAD dans l'ordre d'affichage public