Profondeur et précision des descriptions

La description d'un ensemble organisé de documents (fonds ou collection) ou même d'un document isolé peut être plus ou moins précise. Dans le contexte de l'EAD, ce constat revêt une importance particulière, d'une part parce que cette DTD est très riche (nombre d'éléments, éléments répétables, éléments présents en de nombreux endroits), d'autre part parce que l'objet de la DTD, la description archivistique, peut être d'une précision variable, en fonction des moyens de l'établissement, de sa politique documentaire... D'où une double question à laquelle il convient de répondre avant d'entreprendre la rédaction d'un inventaire en EAD : quelle profondeur donner à la description et où commencer cette description ?

Quelle profondeur donner à la description ?

Bien que la réponse à cette question dépende de la nature et de l'intérêt de l'ensemble à traiter, certains principes peuvent être dégagés qui permettent d'obtenir une certaine cohérence entre les descriptions, garantie d'une recherche homogène.

Où commencer : niveau de description le plus général

Un fonds étant par définition un ensemble identifié et organisé, sa description fait en principe l'objet d'un inventaire particulier, et donne donc lieu à la création d'un nouveau document EAD (voir chapitre Quand créer une nouvelle instance EAD).

De cette façon, et suivant le principe de l'héritage des informations, il sera possible de donner au plus haut niveau de la description les informations relatives à cet ensemble, regroupées dans l'élément <archdesc>.

Pour la description de documents isolés, la notion de mise en commun d'informations n'existe pas. On considère le document isolé comme faisant partie d'une collection de l'institution concernée, et c'est cette collection dans son ensemble que décrit l'inventaire en EAD. Les informations de l'élément <archdesc> correspondent aux informations sur l'ensemble des documents concernés.

Suivant le contexte de l'établissement, les ensembles archivistiques petits ou incomplets peuvent être assimilés à des documents isolés et décrits dans l'inventaire des collections de l'établissement sans donner lieu à la rédaction d'un inventaire particulier. Dans Calames, le poids d'un inventaire ne doit pas dépasser les 3 à 4 Mo : lorsque les données encodées d'un instrument de recherche atteignent ce seuil, l'ensemble doit être réparti sur deux ou plusieurs fichiers EAD distincts, dont la publication se fait de manière unifiée grâce à une chaîne de liaison (voir chapitre Hiérarchie des fichiers).

Où s'arrêter : niveau de description le plus fin

Grâce à la souplesse de l'EAD, il est possible de choisir la profondeur que l'on souhaite donner à la description. Si elle doit être le reflet du traitement des documents, les établissements peuvent choisir de privilégier dans un premier temps une description sommaire, puis une description de plus en plus précise au fur et à mesure du traitement.

La création d'un niveau, exprimée sous la forme d'un élément <c>, doit correspondre à une réalité intellectuelle ou matérielle de l'ensemble ou du document considéré. En ce sens, le niveau le plus général sera celui de la description du fonds ou de la collection et le plus fin possible, celui de la plus petite division intellectuelle au sein d'une unité matérielle. Entre ces deux extrêmes, l'unité de communication constitue un niveau de description pertinent qu'il est souhaitable d'atteindre.

Par ailleurs, chaque niveau de la description doit comporter au moins un intitulé (élément <unittitle>) ou un identifiant (élément <unitid>) qui le distingue des niveaux supérieurs ou inférieurs.

Quelle précision donner à l'encodage ? (redondance et surbalisage)

Redondance

Étant donnée la variété des matériaux archivistiques à traiter, les concepteurs de la DTD EAD ont souhaité laisser aux auteurs des descriptions une grande liberté dans l'usage qu'ils peuvent faire des nombreux éléments. Les éléments de description archivistique peuvent ainsi être utilisés à chacun des niveaux de description. Cette grande permissivité ne doit toutefois pas entraîner le catalogueur à répéter les informations par un usage redondant des éléments, au détriment du principe d'héritage établi par la norme ISAD(G). Les informations descriptives doivent donc être données au plus haut niveau pertinent, de telle sorte que 1) elles concernent ledit composant et tous les niveaux qui en dépendent et 2) elles ne soient pas répétées aux niveaux inférieurs : les niveaux inférieurs héritent alors des informations des niveaux supérieurs. En revanche, si l'on rencontre, au sein d'un sous-composant, une information partiellement différente de celle qui a été donnée à un niveau supérieur, il faut la baliser (par ex., un même <persname> avec des rôles différents). Dans ce cas, il ne s'agit pas de surbalisage car l'information encodée vient utilement compléter l'instrument de recherche.

Surbalisage

Le surbalisage correspond à une structuration du texte qui n'est pas utile pour l'usage que l'on souhaite en faire, soit que l'information pertinente soit implicitement déjà présente par héritage au niveau concerné (risque de redondance de l'information), soit que cette information ne soit pas à indexer ou à isoler (risque de recherche moins pertinente : bruit). Le nombre important d'éléments de la DTD n'est que le reflet des catégories différentes d'information qu'il est possible d'identifier dans une description archivistique. Ils ne doivent être utilisés que s'il est utile de préciser à cet endroit de la description de quel type d'information il s'agit et/ou si l'encodage peut être exploité informatiquement. L'usage abusif de certains élements (et notamment des points d'accès) peut entraîner une altération de l'indexation, et donc une recherche de moins bonne qualité. La mention du nom des auteurs de références bibliographiques dans une balise <persname role="070">, pour n'être pas fausse, peut ainsi entraîner, dans l'index "Personne physique" de l'interface de recherche de Calames, une assimilation entre les auteurs des documents (ce qui est essentiel) et les auteurs des articles cités en bibliographie (ce qui n'est généralement pas souhaitable).

Remarque

Dans quelques rares cas, on utilise certains éléments EAD pour des raisons de mises en forme et d'affichage (voir chapitre Normalisation typographique)

Attention

Une information qui n'est utile ni pour la recherche ni pour l'affichage ne doit pas donner lieu à un balisage spécifique et ce malgré la richesse des possibilités qu'offre la DTD EAD.