Les chantiers qualité sur les liens url et l'attribut HREF

Chantier qualité sur les liens urls

Eléments EAD examinés :

attribut HREF de <archref>, <bibref>, <extref>, <dao> et <daoloc> de TYPE ''rebond''

Règle :

Respect de la Bonne pratique EAD pour l'usage du HREF dans les éléments de lien

Liste produite le :

entre le 04 et le 18/04/2025

Pour :

Mise à jour des urls Abes, ajout des protocoles d'urls lorsque manquants et traitement éventuel par les établissements lorsque pas d'url identifiable

Périmètre du chantier qualité

Le repérage a été effectué sur tous les HREF publiés dans Calames, quel que soit l'élément les contenant.

Pour les cas de HREF vides, le tableau en lien dans le paragraphe suivant recense uniquement les HREF vides se trouvant dans <extref>. Pour les HREF vides contenus dans un <dao>, voir le tableau en lien dans la partie « Analyse des <dao> » de cette page.

Tableau de repérage

L'Abes met à disposition des établissements un tableau recensant les différents cas de HREF à la valeur non conforme aux Bonnes pratiques EAD ou à la forme d'une url ou de HREF vides dans <extref>.

Chaque onglet du tableau correspond à un cas ci-dessous.

Cas 1 : Urls Abes à corriger

  • 4 690 urls Calames sont à corriger à la suite du changement de certificat opéré sur les urls courantes des applications Abes en janvier 2025.

  • 13 urls theses.fr sont à corriger à la suite du changement de certificat opéré sur les urls courantes des applications Abes en janvier 2025.

  • 6 911 urls Sudoc sont à corriger car non à jour du passage en https du Sudoc.

    L'Abes va corriger l'ensemble de ces urls.

Cas 2 : HREF contenant une url sans protocole

206 HREF contiennent une url ne débutant pas par son protocole (http:// ou https://). L'Abes intervient pour vérifier la validité de cette url et lui ajouter son protocole en HREF si valide.

Cas 3 : HREF contenant une valeur qui n'est pas une url

13 587 HREF contiennent une valeur qui n'est pas une url. L'Abes intervient lorsque le contenu textuel de l'élément est une url pour vérifier la validité de cette url et la placer en HREF si valide. Dans tous les autres cas, il revient aux établissements de corriger ces HREF.

Cas 4 : HREF vides dans <extref>

137 HREF dans un élément <extref> sont vides. Les Bonnes pratiques EAD imposent qu'un HREF soit saisi dans un élément <extref>. L'Abes intervient lorsque le contenu textuel de l'élément est une url pour vérifier la validité de cette url et la placer en HREF si valide. Dans tous les autres cas, il revient aux établissements de corriger ces HREF.

Validité des urls présentes dans les composants

Elément EAD examiné :

attribut HREF de <dao>, <daoloc>,<archref>, <bibref> ou <extref>

Règle :

Validité des url

Liste produite le :

Sur demande de l'établissement en accord avec le responsable du serveur de la bibliothèque numérique

Pour :

information et traitement éventuel par les établissements

L'Abes peut, sur demande de l'établissement via le guichet AbesSTP, Domaine Modification de notices par lot , tester la validité des url saisies dans tel ou tel élément des composants.

Le tableau de résultats fourni par l'Abes permet de connaître pour chaque url testée l'ID du composant et le code http renvoyé par la page cible et ainsi de repérer :

  • les « erreurs 404 » pour les url invalides qui sont à corriger

  • les non réponses dues à un avertissement de sécurité du navigateur (noms de domaines obsolètes, certificats expirés,etc.)

  • les redirections éventuelles

Selon le volume d'erreurs, cette analyse peut aider à préparer des demandes de corrections et mises à jour en masse de <dao> ou <daogrp>

AttentionLimite du service

  • La réponse http ne permet pas de s'assurer que l'url en HREF des <daoloc type="vignette"> pointe effectivement vers une image

  • En cas de test sur les url des HREF inclus dans des <dao> et <daogrp>, il peut être nécessaire, afin que les requêtes en rafale de l'Abes sur le serveur de la bibliothèque numérique ne soient pas considérées comme une attaque informatique, que l'établissement prévienne le gestionnaire du serveur hébergeant la bibliothèque numérique, déclare les IP de l'Abes et s'accorde sur le calendrier et les heures de test.

Analyse des <dao>

Elément EAD examiné :

<dao>

Règle de catalogage à appliquer :

Voir manuel

Liste produite le :

16 octobre 2023

Pour :

information et traitement éventuel par les établissements

Le tableau de synthèse des erreurs constatées dans les <dao> et la liste exhaustive des composants concernés sont à télécharger ici.

Ce tableau a fait l'objet d'enrichissements complémentaires à partir des données des <daogrp><daoloc> : voir ci-dessous.

  • Premier onglet : Nombre de <dao> présentant un problème par RCR ; il permet aux établissements de savoir s'ils sont concernés

    26

    RCR concernés

    108

    fichiers EAD concernés

    1375

    composants <c> concernés

  • Deuxième onglet « Diagnostic <dao> par fichier »  : Nombre de composants <c> par fichier EAD et par type de problèmes sur les <dao> 

    Plusieurs <dao> dans un même composant <c>

    977

    composants concernés

    dans

    18

    établissements

    <dao> ailleurs qu'enfant direct de <c>

    118

    composants concernés

    dans

    14

    établissements

    <dao> sans href ou avec un HREF vide

    89

    composants concernés

    dans

    13

    établissements

  • Troisième onglet : « liste des <c> concernés » : la liste des ID classés par RCR puis clé de fichier EAD et des <dao> concernés par un de ces problèmes

ConseilUniformiser ses TITLE

En travail préparatoire à une demande de génération en masse de <dao> et ou <daogrp><daoloc>, les établissements peuvent solliciter sur le guichet AbesSTP, domaine « Modification de notices par lot » la liste des différentes formes utilisées dans l'attribut TITLE de leur <dao> et <daoloc> avec leur nombre d'occurrences (nombre de composants publiés) à l'échelle de l'ensemble des fonds et collections de l'établissement (RCR Calames), afin de corriger ou faire corriger par traitement de masse de l'Abes (selon le volume) les formes incohérentes, fautives ou obsolètes.

Analyse des <daogrp>

Elément EAD examiné :

<daogrp>

Règle de catalogage à appliquer :

Voir manuel

Liste produite le :

22 novembre 2023

Pour :

  • information

  • traitement manuel par les établissements avant le 9 février 2024

  • analyse par les établissements avant le 26 avril 2023 pour traitement par lot par l'Abes

Le tableau de synthèse des erreurs constatées dans les <daogrp> et la liste exhaustive des composants concernés sont [lien] à télécharger ici

  • Premier onglet : « synthèse par type de pb <daogrp> »

Contient un seul <daoloc> de ROLE vignette

2970

composants concernés

dans

1

établissement

A analyser pour fournir des listes de traitement de masse à l'Abes avant le 26 avril 2024

Contient un seul <daoloc> de ROLE rebond

1115

composants concernés

dans

2

établissements

Contient 2 <daoloc> dont 0 ROLE rebond et 2 ROLE vignette

1016

composants concernés

dans

1

établissement

Contient à la fois <dao> et <daogrp>

524

composants concernés

dans

7

établissements

<daogrp> mal positionné dans l'EAD

13

composants concernés

dans

3

établissements

A corriger manuellement avant le 9 février 2024

Contient 2 <daogrp> dans un même composant

11

composants concernés

dans

5

établissements

Contient à la fois <dao>, <daogrp> et <extptr>

11

composants concernés

dans

1

établissement

Contient un seul <daoloc> de ROLE vignette + autre pb

3

composants concernés

dans

2

établissements

Contient un <extptr> dans altformavail/p/extref et un <daogrp>

2

composants concernés

dans

1

établissement

Contient de multiples <daoloc>

489

composants concernés

dans

8

établissements

Pour analyse éventuelle

Contient un <daodesc> dans un <daoloc>

4

composants concernés

dans

1

établissement

  • Deuxième onglet : Synthèse pb <daogrp> par RCR : Nombre de <daogrp> présentant un problème par RCR ; il permet aux établissements de savoir s'ils sont concernés et par quels cas

16

RCR concernés

78

fichiers EAD concernés

6158

composants <c> concernés

  • Troisième onglet : « liste des <c> concernés <daogrp> » : la liste des ID classés par RCR puis clé de fichier EAD, et des <daogrp> concernés par un de ces problèmes

ConseilUniformiser ses TITLE

En travail préparatoire à une demande de génération en masse de <dao> et ou <daogrp><daoloc>, les établissements peuvent solliciter sur le guichet AbesSTP, domaine « Modification de notices par lot » la liste des différentes formes utilisées dans l'attribut TITLE de leur <dao> et <daoloc> avec leur nombre d'occurrences (nombre de composants publiés) à l'échelle de l'ensemble des fonds et collections de l'établissement (RCR Calames), afin de corriger ou faire corriger par traitement de masse de l'Abes (selon le volume) les formes incohérentes, fautives ou obsolètes.