Le site web Europeana donne accès à des représentations numériques de millions d’objets du patrimoine culturel provenant de toute l’Europe. Ces représentations numériques sont accessibles via des liens fournis avec les métadonnées que nous publions sur le site web Europeana. Cependant, les liens se brisent parfois, ce qui peut être une expérience frustrante pour les visiteurs du site Web et les utilisateurs de notre API.
Les liens brisés ont une variété d'origines: des projets qui se terminent et des collections d’images qui sont mises hors ligne, aux institutions qui migrent leurs collections vers une nouvelle plateforme en interne et qui ne mettent pas en œuvre de redirections ou n’utilisent pas d’identifiants persistants. Les liens brisés varient également en nature: certains sont temporairement cassés, d'autres de manière permanente, et d'autres peuvent sembler cassés pour certains utilisateurs en fonction des conditions d'accès définies par le fournisseur de données. Cela rend la résolution de ce problème une tâche difficile.
Un nouveau processus pour traiter les liens brisés
Les équipes produits de la Fondation Europeana travaillent sur des moyens d'identifier efficacement les liens brisés et d'y remédier. Au printemps 2020, nous avons développé un outil basé sur le Metis Media Service qui vérifie les liens d'un petit échantillon d'enregistrements dans chaque ensemble de données publié sur le site Web d'Europeana une fois par semaine. L'outil produit un rapport pour chaque lien qu'il trouve qui a un problème, et spécifie le problème avec le lien - par exemple, qu'il n'est pas accessible du tout (code d'erreur 404), qu'un objet derrière un lien n'est accessible qu'après la redirection ou qu'un lien ne semble pas sûr pour un navigateur à ouvrir. Tous les trois mois, nous produirons un rapport consolidé, afin d'obtenir un aperçu complet des ensembles de données où les problèmes liés aux liens sont systématiquement signalés au cours de cette période de trois mois.
Ce rapport servira de base à une vérification manuelle pour confirmer que les liens sont vraiment rompus et que les erreurs signalées par l'outil sont correctes. Dans cette étape, nous allons exclure les ensembles de données où les liens ont d'autres problèmes mais ne sont pas cassés. Le délai d'attente, les problèmes SSL et les problèmes techniques temporaires ne compteront pas comme des liens brisés et seront supprimés du rapport et traités séparément. Après cette étape de nettoyage, le rapport ne devrait inclure que des ensembles de données où les liens sont vraiment brisés et où l'accès aux objets n'est pas possible pour les personnes ou les machines.
Le premier rapport de ce type a déjà été communiqué à nos agrégateurs, et un second sera produit à la fin du mois de mars 2021. Tous les ensembles de données de liens brisés présents dans ce premier et deuxième rapport seront retirés du site Web d'Europeana au début du mois d'avril. Cela signifie que les ensembles de données ne seront pas accessibles via le site web Europeana, mais seront toujours accessibles via l’environnement de prévisualisation. Donc, si les liens brisés sont réparés plus tard, il serait possible de ramener les ensembles de données sur le site Web. Ce cycle se poursuivra tout au long de 2021 pour s'assurer que nos liens restent à jour.
Travailler avec nos partenaires de données
Nous avons demandé à tous nos agrégateurs de réserver du temps pour vérifier ces rapports et résoudre tous les problèmes qu'ils peuvent d'ici la fin du mois de mars. Nous prévoyons également d'entrer en contact avec des partenaires de données qui sont inactifs, ou avec lesquels nous n'avons plus de contact, pour les engager dans cet ensemble de travaux et assurer la meilleure expérience possible des objets du patrimoine culturel que nous pouvons fournir.
Si vous êtes une institution du patrimoine culturel qui fournit des données à Europeana et que vous êtes préoccupé par des liens rompus dans vos données, veuillez contacter votre agrégateur ou moi-même ([email protected])pour en discuter davantage!
