Il sito web Europeana fornisce l'accesso alle rappresentazioni digitali di milioni di beni del patrimonio culturale provenienti da tutta Europa. Queste rappresentazioni digitali sono accessibili tramite link forniti con i metadati che pubblichiamo sul sito web di Europeana. Tuttavia, i collegamenti a volte si interrompono, il che può essere un'esperienza frustrante per i visitatori del sito Web e gli utenti della nostra API.
I collegamenti interrotti hanno una varietà di origini: dalla fine dei progetti e dalla messa offline delle raccolte di immagini, alle istituzioni che migrano le loro raccolte su una nuova piattaforma internamente e non implementano reindirizzamenti o utilizzano identificatori persistenti. Anche i link interrotti variano in natura: alcuni sono temporaneamente interrotti, alcuni in modo permanente e altri potrebbero sembrare interrotti per alcuni utenti a seconda delle condizioni di accesso stabilite dal fornitore di dati. Questo rende la risoluzione di questo problema un compito impegnativo.
Un nuovo processo per risolvere i collegamenti interrotti
I team di prodotto della Fondazione Europeana stanno lavorando a modi per identificare efficacemente i collegamenti interrotti e affrontarli. Nella primavera del 2020 abbiamo sviluppato uno strumento basato sul servizio Metis Media che controlla i link in un piccolo campione di record in ogni set di dati pubblicato sul sito web Europeana una volta alla settimana. Lo strumento produce un rapporto per ogni collegamento che trova che ha un problema e specifica il problema con il collegamento - ad esempio, che non è accessibile affatto (codice errore 404), che un oggetto dietro un collegamento è accessibile solo dopo il reindirizzamento o che un collegamento non sembra sicuro per un browser da aprire. Ogni tre mesi produrremo un rapporto consolidato, per ottenere una panoramica completa dei set di dati in cui i problemi con i collegamenti sono costantemente segnalati in questo periodo di tre mesi.
Questo rapporto sarà la base per un controllo manuale per confermare che i collegamenti sono davvero rotti e gli errori segnalati dallo strumento sono corretti. In questo passaggio escludiamo i set di dati in cui i collegamenti hanno altri problemi ma non sono rotti. Time out, problemi SSL e problemi tecnici temporanei non conteranno come collegamenti interrotti e saranno rimossi dal rapporto e affrontati separatamente. Dopo questa fase di pulizia, il report dovrebbe includere solo set di dati in cui i collegamenti sono davvero interrotti e l'accesso agli oggetti non è possibile per persone o macchine.
La prima relazione di questo tipo è già stata condivisa con i nostri aggregatori e una seconda sarà generata alla fine di marzo 2021. Tutte le serie di dati sui collegamenti interrotti presenti nella prima e nella seconda relazione saranno depubblicate dal sito web di Europeana all'inizio di aprile. Ciò significa che i set di dati non saranno accessibili tramite il sito web Europeana, ma saranno comunque accessibili tramite l'ambiente di anteprima. Quindi, se i collegamenti interrotti vengono successivamente corretti, sarebbe possibile riportare i set di dati al sito Web. Questo ciclo proseguirà per tutto il 2021 per garantire che i nostri collegamenti rimangano aggiornati.
Lavorare con i nostri data partner
Abbiamo chiesto a tutti i nostri aggregatori di dedicare del tempo per controllare questi rapporti e risolvere eventuali problemi entro la fine di marzo. Stiamo anche pianificando di raggiungere i partner di dati che sono inattivi, o con cui non abbiamo più contatti, per coinvolgerli in questo corpus di lavoro e garantire la migliore esperienza di beni del patrimonio culturale che possiamo fornire.
Se sei un'istituzione del patrimonio culturale che fornisce dati a Europeana e sei preoccupato per i link interrotti nei tuoi dati, contatta il tuo aggregatore o me ([email protected])per discutere ulteriormente!
