De Europeana-website biedt toegang tot digitale afbeeldingen van miljoenen cultureel erfgoedobjecten uit heel Europa. Deze digitale weergaven zijn toegankelijk via links die zijn voorzien van de metadata die we publiceren op de Europeana-website. Links breken echter soms, wat een frustrerende ervaring kan zijn voor websitebezoekers en gebruikers van onze API.
Gebroken links hebben verschillende oorsprongen: van projecten die eindigen en beeldverzamelingen die offline worden genomen, tot instellingen die hun collecties intern naar een nieuw platform migreren en geen omleidingen uitvoeren of permanente identificatoren gebruiken. Gebroken links variëren ook in aard: sommige zijn tijdelijk kapot, sommige permanent en andere lijken voor sommige gebruikers gewoon kapot te zijn, afhankelijk van de toegangsvoorwaarden die door de gegevensprovider zijn ingesteld. Dit maakt het oplossen van dit probleem een uitdagende taak.
Een nieuw proces om gebroken links aan te pakken
De productteams van de Europeana Foundation werken aan manieren om verbroken links effectief te identificeren en aan te pakken. In het voorjaar van 2020 hebben we een tool ontwikkeld op basis van de Metis Media Service die links controleert in een kleine steekproef van records in elke dataset die eenmaal per week op de Europeana-website wordt gepubliceerd. De tool produceert een rapport voor elke link die een probleem heeft en specificeert het probleem met de link - bijvoorbeeld dat deze helemaal niet toegankelijk is (foutcode 404), dat een object achter een link alleen toegankelijk is na omleiding of dat een link er niet veilig uitziet voor een browser om te openen. Om de drie maanden zullen we een geconsolideerd rapport opstellen, om een volledig overzicht te krijgen van de datasets waar problemen met links consequent worden gemeld in deze periode van drie maanden.
Dit rapport zal de basis vormen voor een handmatige controle om te bevestigen dat links echt zijn verbroken en dat de door de tool gerapporteerde fouten correct zijn. In deze stap sluiten we datasets uit waar koppelingen andere problemen hebben, maar niet zijn verbroken. Time-out, SSL-problemen en tijdelijke technische problemen tellen niet mee als verbroken links en worden uit het rapport verwijderd en afzonderlijk aangepakt. Na deze opruimstap mag het rapport alleen gegevenssets bevatten waar koppelingen echt zijn verbroken en toegang tot objecten niet mogelijk is voor mensen of machines.
Het eerste rapport van dit type is al gedeeld met onze aggregators, en een tweede zal eind maart 2021 worden gegenereerd. Alle datasets met gebroken links in zowel dit eerste als tweede rapport zullen begin april worden gepubliceerd op de Europeana-website. Dit betekent dat de datasets niet toegankelijk zullen zijn via de Europeana-website, maar nog steeds toegankelijk zullen zijn via de preview-omgeving. Dus als de gebroken links later worden opgelost, zou het mogelijk zijn om de datasets terug naar de website te brengen. Deze cyclus zal in 2021 worden voortgezet om ervoor te zorgen dat onze links up-to-date blijven.
Samenwerken met onze datapartners
We hebben al onze aggregators gevraagd om tijd vrij te maken om deze rapporten te controleren en eventuele problemen op te lossen die ze tegen eind maart kunnen oplossen. We zijn ook van plan om contact op te nemen met gegevenspartners die inactief zijn of waarmee we geen contact meer hebben, om hen te betrekken bij dit oeuvre en te zorgen voor de beste ervaring van cultureel erfgoedobjecten die we kunnen bieden.
Als u een instelling voor cultureel erfgoed bent die gegevens aan Europeana verstrekt en zich zorgen maakt over verbroken links in uw gegevens, neem dan contact op met uw aggregator of met mij ([email protected]) om verder te bespreken!
