Europeanas websted giver adgang til digitale repræsentationer af millioner af kulturarvsgenstande fra hele Europa. Disse digitale repræsentationer er tilgængelige via links med de metadata, som vi offentliggør på Europeanas websted. Men nogle gange går links i stykker, hvilket kan være en frustrerende oplevelse for besøgende på webstedet og brugere af vores API.
Broken links har en række forskellige oprindelser: fra projekter, der afsluttes, og billedsamlinger, der tages offline, til institutioner, der overfører deres samlinger til en ny platform internt og ikke gennemfører omdirigeringer eller anvender vedvarende identifikatorer. Broken links varierer også i naturen: Nogle er midlertidigt brudt, nogle permanent, og andre kan bare synes at være brudt for nogle brugere afhængigt af adgangsbetingelser fastsat af dataudbyderen. Det gør det til en udfordrende opgave at løse dette problem.
En ny proces til håndtering af brudte links
Europeana Foundations produktteams arbejder på metoder til effektivt at identificere brudte links og adressere dem. I foråret 2020 udviklede vi et værktøj baseret på Metis Media Service, der kontrollerer links i et lille udsnit af registre i hvert datasæt, der offentliggøres på Europeanas websted en gang om ugen. Værktøjet udarbejder en rapport for hvert link, det finder, der har et problem, og angiver problemet med linket - for eksempel at det slet ikke er tilgængeligt (fejlkode 404), at et objekt bag et link kun er tilgængeligt efter omdirigering, eller at et link ikke ser sikkert ud for en browser at åbne. Hver tredje måned udarbejder vi en konsolideret rapport for at få et fuldt overblik over de datasæt, hvor der konsekvent rapporteres om problemer med links i denne tremåneders periode.
Denne rapport vil danne grundlag for en manuel kontrol for at bekræfte, at links virkelig er brudt, og at de fejl, der rapporteres af værktøjet, er korrekte. I dette trin vil vi udelukke datasæt, hvor links har andre problemer, men ikke er brudt. Time out, SSL-problemer og midlertidige tekniske problemer tæller ikke som brudte links og vil blive fjernet fra rapporten og behandlet separat. Efter dette oprydningstrin bør rapporten kun indeholde datasæt, hvor links virkelig er brudt, og adgang til objekter ikke er mulig for personer eller maskiner.
Den første rapport af denne art er allerede blevet delt med vores aggregatorer, og en anden vil blive udarbejdet i slutningen af marts 2021. Alle brudte linkdatasæt i både denne første og anden rapport vil blive offentliggjort fra Europeanas websted i begyndelsen af april. Det betyder, at datasættene ikke vil være tilgængelige via Europeanas websted, men stadig vil være tilgængelige via forhåndsvisningsmiljøet. Så hvis de brudte links senere fastsættes, ville det være muligt at bringe datasættene tilbage til hjemmesiden. Denne cyklus vil blive fortsat i hele 2021 for at sikre, at vores links holdes ajour.
Samarbejde med vores datapartnere
Vi har bedt alle vores aggregatorer om at afsætte tid til at kontrollere disse rapporter og løse eventuelle problemer inden udgangen af marts. Vi planlægger også at nå ud til datapartnere, der er inaktive, eller som vi ikke længere har kontakt med, for at engagere dem i dette arbejde og sikre den bedste oplevelse af kulturarvsgenstande, som vi kan levere.
Hvis du er en kulturarvsinstitution, der leverer data til Europeana og er bekymret over brudte links i dine data, bedes du kontakte din aggregator eller mig ([email protected])for at drøfte yderligere!
