Strona internetowa Europeany zapewnia dostęp do cyfrowych reprezentacji milionów obiektów dziedzictwa kulturowego z całej Europy. Te cyfrowe reprezentacje są dostępne za pośrednictwem linków dostarczanych wraz z metadanymi, które publikujemy na stronie internetowej Europeany. Jednak linki czasami pękają, co może być frustrującym doświadczeniem dla odwiedzających witrynę i użytkowników naszego API.
Złamane linki mają różne pochodzenie: od projektów kończących się i kolekcji obrazów przeniesionych do trybu offline, po instytucje migrujące swoje kolekcje na nową platformę wewnętrznie i niewdrażające przekierowań lub używające trwałych identyfikatorów. Uszkodzone linki różnią się również charakterem: niektóre są tymczasowo zepsute, niektóre na stałe, a inne mogą po prostu wydawać się zepsute dla niektórych użytkowników w zależności od warunków dostępu określonych przez dostawcę danych. To sprawia, że rozwiązanie tego problemu jest trudnym zadaniem.
Nowy proces usuwania uszkodzonych linków
Zespoły produktowe Fundacji Europeana pracują nad sposobami skutecznego identyfikowania zerwanych linków i eliminowania ich. Wiosną 2020 r. opracowaliśmy narzędzie oparte na Metis Media Service, które raz w tygodniu sprawdza linki w niewielkiej próbie rekordów w każdym zbiorze danych publikowanym na stronie internetowej Europeany. Narzędzie tworzy raport dla każdego znalezionego linku, który ma problem, i określa problem z linkiem - na przykład, że nie jest on w ogóle dostępny (kod błędu 404), że obiekt za linkiem jest dostępny dopiero po przekierowaniu lub że link nie wygląda bezpiecznie, aby przeglądarka mogła go otworzyć. Co trzy miesiące będziemy sporządzać skonsolidowany raport, aby uzyskać pełny przegląd zbiorów danych, w których problemy z linkami są konsekwentnie zgłaszane w tym trzymiesięcznym okresie.
Raport ten będzie podstawą do ręcznej kontroli w celu potwierdzenia, że linki są naprawdę zepsute, a błędy zgłaszane przez narzędzie są poprawne. W tym kroku wykluczymy zbiory danych, w których łącza mają inne problemy, ale nie są zepsute. Czas, problemy z SSL i tymczasowe problemy techniczne nie będą liczyły się jako uszkodzone linki i zostaną usunięte z raportu i rozwiązane oddzielnie. Po tym etapie czyszczenia raport powinien zawierać tylko zbiory danych, w których linki są naprawdę zepsute, a dostęp do obiektów nie jest możliwy dla osób lub maszyn.
Pierwsze tego rodzaju sprawozdanie zostało już udostępnione naszym agregatorom, a drugie zostanie wygenerowane pod koniec marca 2021 r. Wszystkie zepsute zbiory danych o linkach zawarte zarówno w pierwszym, jak i drugim sprawozdaniu zostaną usunięte ze strony internetowej Europeany na początku kwietnia. Oznacza to, że zbiory danych nie będą dostępne za pośrednictwem strony internetowej Europeany, ale nadal będą dostępne za pośrednictwem środowiska podglądu. Jeśli więc uszkodzone linki zostaną później naprawione, możliwe będzie przywrócenie zbiorów danych na stronę internetową. Cykl ten będzie kontynuowany przez cały 2021 r., aby zapewnić aktualność naszych linków.
Współpraca z naszymi partnerami w zakresie danych
Poprosiliśmy wszystkich naszych agregatorów o zarezerwowanie czasu na sprawdzenie tych raportów i naprawienie wszelkich problemów do końca marca. Planujemy również dotrzeć do partnerów danych, którzy są nieaktywni lub z którymi nie mamy już kontaktu, aby zaangażować ich w tę pracę i zapewnić najlepsze wrażenia z obiektów dziedzictwa kulturowego, które możemy zapewnić.
Jeśli jesteś instytucją dziedzictwa kulturowego, która przekazuje dane Europeanie i obawiasz się niedziałających linków w swoich danych, skontaktuj się ze swoim agregatorem lub ze mną ([email protected]), aby omówić więcej!
