Уебсайтът Europeana предоставя достъп до цифрови представяния на милиони обекти на културното наследство от цяла Европа. Тези цифрови представяния са достъпни чрез връзки, предоставени с метаданните, които публикуваме на уебсайта Europeana. Въпреки това, връзките понякога се прекъсват, което може да бъде разочароващо преживяване за посетителите на уебсайта и потребителите на нашия API.
Счупените връзки имат различен произход: от проекти, които приключват, и колекции от изображения, които се изтеглят офлайн, до институции, които мигрират своите колекции към нова платформа вътрешно и не прилагат пренасочване или използват постоянни идентификатори. Счупените връзки също се различават по характер: някои са временно счупени, други — за постоянно, а трети може просто да изглеждат счупени за някои потребители в зависимост от условията за достъп, определени от доставчика на данни. Това прави решаването на този проблем трудна задача.
Нов процес за справяне с прекъснатите връзки
Продуктовите екипи на фондация Europeana работят по начини за ефективно идентифициране на прекъснатите връзки и справяне с тях. През пролетта на 2020 г. разработихме инструмент, базиран на Metis Media Service, който проверява връзките в малка извадка от записи във всеки набор от данни, публикуван на уебсайта на Europeana веднъж седмично. Инструментът изготвя отчет за всяка връзка, която открие, че има проблем, и посочва проблема с връзката - например, че изобщо не е достъпна (код за грешка 404), че обектът зад връзката е достъпен само след пренасочване или че връзката не изглежда безопасна за отваряне от браузър. На всеки три месеца ще изготвяме консолидиран доклад, за да получим пълен преглед на наборите от данни, в които проблемите с връзките се докладват последователно през този тримесечен период.
Този доклад ще бъде основата за ръчна проверка, за да се потвърди, че връзките са наистина счупени и грешките, докладвани от инструмента, са правилни. В тази стъпка ще изключим наборите от данни, при които връзките имат други проблеми, но не са прекъснати. Времевото прекъсване, проблемите със SSL и временните технически проблеми няма да се считат за прекъснати връзки и ще бъдат премахнати от доклада и разгледани отделно. След тази стъпка на почистване докладът трябва да включва само набори от данни, където връзките са наистина прекъснати и достъпът до обекти не е възможен за хора или машини.
Първият доклад от този вид вече беше споделен с нашите агрегатори, а вторият ще бъде изготвен в края на март 2021 г. Всички разбити набори от данни за връзки, налични както в този първи, така и във втория доклад, ще бъдат публикувани от уебсайта Europeana в началото на април. Това означава, че наборите от данни няма да бъдат достъпни чрез уебсайта Europeana, но ще продължат да бъдат достъпни чрез средата за предварителен преглед. Така че, ако прекъснатите връзки по-късно бъдат фиксирани, би било възможно наборите от данни да бъдат върнати на уебсайта. Този цикъл ще продължи през цялата 2021 г., за да се гарантира, че връзките ни са актуални.
Работа с нашите партньори за данни
Помолихме всички наши агрегатори да отделят време, за да проверят тези доклади и да решат всички проблеми, които могат, до края на март. Планираме също така да се свържем с партньори за данни, които са неактивни или с които вече нямаме контакт, за да ги ангажираме в тази работа и да осигурим най-добрия опит с обектите на културното наследство, който можем да предоставим.
Ако сте институция в областта на културното наследство, която предоставя данни на Europeana, и сте загрижени за прекъснати връзки във вашите данни, моля, свържете се с вашия агрегатор или с мен ([email protected]), за да обсъдите допълнително!
