Site-ul Europeana oferă acces la reprezentări digitale a milioane de obiecte de patrimoniu cultural din întreaga Europă. Aceste reprezentări digitale sunt accesibile prin intermediul linkurilor furnizate împreună cu metadatele pe care le publicăm pe site-ul web Europeana. Cu toate acestea, link-urile se rup uneori, ceea ce poate fi o experiență frustrantă pentru vizitatorii site-ului web și utilizatorii API-ului nostru.
Legăturile rupte au o varietate de origini: de la finalizarea proiectelor și preluarea colecțiilor de imagini offline, la instituțiile care își migrează colecțiile către o nouă platformă pe plan intern și care nu implementează redirecționări sau utilizează identificatori persistenți. Legăturile rupte variază, de asemenea, în natură: unele sunt întrerupte temporar, altele permanent, iar altele pot părea doar a fi întrerupte pentru unii utilizatori, în funcție de condițiile de acces stabilite de furnizorul de date. Acest lucru face ca rezolvarea acestei probleme să fie o sarcină dificilă.
Un nou proces pentru a aborda legăturile rupte
Echipele de produse ale Fundației Europeana lucrează la modalități de a identifica în mod eficient legăturile rupte și de a le aborda. În primăvara anului 2020, am dezvoltat un instrument bazat pe serviciul mass-media Metis, care verifică linkurile dintr-un mic eșantion de înregistrări din fiecare set de date publicat pe site-ul web Europeana o dată pe săptămână. Instrumentul produce un raport pentru fiecare link pe care îl constată că are o problemă și specifică problema cu linkul - de exemplu, că nu este accesibil deloc (cod de eroare 404), că un obiect din spatele unui link este accesibil numai după redirecționare sau că un link nu pare sigur pentru ca un browser să se deschidă. La fiecare trei luni, vom elabora un raport consolidat, pentru a obține o imagine de ansamblu completă a seturilor de date în care problemele legate de linkuri sunt raportate în mod constant în această perioadă de trei luni.
Acest raport va sta la baza unei verificări manuale pentru a confirma că linkurile sunt într-adevăr rupte și că erorile raportate de instrument sunt corecte. În această etapă, vom exclude seturile de date în cazul cărora legăturile au alte probleme, dar nu sunt întrerupte. Time out, problemele SSL și problemele tehnice temporare nu vor fi considerate link-uri întrerupte și vor fi eliminate din raport și abordate separat. După această etapă de curățare, raportul ar trebui să includă numai seturi de date în care legăturile sunt cu adevărat rupte și accesul la obiecte nu este posibil pentru oameni sau mașini.
Primul raport de acest tip a fost deja comunicat agregatorilor noștri, iar un al doilea va fi generat la sfârșitul lunii martie 2021. Toate seturile de date privind legăturile întrerupte prezente atât în primul, cât și în al doilea raport vor fi publicate de pe site-ul web Europeana la începutul lunii aprilie. Aceasta înseamnă că seturile de date nu vor fi accesibile prin intermediul site-ului web Europeana, dar vor fi în continuare accesibile prin intermediul mediului de previzualizare. Deci, dacă link-urile rupte sunt reparate mai târziu, ar fi posibil să aduceți seturile de date înapoi pe site. Acest ciclu va continua pe tot parcursul anului 2021, pentru a ne asigura că legăturile noastre rămân actualizate.
Colaborarea cu partenerii noștri de date
Am solicitat tuturor agregatorilor noștri să rezerve timp pentru a verifica aceste rapoarte și pentru a remedia orice probleme pe care le pot rezolva până la sfârșitul lunii martie. De asemenea, intenționăm să contactăm parteneri de date care sunt inactivi sau cu care nu mai avem contact, pentru a-i implica în această activitate și pentru a asigura cea mai bună experiență a obiectelor de patrimoniu cultural pe care le putem oferi.
Dacă sunteți o instituție de patrimoniu cultural care furnizează date către Europeana și sunteți preocupat de legăturile întrerupte din datele dumneavoastră, vă rugăm să contactați agregatorul dumneavoastră sau pe mine ([email protected])pentru a discuta în continuare!
