Web-mjesto Europeane omogućuje pristup digitalnim prikazima milijuna predmeta kulturne baštine iz cijele Europe. Ti digitalni prikazi dostupni su putem poveznica s metapodacima koje objavljujemo na internetskim stranicama Europeane. Međutim, linkovi se ponekad razbijaju, što može biti frustrirajuće iskustvo za posjetitelje web stranice i korisnike našeg API-ja.
Razbijene poveznice imaju različita podrijetla: od završetka projekata i uklanjanja zbirki slika izvan interneta do institucija koje interno migriraju svoje zbirke na novu platformu i ne provode preusmjeravanja ili ne upotrebljavaju trajne identifikatore. Razbijene poveznice također se razlikuju po prirodi: neki su privremeno slomljeni, neki trajno, a drugi se mogu samo činiti slomljenima za neke korisnike ovisno o uvjetima pristupa koje je postavio pružatelj podataka. To čini rješavanje ovog pitanja izazovnim zadatkom.
Novi postupak za rješavanje problema neispravnih poveznica
Timovi za proizvode zaklade Europeana Foundation rade na tome kako učinkovito identificirati neispravne veze i riješiti ih. U proljeće 2020. razvili smo alat koji se temelji na medijskoj usluzi Metis i kojim se jednom tjedno provjeravaju poveznice u malom uzorku zapisa u svakom skupu podataka objavljenom na internetskim stranicama Europeane. Alat izrađuje izvješće za svaku vezu koju pronađe koja ima problem i određuje problem s vezom - na primjer, da uopće nije dostupna (pogrešni kod 404), da je objekt iza veze dostupan tek nakon preusmjeravanja ili da poveznica ne izgleda sigurno za otvaranje preglednika. Svaka tri mjeseca izradit ćemo konsolidirano izvješće kako bismo dobili potpuni pregled skupova podataka u kojima se problemi s poveznicama dosljedno prijavljuju u tom tromjesečnom razdoblju.
Ovo će izvješće biti osnova za ručnu provjeru kako bi se potvrdilo da su poveznice stvarno prekinute i da su pogreške koje je alat prijavio točne. U ovom koraku isključit ćemo skupove podataka u kojima poveznice imaju druge probleme, ali nisu prekinute. Vremenski razmak, problemi povezani sa SSL-om i privremena tehnička pitanja neće se računati kao prekinute veze i bit će uklonjeni iz izvješća i zasebno obrađeni. Nakon ovog koraka čišćenja, izvješće bi trebalo uključivati samo skupove podataka u kojima su veze stvarno prekinute i pristup objektima nije moguć za ljude ili strojeve.
Prvo izvješće te vrste već je podijeljeno s našim agregatorima, a drugo će se izraditi krajem ožujka 2021. Svi pokvareni skupovi podataka o poveznicama prisutni u ovom prvom i drugom izvješću bit će objavljeni na internetskim stranicama Europeane početkom travnja. To znači da skupovi podataka neće biti dostupni na internetskim stranicama Europeane, ali će i dalje biti dostupni putem okruženja za pregled. Dakle, ako su prekinute veze kasnije fiksne, bilo bi moguće vratiti skupove podataka na web stranicu. Taj će se ciklus nastaviti tijekom 2021. kako bi naše poveznice ostale ažurne.
Suradnja s našim partnerima za podatke
Zamolili smo sve naše agregatore da odvoje vrijeme kako bi provjerili ta izvješća i riješili sve probleme koje mogu do kraja ožujka. Također se planiramo obratiti podatkovnim partnerima koji su neaktivni, ili s kojima više nemamo kontakt, kako bismo ih uključili u ovaj rad i osigurali najbolje iskustvo predmeta kulturne baštine koje možemo pružiti.
Ako ste institucija kulturne baštine koja pruža podatke Europeani i zabrinuti ste zbog neispravnih poveznica u svojim podacima, obratite se svojem agregatoru ili meni ([email protected])kako biste dodatno raspravili!
