Aggregazione dei dati collegati
I dati collegati sono un modo di pubblicare dati strutturati sul web che consente di collegare e arricchire i metadati. Ciò garantisce che sia possibile trovare rappresentazioni diverse dello stesso contenuto e collegamenti tra risorse correlate. L'aggregazione dei dati collegati ha il potenziale per apportare benefici in termini di costi e migliorare l'interoperabilità dei dati su scala globale, e il progetto Cultura comune di Europeana ha esaminato la fattibilità dell'utilizzo di tali dati collegati per l'aggregazione.
Europeana gestisce già un modello di aggregazione dei metadati scalabile e sostenibile per il settore del patrimonio culturale. L'aggregazione dei dati collegati significherebbe che i fornitori di dati sarebbero più facilmente in grado di condividere i loro metadati con gli aggregatori di beni culturali che utilizzano i dati collegati. Per i fornitori che non pubblicano ancora dati collegati, la loro attuazione per la partecipazione a Europeana offrirebbe loro anche il vantaggio di poter utilizzare i loro dati collegati per altre applicazioni e con altri domini oltre al patrimonio culturale, come i motori di ricerca su Internet.
Lavorare con i fornitori di dati
Il progetto pilota si è svolto da maggio 2019 a giugno 2020. È stato coordinato dal Netherlands Institute for Sound and Vision (NISV) e realizzato in stretta collaborazione con il Dutch Digital Heritage Network (NDE) che ha sostenuto il progetto fornendo conoscenze, software e infrastrutture per eseguire i test. Il progetto pilota ha coinvolto tre tipi di partecipanti all'ecosistema Europeana: fornitori di dati, aggregatori e Fondazione Europeana. Dodici fornitori di dati hanno aderito al progetto pilota, ma non tutti erano pienamente consapevoli delle sfide tecniche che questo nuovo approccio avrebbe comportato. Quattro dei fornitori non sono stati in grado di fornire una serie di dati come dati collegati e altri due fornitori hanno fornito serie di dati con dati insufficienti per l'aggregazione in Europeana.
Nei sei casi di successo, cinque fornitori avevano già conoscenze interne o un'implementazione esistente di dati collegati e, per uno, è stato il suo primo sforzo nella pubblicazione di dati collegati. La nostra conclusione è che c'è molto interesse nell'implementazione di dati collegati tra i fornitori di dati. Tuttavia, richiede un livello significativo di risorse quando un'organizzazione non ha alcuna esperienza precedente.
Risultati dei progetti pilota
Il progetto pilota ha applicato un approccio per l'aggregazione dei dati collegati basato su due specifiche per la fornitura di una serie di dati collegati per Europeana. che in precedenza avevano avuto successo per un progetto pilota su piccola scala nell'ambito del progetto Rise of Literacy (Ascesa dell'alfabetizzazione).
La prima specifica è che i metadati a livello di set di dati dovrebbero essere forniti utilizzando vocabolari ben noti. Include i tipi di distribuzioni di set di dati che i fornitori di dati possono utilizzare e i metadati richiesti per ciascuno.
Una seconda specifica riguarda l'uso dei dati collegati a Schema.org per descrivere i beni del patrimonio culturale secondo i requisiti di Europeana e del modello di dati Europeana (EDM). Attualmente, Europeana supporta solo l'ingestione di metadati nell'EDM. Tuttavia, gli esperimenti sull'applicazione di Schema.org alle descrizioni dei metadati dei beni del patrimonio culturale hanno dimostrato che può fornire dati di buona qualità, in grado di soddisfare i requisiti di Europeana. Questa specifica fornisce un livello generale di guida per l'uso dei metadati di Schema.org che, dopo la conversione in EDM, si tradurrà in metadati adatti all'aggregazione da parte di Europeana.
Questo progetto pilota ha inoltre portato alla creazione di un set di strumenti per l'aggregazione dei dati collegati, concepito per essere utilizzato dagli aggregatori di Europeana e dagli aggregatori di altre reti simili. Sebbene la funzionalità del set di strumenti sia personalizzata per l'EDM, gli aggregatori che utilizzano altri modelli di dati possono aggiungere le proprie conversioni e convalide utilizzando gli standard implementati dal set di strumenti. Il set di strumenti si basa su contenitori Docker che preservano l'indipendenza tecnica dei suoi strumenti, rendendo la soluzione portabile in ambienti diversi e scalabile, dando la possibilità di applicare il set di strumenti a collezioni piccole o grandi. Il set di strumenti e il relativo codice sorgente sono disponibili in Github.
Lavori futuri
Sono stati individuati diversi settori per i lavori futuri. I fornitori di dati trarrebbero vantaggio dagli strumenti per preparare i loro dati collegati. Gli strumenti di convalida implementati nel set di strumenti possono essere utilizzati anche nella creazione di servizi per i fornitori di dati, consentendo loro di verificare la validità dei loro dati nelle fasi precedenti della pubblicazione dei dati collegati. Un primo passo in questa direzione è stato compiuto testando i dati aggregati collegati utilizzando Europeana Metis Sandbox. Una seconda linea di lavoro a partire dal 2021 si concentrerà sulle componenti per l'interoperabilità e l'integrazione del set di strumenti nei sistemi degli aggregatori. Questo lavoro sarà coordinato dall'Istituto olandese per il suono e la visione nel progetto nazionale olandese Digitale Collectie.
Per saperne di più sui dati collegati, guarda il nostro webinar di ottobre 2020 su LODA - Linked Open Data Aggregator, e se sei interessato all'argomento e desideri maggiori possibilità di discuterne, unisciti alla comunità EuropeanaTech.
Questo post è stato modificato il 21 gennaio 2021 per aggiornare i dettagli dei futuri lavori previsti in questo settore.
