O sítio Web da Europeana dá acesso a representações digitais de milhões de bens do património cultural de toda a Europa. Estas representações digitais são acessíveis através de ligações fornecidas com os metadados que publicamos no sítio Web da Europeana. No entanto, os links às vezes quebram, o que pode ser uma experiência frustrante para os visitantes do site e utilizadores da nossa API.
Os links quebrados têm uma variedade de origens: desde os projetos que terminam e as coleções de imagens que são retiradas fora de linha até às instituições que migram as suas coleções para uma nova plataforma internamente e que não executam redirecionamentos ou utilizam identificadores persistentes. As ligações quebradas também variam na natureza: alguns estão temporariamente quebrados, outros permanentemente, e outros podem apenas parecer quebrados para alguns utilizadores, dependendo das condições de acesso estabelecidas pelo fornecedor de dados. Isto faz com que a resolução desta questão seja uma tarefa desafiadora.
Um novo processo para resolver ligações quebradas
As equipas de produtos da Fundação Europeana estão a trabalhar em formas de identificar eficazmente as ligações quebradas e de as resolver. Na primavera de 2020, o Tribunal desenvolveu uma ferramenta baseada no serviço de comunicação social Metis que verifica ligações numa pequena amostra de registos em cada conjunto de dados publicado no sítio Web da Europeana uma vez por semana. A ferramenta produz um relatório para cada link que encontra que tem um problema, e especifica o problema com o link - por exemplo, que não é acessível (código de erro 404), que um objeto por trás de um link só é acessível após o redirecionamento ou que um link não parece seguro para um navegador abrir. A cada três meses, produziremos um relatório consolidado, para obter uma visão completa dos conjuntos de dados em que os problemas com links são consistentemente relatados neste período de três meses.
Este relatório será a base para uma verificação manual para confirmar que os links estão realmente quebrados e que os erros relatados pela ferramenta estão corretos. Nesta etapa, excluiremos conjuntos de dados em que os links têm outros problemas, mas não estão quebrados. O tempo limite, os problemas SSL e os problemas técnicos temporários não contarão como ligações quebradas e serão removidos do relatório e tratados separadamente. Após esta etapa de limpeza, o relatório deve incluir apenas conjuntos de dados onde as ligações estão realmente quebradas e o acesso a objetos não é possível para pessoas ou máquinas.
O primeiro relatório deste tipo já foi partilhado com os nossos agregadores e será gerado um segundo no final de março de 2021. Todos os conjuntos de dados de ligações quebradas presentes tanto neste primeiro como no segundo relatório serão publicados no sítio Web da Europeana no início de abril. Isto significa que os conjuntos de dados não serão acessíveis através do sítio Web da Europeana, mas continuarão a sê-lo através do ambiente de pré-visualização. Portanto, se os links quebrados forem corrigidos posteriormente, será possível trazer os conjuntos de dados de volta para o site. Este ciclo será continuado ao longo de 2021, a fim de assegurar que as nossas ligações se mantêm atualizadas.
Trabalhar com os nossos parceiros de dados
Pedimos a todos os nossos agregadores que reservassem tempo para verificar esses relatórios e corrigir quaisquer problemas que pudessem até o final de março. Estamos também a planear chegar a parceiros de dados que estão inativos, ou com os quais já não temos contacto, para os envolver neste trabalho e garantir a melhor experiência de bens do património cultural que podemos proporcionar.
Se é uma instituição responsável pelo património cultural que fornece dados à Europeana e está preocupada com ligações quebradas nos seus dados, contacte o seu agregador ou a mim ([email protected]) para mais informações!
