Искаме хората да могат да търсят, намират и използват материали от културното наследство онлайн. Това е по-лесно — и много по-гладко за всички — когато файловете със съдържание (изображенията, текстовите документи или аудио/видеоклиповете) и придружаващите ги метаданни (информацията за това какво представлява елементът и откъде идва) са с добро качество.
Чрез стратегията Europeana за периода 2020—2025 г. ще продължим да работим с агрегатори и доставчици на данни, за да инвестираме в ресурси, дейности и технологии — като машинно самообучение и други услуги за обогатяване — за да подобрим нашите метаданни и съдържание.
Акцент върху качеството
Работейки чрез съществуващите мрежи на агрегаторите и с подкрепата на държавите — членки на ЕС, ще работим, за да помогнем на институциите да разберат защо добрите данни са важни, и ще им помогнем да изготвят по-качествено съдържание и метаданни. Ще разработим и използваме рамката за публикации на Europeana, за да подкрепим начина, по който институциите работят с нас, изготвят и подобряват материалите, които споделят с нас.
Ще представяме висококачествено съдържание чрез редакционните материали и кампаниите на Europeana и ще разработим самата платформа, за да поставим по-голям акцент върху нашите партньорски институции и да гарантираме, че добрите резултати са видими за всички.
Cosmina Berta от германската цифрова библиотека и член на Комитета за качество на данните на Europeana казва: „Най-големите предизвикателства за практикуващите специалисти в областта на метаданните са определянето на качеството на данните и прилагането на показатели за качество на данните, особено поради факта, че сценариите за използване на данните се променят с течение на времето. Надявам се чрез тази стратегия да постигнем по-голям консенсус по отношение на определянето и измерването на качеството на данните и да определим по-ясна концепция за нейното прилагане. Аз съм голям фен на стандартизацията и в моя идеален свят стандартизацията ще играе по-голяма роля при определянето и постигането на качество на данните.
„Ако определим целите, които искаме да постигнем — „какво“ и „до каква цел“ — тогава „как“ да постигнем това може да бъде по-лесно очертано, приложено и стандартизирано. Агрегаторите са важни тук. След това институциите могат по-добре да достигнат до своята аудитория и да постигнат напредък по отношение на общите си научноизследователски и образователни цели.“
По-добра свързаност
Когато културното съдържание и метаданните се изготвят по стандартизиран начин, без значение коя институция ги създава, те могат да се използват във и в широк спектър от системи, а не само в платформата Europeana. Институциите за културно наследство могат да се възползват например от оперативната съвместимост със сбирки от други институции или от връзки с международни инициативи като Уикиданни.
В този случай използването на стандартни свързани формати на данни, съчетано с подобрения в многоезичието, ще доведе до по-добра връзка на колекциите на Europeana с други платформи и услуги.
Хенинг Шолц, партньор и оперативен мениджър на фондация Europeana, казва: „С пускането на компонента за метаданни на Europeana Publishing Framework през лятото на 2019 г. направихме многоезичието неразделна част от нашата концепция за качество на данните. Ясното посочване на езика, на който се предоставят метаданните, ще улесни машинния превод на метаданните, като направи нашето наследство достъпно на всички езици на ЕС. Предстои ни още дълъг път, но ако можем да се съсредоточим върху маркирането на полетата с ключови метаданни с правилния език, можем да постигнем добър напредък през следващите две години.“
Използване на технологиите - и силата на хората - за обогатяване на данните
Ръчното подобряване на качеството на метаданните на милиони записи от различни източници изисква огромно количество време и ресурси. Прилагането на инструменти за изкуствен интелект и машинно самообучение, съчетано с човешки знания, предоставени както от експерти в областта, така и от кампании за краудсорсинг (помислете за EnrichEuropeana и CrowdHeritage),предлага забележителна възможност за подобряване на качеството на метаданните.
Ще работим върху начини за обогатяване на метаданните и за автоматично, полуавтоматично или чрез използване на силата на тълпата изпълнение на задачи, свързани с данните.
