Tere Matteo! Kas sa räägiksid meile impresso projektist?
Matteo: Impresso (sõna-sõnalt „trükitud“) on koostööl põhinev ja interdistsiplinaarne uurimisprojekt, mida rahastab Šveitsi riiklik teadusfond Sinergia rahastamiskava raames. Projekti eesmärk on luua tehnoloogiline raamistik trükimeedia arhiividest suuremahuliste andmete kogumiseks, töötlemiseks, linkimiseks ja uurimiseks.
Projektis osalevad arvutilingvistid, digitaalhumanistid, disainerid, ajaloolased, raamatukoguhoidjad ja arhivaarid, kes tegelevad probleemiga, kuidas rikastada, esindada, visualiseerida ja analüüsida suurt kogumit ajaloolisi digiteeritud ajalehti teadusuuringute eesmärgil. Selle projekti partnerid on EPFLi DHLAB, Luxembourgi kaasaegse ja digitaalse ajaloo keskus (C2DH) ning Zürichi Ülikooli arvutilingvistika instituut. Impresso interdistsiplinaarne olemus kajastub ka ühise kavandamise põhimõttes, mida rakendame kogu projekti vältel. Praktikas tähendab see seda, et meie loodud andmeid ja meie arendatavaid vahendeid digiteeritud ajalehtedega töötamiseks kujundab pidev dialoog ajaloolaste, disainerite, arvutuslingvistide ja digitaalsete humanistide vahel.
Mis puudutab impresso kontseptsiooni ja motivatsiooni, siis oli DHLAB enne seda osalenud uurimisprojektis, milles osales Šveitsi ajaleht Le Temps, mille eesmärk oli anda juurdepääs kahele digiteeritud ajalehele – Journal de Geneve ja Gazette de Lausanne (mis ühinesid 1998. aastal, et saada Le Temps). Selle projekti tulemused ja esile kerkinud väljakutsed panid aluse mulje avaldamisele. Idee luua digiteeritud ajalehtede arhiiv laskis end hästi laiendada, et kaasata rohkem allikaid ja vaadata riigipiiridest kaugemale. Mitmed kohtumised Maud Ehrmanni (DHLAB), Lars Wieneke’i (C2DH), Marten Düringi (C2DH) ja Simon Clematide’i (UZH) konverentsidel ja seminaridel aitasid seda ideed tugevdada ja sõnastada nii, et sellest sai edukas rahastamisettepanek.
Kuidas te projektiga seotud olete?
Minu kolleeg ja projekti koordinaator Maud Ehrmann palus mul projektiga liituda 2017. aasta suvel, kui ootamatu muutus projektimeeskonnas avas võimaluse saada veel üks doktorikraadiga teadlane, kes toetaks teda ülesannetes, mida DHLAB juhtis. Sel ajal töötasin veel ühe SNFi rahastatud projekti „Linked Books“ kallal, mis käsitles Veneetsia ajalugu käsitleva teaduskirjanduse tsiteerimist. Töö nimega üksuse töötlemise ja täpsustamise kohta, mida me impressos teeme, on minu teadusuuringute huvide keskmes. Samuti on järjepidevus Linked Booksi ja minu varasema uurimistööga humanitaarteaduste suuremahulistest digitaalarhiividest teabe ekstraheerimise kohta, kusjuures tsitaadid (ja üldisemalt nimetatud üksused) on üks minu peamisi huvivaldkondi.
Milline on ajalehtede andmestike tähtsus ajaloouuringutes?
Ajaloolised ajalehed on humanitaarteadlaste, mitte ainult ajaloolaste jaoks hindamatud esmased allikad. Tegelikult sisaldavad ja säilitavad need teatavat fossiilset jälge meie praegustest ja varasematest ühiskondadest. Nad salvestavad igasuguseid sündmusi alates sõjakuulutustest kuni laupäevaõhtuste tantsupallideni maal ning dokumenteerivad paljusid igapäevaelu ja kultuuri aspekte. Need sisaldavad äärmiselt rikkalikku ja tihedat teavet, mis on samuti pidev, kuna paljudel juhtudel on need ajalehed töötanud pikka aega ja avaldatud väga regulaarselt.
Oluline väljakutse, millega me impressos tegeleme, on see, kuidas töötada välja vahend, mis toetab teadlasi töös suurte digiteeritud ajalehtede arhiividega. Vahend ühendab loomuliku keele töötlemise tehnoloogiad (nt nimeline üksuse töötlemine või teema modelleerimine), et jäädvustada ajalehe sisu semantika, et muuta need (täiustatud) allikad teadusuuringutes kasutatavaks. Oluline põhimõte, mida me selle kujundamisel järgime, on läbipaistvus, mis tähendab, et püüame teha kasutajatele selgeks ja nähtavaks kõik andmete või andmete töötlemise aspektid, mis sageli võivad jääda otsinguliidestesse peitu. Teabeaspektid, mida tahame läbipaistvamaks muuta, hõlmavad näiteks OCR-i kvaliteeti, samuti kahjustatud digitaalarhiividest tingitud andmete auke.
Kuidas kasutatakse impresso tööriistu?
Hoolimata asjaolust, et impresso projekt on veel tegemisel, kasutatakse selle korpust ja vahendeid aktiivselt nii teadustööks kui ka õpetamiseks.
Uurimistöö poolel töötab meie projekti üks (digitaalseid) ajaloolasi dr Estelle Bunout (C2DH) juhtumiuuringuga „Resistance to Europe“, mis hõlmab Luksemburgi, Šveitsi ja muude riikide digiteeritud ajalehtedes Euroopa idee üle peetud arutelude analüüsi, et teha kindlaks Euroopa ideega seotud pinged 19. sajandi lõpust kuni 1945. aastani. Meie assotsieerunud partnerite, Infoclio ühenduse ja Lausanne’i ülikooli ajalooosakonna teadlased aitavad kaasa arutelule selle üle, kuidas rakendada impressovahendeid ajaloolistes uurimisküsimustes konkreetsete kasutusjuhtumite kontekstis.
Lõpuks avaldasime projekti esimesel aastal projektikonkursi assotsieerunud teadlastele, et laiendada projektiga seotud ajaloolaste ringi. Selle tulemusena väljendas umbes 20 peamiselt Beneluxi, Prantsusmaa, Saksamaa ja Šveitsi ajaloolast huvi nii impresso kogutud vahendite kui ka kollektsioonide vastu ning on projektis osalenud. Nende kaasamine ei hõlma mitte ainult projekti väljundi kasutamist, vaid ka korrapärast dialoogi impresso meeskonnaga seminaride ja lõppkonverentsi kaudu, mille eesmärk on koguda tagasisidet impressovahendite kasutamise ja teadusuuringute kohta ning arutada digiteeritud ajalehtede tõstatatud epistemoloogiaküsimusi.
Seotud teadlaste teemade ja meetodite mitmekesisus peegeldab Šveitsi ja Luksemburgi (digitaalsete) ajalehtede kui ajalooliste allikate võlu. Need hõlmavad prosopograafilisi uuringuid ekspertide ja naissoost sõjakorrespondentide kohta, samuti nn mõtete ajaloo kohta, nagu liberaalse internatsionalismi tõus 19. sajandi lõpus või pangandusajalugu. Kõik need uurimisteemad nõuavad ajalehtede erilist kasutamist, konkreetset viisi nende päringute tegemiseks, mis aitab kaasa impresso kollektsiooniga suhtlemise kontseptsioonile. Erinevad kasutusalad on siiski kättesaadavad kõigile teadlastele samas liideses, püüdes pakkuda nende koostoimete mitmekesistamist ja rikastada igat tüüpi uurimistavasid, sealhulgas ka õpetamistavasid, heldete liideste vaimus.
Õpetamise poolel on Martin Grandjean ja Sandra Bott kasutanud osa impresso korpusest EPFLi sotsiaal- ja humanitaarteaduste programmi kuuluva digihumanitaaria/digiajaloo kursuse õpetamiseks. Kursus keskendub sellele, kuidas ajakirjanduses kajastati 20. sajandi suuri sündmusi; ajalehtede digitaalsed arhiivid pakuvad õpilastele rikkalikku materjaliallikat, mille abil saab katsetada erinevaid digitaalseid meetodeid ja tööriistu. Sama kursus on kavandatud järgmiseks aastaks ja see põhineb impresso liidesel ja tööriistadel, võimaldades meil seega testida nende tööriistade tugevusi ja nõrkusi konkreetselt õpetamise (mitte teadustöö) kontekstis.
Projekti Ranke2 raames, mis on C2DHs ette valmistatud platvorm, mis pakub õppematerjale selle kohta, kuidas harjutada digitaalsete allikate kriitikat, aitab impressoprojekt kaasa digiteeritud ajalehtede kasutamisele pühendatud mooduli ettevalmistamisele. See moodul kogub õppetunde, valmistades ette läbipaistva liidese, mis on kohandatud bakalaureuse- ja keskkooliõppele, tuues klassiruumidesse uusimad uurimistavade suundumused.
Kuhu olete projektis jõudnud - ja mis on järgmine samm?
Impresso liidese beetaversioon avaldati 2019. aasta mais. Praegu on see eraväljaanne, mille peamine eesmärk on saada tagasisidet liidese kujunduse ja funktsioonide kohta meie seotud ajaloolastelt. Andmete osas annab liides juurdepääsu 22 Šveitsi ajalehele kokku peaaegu 3,2 miljoni lehekülje, 360 000 ajaleheväljaande ja üle 26 miljoni sisuartikli (nt artiklid, reklaamid jne), peamiselt prantsuse ja saksa keeles.
Liidese funktsioonide osas sisaldab beetaversioon kõiki põhifunktsioone, mida ajaleheliideselt ootate: otsige, otsige tahke ja vaatajat, mis võimaldab teil lugeda ja uurida ajaleheartikleid. Lisaks pakub see mõningaid täpsemaid funktsioone, näiteks võimalust otsida nimelisi üksusi, kasutada teemamudeleid filtritena otsingutulemuste kitsendamiseks ning kasutaja võimalust luua ja salvestada üksuste kogusid. Uued funktsioonid, mis lisati viimasesse versiooni, hõlmavad visuaalse otsingu esimest versiooni (võimalus filtreerida kõiki saadaolevaid pilte kuupäeva ja ajalehe järgi) ning metaandmete suuremahulist allalaadimist.
Mis saab edasi? Juulis avaldame liidese avaliku versiooni, millel on uued funktsioonid ja uued ajaleheallikad (eelkõige Luksemburgi Rahvusraamatukogu digiteeritud materjalid). Parim viis projekti edasiseks jälgimiseks on liituda impresso meililistiga – ja sellega seotud ajaloolaste rühmaga – või jälgida meid Twitteris, sest lähikuudel toimuvad mõned põnevad uued arengud!
