Jó napot, Matteo! Mesélnél nekünk az impresszum projektről?
Matteo: Az Impresso (szó szerint: „mit nyomtattak”) a Svájci Nemzeti Tudományos Alapítvány által a Sinergia finanszírozási rendszer keretében finanszírozott, együttműködésen alapuló és interdiszciplináris kutatási projekt. A projekt célja egy olyan technológiai keret létrehozása, amely lehetővé teszi a nyomtatott média archívumaiból származó adatok nagymértékű kinyerését, feldolgozását, összekapcsolását és feltárását.
A projektben számítógépes nyelvészek, digitális humanisták, tervezők, történészek, könyvtárosok és levéltárosok vesznek részt, akik a történelmi digitalizált újságok nagy korpuszának kutatási célú gazdagításával, megjelenítésével, megjelenítésével és elemzésével kapcsolatos kihívással foglalkoznak. A projektben az EPFL DHLAB-ja, a Luxemburgi Kortárs és Digitális Történeti Központ (C2DH) és a Zürichi Egyetem Számítástechnikai Nyelvészeti Intézete vesz részt. Az impresso interdiszciplináris jellege tükröződik a közös tervezés elvében is, amelyet a projekt során alkalmazunk. A gyakorlatban ez azt jelenti, hogy az általunk létrehozott adatokat és a digitalizált újságokkal való munka eszközeit a történészek, a tervezők, a számítógépes nyelvészek és a digitális humanisták közötti folyamatos párbeszéd alakítja.
Ami az impresszum koncepcióját és motivációját illeti, azt megelőzően a DHLAB részt vett egy, a svájci Le Temps újság részvételével zajló kutatási projektben, amelynek célja két digitalizált újsághoz – a Journal de Geneve-hez és a Gazette de Lausanne-hoz (amely 1998-ban egyesült _és Le Temps_lett) – való hozzáférés biztosítása volt. A projekt eredményei, valamint a felmerült kihívások megalapozták az impresszumot. A digitalizált újságok archívumának létrehozására vonatkozó elképzelés lehetővé tette, hogy azt több forrásra is kiterjesszék, valamint hogy a nemzeti határokon túlra is kitekintsenek. Maud Ehrmann (DHLAB), Lars Wieneke (C2DH), Marten Düring (C2DH) és Simon Clematide (UZH) konferenciákon és műhelytalálkozókon való találkozásai segítettek megerősíteni és megfogalmazni ezt az elképzelést egy sikeres finanszírozási javaslattá.
Hogyan kerültél bele a projektbe?
Munkatársam és projektkoordinátorom, Maud Ehrmann 2017 nyarán kért fel, hogy csatlakozzak a projekthez, amikor egy váratlan változás a projektcsapatban megnyitotta annak lehetőségét, hogy egy másik posztdoktor kutató támogassa őt a DHLAB által vezetett feladatokban. Abban az időben a Linked Books-on dolgoztam, amely egy másik, az SNF által finanszírozott projekt a velencei történelemmel kapcsolatos tudományos irodalom idézetbányászatáról. A megnevezett entitások feldolgozásával és egyértelműsítésével kapcsolatos munka, amelyet impresszumban végzünk, kutatási érdeklődésem középpontjában áll. Folytonosság figyelhető meg a Linked Books-szal és korábbi kutatásaimmal is, amelyek a humán tudományok nagyszabású digitális archívumaiból származó információk kinyerésével foglalkoztak, és az idézetek (és általánosabban megnevezett entitások) az egyik fő érdeklődési területem.
Mi a jelentősége az újságok adatkészleteinek a történeti kutatásban?
A történelmi újságok felbecsülhetetlen értékű elsődleges források a humán tudósok számára, nem csak a történészek számára. Valójában tartalmazzák és megőrzik a jelenlegi és múltbeli társadalmaink egyfajta megkövesedett nyomát. Mindenféle eseményt rögzítenek, a háborús nyilatkozatoktól a szombat esti vidéki táncbálokig, és dokumentálják a mindennapi élet és a kultúra számos aspektusát. Rendkívül gazdag és sűrű információkat tartalmaznak, amelyek szintén folyamatosak, mivel sok esetben ezek az újságok már régóta futnak és nagyon rendszeresen jelennek meg.
Kulcsfontosságú kihívás, amellyel impresszumban foglalkozunk, hogy hogyan dolgozzunk ki egy olyan eszközt, amely támogatja a kutatókat a digitalizált újságok nagy archívumaival való munkában. Az eszköz természetes nyelvfeldolgozási technológiákat (pl. megnevezett entitások feldolgozása vagy témamodellezés) integrál az újságtartalmak szemantikájának rögzítése érdekében, hogy ezek a (megerősített) források felhasználhatók legyenek a kutatáshoz. Kialakítása során fontos alapelv az átláthatóság, vagyis arra törekszünk, hogy a felhasználók számára egyértelművé és láthatóvá tegyük az adatok - vagy az adatokon végzett feldolgozás - minden olyan aspektusát, amely gyakran rejtve marad a keresési felületeken. Az általunk átláthatóbbá tenni kívánt információs szempontok közé tartozik például az OCR minősége, valamint a sérült digitális archívumok miatt az adatokban lévő lyukak.
Hogyan használják az impresszionista eszközöket?
Annak ellenére, hogy az impresszó projekt még mindig folyamatban van, korpuszát és eszközeit aktívan használják mind a kutatáshoz, mind az oktatáshoz.
Ami a kutatást illeti, Dr. Estelle Bunout (C2DH) – projektünk egyik (digitális) történésze – „Az Európával szembeni ellenállás” című esettanulmányon dolgozik, amely magában foglalja a luxemburgi, svájci és azon kívüli digitalizált újságokban az európai eszméről folytatott viták elemzését azzal a céllal, hogy azonosítsa az európai eszmével kapcsolatos feszültségeket a 19. század végétől 1945-ig. Társult partnereink, az Infoclio egyesület és a Lausanne-i Egyetem Történettudományi Tanszékének kutatói pedig hozzájárulnak annak átgondolásához, hogy a konkrét felhasználási esetekkel összefüggésben hogyan lehet impresszumeszközöket alkalmazni történelmi kutatási kérdésekre.
Végül a projekt első évében felhívást tettünk közzé társult kutatók számára, hogy kiterjesszük a projekthez kapcsolódó történészek körét. Ennek eredményeként mintegy 20 történész elsősorban a Benelux államokból, Franciaországból, Németországból és Svájcból fejezte ki érdeklődését az impresso által összeállított eszközök és gyűjtemények iránt, és vett részt a projektben. Társulásuk nemcsak a projekt eredményeinek felhasználását foglalja magában, hanem rendszeres párbeszédet is az impresszumcsapattal, műhelytalálkozók és egy zárókonferencia révén, amelynek célja visszajelzések gyűjtése az impresszumeszközök általuk történő használatáról és kutatásukról, valamint a digitalizált újságok által felvetett ismeretelméleti kérdések megvitatása.
A társult kutatók témáinak és módszereinek sokfélesége a svájci és a luxemburgi (digitalizált) újságok történelmi forrásként való vonzerejét tükrözi. Ezek közé tartoznak a szakértőkkel és a női haditudósítókkal, valamint a „gondolatok történetével” – például a liberális internacionalizmus 19. század végi felemelkedésével vagy a banktörténettel – kapcsolatos proszopográfiai kutatások. Mindegyik kutatási téma megköveteli az újságok különleges használatát, egy bizonyos módot azok lekérdezésére, amely hozzájárul az impresszum gyűjteményével való kölcsönhatás koncepciójához. A különböző felhasználások azonban elérhetővé teszik az összes kutató számára ugyanazon a felületen, annak érdekében, hogy diverzifikálják ezeket az interakciókat, és gazdagítsák a kutatási gyakorlatok minden típusát, beleértve a tanítási gyakorlatokat is, a nagylelkű interfészek szellemében.
Ami a tanítási oldalt illeti, Martin Grandjean és Sandra Bott az impresszum egy részét az EPFL Társadalom- és Humán Tudományok programjának részét képező Digitális Bölcsészet/Digitális Történelem kurzus tanítására használta fel. A kurzus arra összpontosít, hogy a 20. század nagy eseményei hogyan jelentek meg a sajtóban; Az újságok digitális archívumai gazdag anyagforrást biztosítanak a hallgatók számára, amelyen számos digitális módszer és eszköz tesztelhető. Ugyanezt a kurzust jövőre tervezik, és az impresszó felületen és eszközökön alapul, így lehetővé téve számunkra, hogy teszteljük ezeknek az eszközöknek az erejét és gyengeségeit kifejezetten a tanítás (nem pedig a kutatás) kontextusában.
A C2DH-nál előkészített, a digitális forráskritika gyakorlására vonatkozó tananyagokat kínáló Ranke2 platform keretében az impresszum projekt hozzájárul a digitalizált újságok használatára vonatkozó modul elkészítéséhez. Ez a modul begyűjti a tanulságokat egy átlátható felület előkészítésével, amely az alapképzéshez és a középiskolai oktatáshoz igazodik, és a kutatási gyakorlatok legújabb trendjeit hozza az osztálytermekbe.
Hol tartasz a projektben - és mi a következő lépés?
Az impresso felület béta verziója 2019 májusában jelent meg. Egyelőre ez egy magánkiadás, amelynek fő célja, hogy visszajelzést kapjon társtörténészeinktől az interfész kialakításáról és funkcióiról. Ami az adatokat illeti, az interfész 22 svájci újsághoz biztosít hozzáférést, összesen közel 3,2 millió oldalt, 360 000 újságkiadást és több mint 26 millió tartalmi elemet (pl. cikkeket, hirdetéseket stb.), főként francia és német nyelven.
Ami az interfész funkciókat illeti, a béta kiadás tartalmazza az összes olyan alapvető funkciót, amelyet egy újságos felülettől elvár: keresés, keresési oldalak és egy néző, amely lehetővé teszi, hogy olvassa el és fedezze fel az újságcikkeket. Ezenkívül néhány fejlettebb funkciót is kínál, például a megnevezett entitások keresésének képességét, a témamodellek szűrőként való használatát a keresési eredmények szűkítésére, valamint a felhasználó számára az elemek gyűjteményeinek létrehozására és mentésére. A legújabb kiadásban hozzáadott új funkciók közé tartozik a vizuális keresés első verziója (az összes rendelkezésre álló kép szűrésének képessége dátum és újság szerint) és a metaadatok tömeges letöltése.
Mi fog történni ezután? Júliusban közzétesszük az interfész nyilvános változatát, új funkciókkal és új újságforrásokkal (különösen a Luxemburgi Nemzeti Könyvtár digitalizált anyagaival). A projekt továbbfejlesztésének legjobb módja, ha csatlakozol az impresszionista levelezőlistához – és a hozzá kapcsolódó történészcsoporthoz –, vagy követsz minket a Twitteren, mivel az elkövetkező hónapokban izgalmas új fejlemények várhatók!
