300.000 pagina's Nieuws van de Groote Oorlog
03/02/2014
03/02/2014
Aan de vooravond van de herdenking van de ‘Groote Oorlog’ is er een hernieuwde belangstelling voor frontbladen, kranten, week- en maandbladen, pamfletten en vlugschriften uit deze periode. Het is een tijd waarin 'het nieuws' vooral nog op papier wordt verspreid, en deze publicaties vormen dus een zeer belangrijke bron voor de geschiedenis van het leven in België tijdens WO I. Jammer genoeg zijn ze amper gekend bij het ruimere publiek en meestal alleen op papier of microfilm toegankelijk voor onderzoekers.
Door de gebrekkige kwaliteit van het papier waarop veel van deze publicaties gedrukt zijn, wordt deze archiefbron bovendien sterk bedreigd. Zelfs wanneer de bewaaromstandigheden optimaal zijn, is het natuurlijk verval van het papier hoog. Het papier wordt broos en bij manipulatie is de kans op beschadiging zeer groot. Digitalisering is dus absoluut noodzakelijk om de inhoud van deze documenten voor de toekomst te bewaren én toegankelijk te houden.
Dankzij een project van het Vlaams Instituut voor Archivering (VIAA) i.s.m. de Vlaamse Erfgoedbibliotheek, FARO, PACKED en diverse cultureel-erfgoedinstellingen wordt een grootschalige digitalisering van periodieke publicaties (met name kranten) uit de periode 1914-1918 gerealiseerd. Onderzoekers, erfgoedwerkers en specifieke doelgroepen krijgen een nieuwe toegang tot kwetsbare bronnen die een unieke kijk geven op de beeldvorming, nieuwsverstrekking en propaganda rond de oorlog, evenals het leven tijdens de bezetting.
Met dit project zet het VIAA een eerste stap om naast het audiovisueel erfgoed ook het papieren erfgoed duurzaam te bewaren en digitaal toegankelijk te maken.
In een eerste projectfase inventariseerde projectmedewerker Tuur Van Hove van de Vlaamse Erfgoedbibliotheek de periodieke publicaties uit WO I bij 13 bewaarinstellingen. Daarbij werd vertrokken van de gegevens in Abraham - Catalogus van Belgische kranten, een databank van de Vlaamse Erfgoedbibliotheek waarin het krantenbezit van bijna honderd bewaarinstellingen in Vlaanderen en Brussel is opgenomen.
Wat de WO I publicaties betreft, werden per reeks enkele fysieke parameters bepaald, zoals de volledigheid van de reeks, het aantal beschikbare edities, de omvang in pagina's, de paginagrootte, etc. Ook de staat van het materiaal en de verpakking werd in kaart gebracht. Om dubbel werk te vermijden werd de overlap tussen de collecties en met andere digitaliseringsiniatieven bepaald.
Titels publicaties
Het totaal aantal titels dat ik in kaart bracht bij de diverse bewaarinstellingen, bedroeg 1867. Dit is inclusief dubbele titels. Wanneer de dubbele titels er worden uitgefilterd, bedraagt het aantal unieke titels 536 en het aantal titels dat in meerdere instellingen voorkomt 427.
Wanneer we kijken naar de manier waarop de titel bewaard worden, dan zien we de volgende situatie:

Figuur 1. Verpakking van de titels
Sommige titels bevinden zich zowel in fardes als dozen. Dit verklaart het grotere aantal dan het totaal aantal titels.
Pagina’s + selectie periodieken
Qua aantal pagina’s kom ik na de inventarisatie op een totaal van 447.841 voor alle titels. Wat de unieke titels betreft, zijn er 38.583 pagina’s. De selectie van dubbele titels maakt nog 279.654 pagina’s uit. Dus het totaal aantal te digitaliseren pagina’s (unieke titels + selectie dubbele titels) bedraagt 318.237 pagina’s.
Voor de selectie van de dubbele titels hield ik rekening met de volgende criteria: periode (1914 – 1918), uniciteit, volledigheid (lacunes, versnipperd), fysieke staat / conservering.
Fysieke staat periodieke publicaties
De staat van de band bij ingebonden exemplaren is:

Figuur 2: Staat van de band
De staat van het papier op vlak van verzuring en beschadigingen is:

Figuur 3. Staat van het papier
Tekstconditie publicaties
De tekstconditie in functie van OCR is:

Figuur 4. Tekstconditie in functie van OCR
Vooral de handgeschreven frontblaadjes zijn uiteraard slecht te OCR’en en zullen manueel moeten worden getranscribeerd.
Aangezien uit de inventarisatie en de materiaalanalyse bleek dat het oorspronkelijke aantal pagina's van 90.000 ruimschoots werd overtroffen, vroeg het VIAA aan haar Raad van Bestuur extra middelen om het project toch volledig te kunnen uitvoeren en de selectie te digitaliseren pagina's ook allemaal te kunnen laten digitaliseren. De verhoging van het budget werd op 27 januari goedgekeurd.
Momenteel wordt een lastenboek opgesteld voor digitalisering.