U bent hier

Over documenten en bestandsformaten

Inleiding

Het beheren van digitale informatie en informatieobjecten zoals documenten en het verzekeren van het voortbestaan daarvan lijkt op het eerste gezicht eenvoudig maar schijn bedriegt. Het is eigenlijk een complexe uitdaging, waarvoor kennis op conceptueel en technisch niveau nodig is en die verder gaat dan de kennis die nodig is om deze informatie op een gegevensdrager vast te leggen.

De belangrijkste oorzaak voor de complexiteit van het beheer van digitale informatie is dat zij zich aan de buitenkant anders voordoet dan dat ze in de technische werkelijkheid is. Dat zou niet zo erg zijn ware het niet dat in de meeste gevallen de bewaartermijnen van informatie de levensduur van de technische systemen en bestandsformaten waarin de informatie is ontstaan en vastgelegd overstijgt.

Voor overheden bestaan er echter wettelijke verplichtingen om de integriteit en het voortbestaan van informatie en dus ook documenten te verzekeren. Bij (her)gebruik, verantwoording en bewijs mag er geen twijfel zijn aan de kwaliteit van een document.

Daarom zijn er maatregelen nodig om het ongestoorde voortbestaan van de documenten (ook e–mails) op toetsbare manier in goede banen te leiden. Met dit onderdeel van deze site wordt een achtergrond geboden een beeld te vomen voor de problematiek rond het in standhouden van de integriteit van digitale documenten.

Complexiteit

Volledig digitaal werken stelt hoge eisen aan de kwaliteit van de digitale documenten, bestandsformaten, de functionaliteiten van de systemen waarbinnen de digitale documenten worden verwerkt en de manier waarop het voortbestaan daarvan op aantoonbare wijze wordt verzekerd. Verwerkingen als creëren, wijzigen, registreren, opslaan, converteren, migreren en beheren zullen op zorgvuldige manier moeten gebeuren om elke mogelijke twijfel over de betrouwbaarheid en bruikbaarheid van de documenten weg te kunnen nemen.

Een probleem is dat digitale documenten zich aan de buitenkant anders voordoen dan dat ze in de technische werkelijkheid zijn. Ook overstijgt de bewaartermijn van de informatie en documenten in de meeste gevallen de levensduur van de technische systemen en de gebruikte bestandsformaten.

Integriteit

Bij het beheer van digitale documenten moet de integriteit van het oorspronkelijke document gerespecteerd en in stand gehouden worden1. Het oorspronkelijke document bevat een intentie en boodschap van de opsteller die op verschillend technische manieren tot uiting komen. Wanneer er veranderingen plaatsvinden aan een document op wat voor manier dan ook kan dat leiden tot verminking van de boodschap en het teniet doen van de oorspronkelijke intentie van de opsteller.

Standaarden

Het moet voorop staan dat een digitaal document gedurende zijn bestaan, van ontstaan tot vernietiging, integraal en zonder verstoring door de daartoe geautoriseerde gebruiker kan worden gevonden, gebruikt en bewaard2. Wanneer dit technisch niet meer mogelijk is zullen conversies of migraties moeten plaatsvinden. Die moeten op een dusdanige manier uitgevoerd worden dat aangetoond kan worden dat het resultaat van de conversie of de migratie van dezelfde kwaliteit is als het oorspronkelijke origineel en dus beschouwd mag worden als een nieuw origineel3In eerste instantie zijn voor de digitale documenten open bestandsformaten4te gebruiken die worden gepropageerd door het Forum Standaardisatie.5 en Digitaal Erfgoed Nederland (DEN) in de BASIS6.

Ten aanzien van veel soorten documenten is het toepassen van de open formaten geen groot probleem. Het is echter van belang om uit te zoeken op welke manier en wanneer grootschalige conversies van bijvoorbeeld office documenten uit gevoerd moeten worden. Het toepassen van open formaten is wel een probleem in het geval van MS-Access en vooral Outlook (Exchange).

Zoals bekend wordt vooral het bestandsformaat PDF/A beschouwd als de gedroomde oplossing voor het langdurig kunnen bewaren van digitale documenten. Dat is een niet terechte aanname omdat ook hier de nodige adders onder het gras liggen.

 

  • 1. De op een bepaald moment gegenereerde representatie (verschijningsvorm) van een informatieobject moet gedurende de voor dat informatieobject geldende bewaartermijn kunnen worden gereproduceerd. Zie uitgangspunt nr. 101
  • 2. Voor overheden zijn de Archiefwet 1995, het Archiefbesluit 1995 en de Archiefregeling de formele basis.
  • 3. Hiervoor bieden de Archiefwet 1995 (art. 2a, 7), het Archiefbesluit 1995 (art. 6 en 8) en de Archiefregeling (art. 25) ook de formele basis.
  • 4. Archiefregeling artikel 26 lid 1:
    Digitale archiefbescheiden worden, uiterlijk op het tijdstip van overbrenging, opgeslagen in een valideerbaar en volledig gedocumenteerd bestandsformaat dat voldoet aan een open standaard, tenzij dit redelijkerwijs niet van de zorgdrager kan worden verlangd. Alsdan vindt met de beheerder van de voor overbrenging aangewezen archiefbewaarplaats overleg plaats over een alternatief bestandsformaat.
  • 5. Het Forum Standaardisatie beheert een lijst met open standaarden voor 'pas toe of leg uit', zie: https://www.forumstandaardisatie.nl/open-standaarden/lijst/verplicht
    De Tweede Kamer heeft op 11 oktober 2016 een motie aangenomen om het gebruik van open standaarden bij wet te verplichten. (Gewijzigde motie van het lid Oosenbrug over het bij wet verplichten van het gebruik van opensourcesoftware (t.v.v. 32802, nr. 31) https://www.tweedekamer.nl/kamerstukken/moties/detail?id=2016Z18418&did=2016D37878 (Geraadpleegd 14 juli 2018)
  • 6. Het acroniem DE BASIS staat voor Digitaal Erfgoed: Bouwen Aan Succesvolle ICT-Strategie. DE BASIS is een set van minimale eisen voor de digitalisering van erfgoed en maakt onderdeel uit van de kennisbank van DEN. Zie:  http://www.den.nl/standaarden?sl=all&q=&std-status[]=DE+BASIS&std-status[]=NEN%2FISO+Norm&std-status[]=Europeana&formfill=&formaction=posted (Geraadpleegd 14 juli 2018)
Datum eerste publicatie: 
zaterdag, 14 juli 2018 - 11:56pm
Share/Deel