Nieuwe pre-ingestmogelijkheden door de RMTool
De RecordsManagementTool (RMTool), een softwareapplicatie voor het beheer van digitale informatie in organisaties, werd in de eerste jaren vooral gepromoot als een hulpmiddel bij het organiseren en in bulk bewerken van netwerkschijven in organisaties. Inmiddels is de RMTool bij meer dan vijftig organisaties in Nederland en België in gebruik. In de laatste jaren heeft de ontwikkeling van de tool niet stilgestaan. Met trots is de RMTool achter de schermen doorontwikkeld en is het een verzameling van hulpmiddelen geworden waarmee enerzijds digitale bestanden kunnen worden beheerd, maar waarmee tevens bestanden dusdanig kunnen worden voorbereid dat ze volledig geautomatiseerd in een bepaalde structuur in het e-depot kunnen worden opgenomen. De tool kan op deze manier gebruikt worden als een volwaardige pre-ingesttool voor het e-depot
Deze automatische opname wordt de ingestprocedure genoemd. Informatieobjecten (submission information packages) worden in deze procedure tot archiefobjecten (archival information packages) gemaakt: metadata en informatieobject(en) vormen dan één pakket en zijn, onafhankelijk van de software, in elk e-depot te plaatsen, mits dit is gebaseerd op het Open Archival Information System. Dit laatste is vastgelegd in een officiële ISO-norm 14721:2012. Met andere woorden: ben je niet meer tevreden over je e-depotleverancier maar het systeem voldoet aan ISO 15471, dan zou de informatie zonder gegevensverlies naar een pakket van een andere leverancier moeten kunnen worden overgezet dat ook aan deze norm voldoet.
Een e-depot, de digitale archiefbewaarplaats van een organisatie, wordt wel beschreven als ‘het geheel van organisatie, beleid, processen en procedures, financieel beheer, personeel, databeheer, databeveiliging en aanwezige hard- en software, dat duurzaam beheren en raadplegen van te bewaren digitale archiefbescheiden mogelijk maakt’ (bron: Eisen Duurzaam Digitaal depot, ED3). Hieronder vallen dus alle databasesystemen die een organisatie gebruikt, en alle overige gegevensverzamelingen, hoe dan ook georganiseerd.
Om digitale archiefbescheiden bruikbaar en controleerbaar te maken, worden metadata gebruikt. Om de metadata beheersbaar te houden en te zorgen dat de juiste metagegevens op de juiste plaats vallen, is een metadatamodel nodig, een formulier waarin de metadata automatisch kunnen worden opgeslagen, zodat wanneer je via het metadataveld “auteur” naar auteursgegevens zoekt, je niet de plaatsnaam gegevens aantreft.
De basis voor het metadatamodel van het e-depot wordt gelegd door het Toepassingsprofiel Metagegevens Rijksoverheid en het Toepassingsprofiel Metadatering Lokale Overheden. Het e-depot gebruikt een van deze toepassingsprofielen, omdat de voorziening gebruikt kan worden door alle overheden (het zou aan te bevelen zijn dat er één uniform model zou ontstaan, zie de ontwikkelingen rondom DUTO, Duurzame Toegankelijkheid van Overheidsinformatie). De modellen zijn nog steeds in ontwikkeling en zullen dat vermoedelijk de komende jaren ook nog wel blijven. Toch zijn er al wel onderdelen die nu al zonder bezwaar kunnen worden gebruikt. Het metadatamodel TMLO/TMR is vertaald naar een machine leesbare vorm voor het e-Depot: het XML-formaat ToPX. In deze vorm kan het e-depot metadata automatisch verwerken. De software van het e-depot controleert daarbij de structuur en de aanwezigheid van verplichte elementen.
De RMTool is bedacht vanuit het idee dat het handig zou zijn om alle gereedschap (in de vorm van software) die nodig is voor het duurzaam beheer van digitale informatie, samen te brengen in één pakket, één gereedschapskist. Deze gereedschapskist wordt uitgebreid naarmate daaraan behoefte is en raakt inmiddels, door vragen van cliënten, steeds meer gevuld. Met de tool is er al veel mogelijk.
- Mappenstructuren opzetten en beheren.
- Documentenverzamelingen ontdubbelen.
- Informatie uit legacysystemen ingestklaar maken voor een e-depotomgeving.
- Archieven controleren op corrupte data en/of op documenten die beveiligd zijn met een password.
- Op documenten zoeken met een digitale handtekening.
En er is nog veel mogelijk, te veel om in dit artikel op te noemen. Natuurlijk hebben we uitgebreide documentatie beschikbaar.
Sidecarstructuren
Samen met een aantal gebruikersorganisaties heeft VHIC de RMTool inmiddels zo ingericht dat organisaties hiermee de tool als een volwaardige pre-ingesttool kunnen gebruiken voor het e-depot. Met behulp van de RMTool kan een organisatie ervoor zorgen dat de digitale informatie die in het e-depot moet worden opgenomen, aan de zogenaamde ToPX sidecarstructuur kan voldoen. Technisch gesproken gaat dat als volgt. In een sidecarstructuur heeft het digitale archief een mappenstructuur, zoals bijvoorbeeld een bestand bouwvergunningen, raadsnotulen of gemeenterekeningen en -begrotingen. Elke rubriek, serie, dossier en elk document is een map; elke versie van een document is een bestand. Elke map (rubriek, serie, dossier, document) en elk bestand (versie van een document) heeft zijn eigen metadatabestand. Dit noemen we het sidecarbestand. De naam van een sidecarbestand is identiek aan die van de map of het bestand waar het bij hoort, aangevuld met de extensie ‘.metadata’ en gevuld met de metadata, die bij de levensgeschiedenis van die map hoort. De plaats van een sidecarbestand dat bij een map hoort, is in deze map. De plaats van een sidecarbestand dat bij een bestand hoort, is naast dit bestand. Met de nieuwe functionaliteit in de RMTool kunnen sidecarbestanden op alle aggregatieniveaus (archief, serie, dossier en document) en aan elk object (map of bestand) in een mappenstructuur worden toegevoegd.
De ToPX-sidecarstructuur is inmiddels ingebouwd in de RMTool. Een andere, veel gebruikte structuur is de zogenaamde ToPX-RIP-structuur, vergelijkbaar met de ToPX-sidecarstructuur maar, omdat gebouwd door een andere leverancier, met een andere vorm. We onderzoeken momenteel of we deze ook samen met gebruikers kunnen ontwikkelen, want wat nieuwe ontwikkelingen betreft staat VHIC overal voor open. De ToPX RIP-structuur is evenals de ToPX sidecarstructuur voor een e-depotvoorziening een metadatamodel.
ToPX functionaliteit in de praktijk
Eén van de organisaties waarvoor we met ToPX aan de slag gingen was het BHIC. Het BHIC wilde van de voormalige gemeente Veghel de bouwvergunningen 1902 – 2010 digitaal overdragen aan het BHIC en in het e-depot opnemen. Samen met betrokken partijen zijn we toen met de ToPX-sidecarstructuur en de RMTool aan de slag gegaan.
Voor het overbrengen naar het BHIC gelden dezelfde exportvoorwaarden als voor het Nationaal Archief. Deze voorwaarden beschrijven hoe een export uit een DMS eruit moet zien:
- Er is een mappenstructuur met minimaal vijf niveaus (1) archief, (2) serie, (3) dossier, (4) record en (5) bestand.
- En elk object (map of bestand) heeft een eigen metadatabestand, een zogenaamde sidecar.
De gemeente Meijerijstad diende de bouwvergunningen in deze sidecarstructuur aan te leveren, maar dat bleek niet zo eenvoudig.
Het BHIC gebruikt al enige tijd de RMTool voor controles van aangeleverde datasets uit Corsa en Key2Documenten. Zo voeren ze bijvoorbeeld een controle uit op de mapgrootte, waarbij gekeken wordt of er bestanden of sidecars (de bij de bestanden behorende metadatabestanden) aanwezig zijn. Voor de bouwvergunningen van Veghel zocht het BHIC naar uitbreiding van functionaliteit van de RMTool waarbij de metadata kon worden aangeleverd voor automatische verwerking. Na een tweetal testrondes waaruit nog een paar aanpassingen volgden, bleek dat het gewenste resultaat was gerealiseerd. De door de RMTool gegenereerde ToPX-sidecarstructuur kan succesvol automatisch in het e-depot worden opgenomen. Resultaat: generieke ToPX functionaliteit in de RMTool.
Generieke ToPX functionaliteit in de RMTool
De RMTool is in staat om de juiste mappenstructuur te creëren én elk object te voorzien van een sidecar. De RMTool stelt organisaties hiermee in staat om een mapping op basis van ToPX uit te voeren. Metadata kunnen zowel uit een excelblad gehaald worden, als door de RMTool zelf worden toegevoegd. In het laatste geval gaat het om (op bestandsniveau) technische metadata zoals het bestandsformaat, checksums en de creatie-applicatie. Er hoeft eenmalig een excelblad aangemaakt te worden, met per aggregatieniveau in ieder geval het relatieve pad waar de mapping betrekking op heeft. Vervolgens kan er naar eigen inzicht metadata worden toegevoegd. In het geval van de bouwvergunningen van Veghel was de metadata goed gestructureerd en gekoppeld aan de bestandsnaam. Zo kon de naam van de dossiers en het adres eenvoudig gekopieerd worden. De datum van het besluit en het resultaat zijn gemapt onder het ToPX element ‘generieke metadata’. De juiste mappenstructuur kon gegenereerd worden door in een excelblad een kolom met de bronlocatie en een kolom met de doellocatie voor de bestanden aan te maken en vervolgens alle documenten op basis hiervan door de RMTool te laten verplaatsen. De doellocaties zijn verkregen uit het excelblad van Veghel door kolommen te combineren. Een voorbeeld van een bron- en doellocatie:
Gemeente_Meierijstad\VE-000000000225-DOC_1-AANVRAAG.pdf
Gemeente_Meierijstad\serie_bouwvergunningen\225\DOC_1-AANVRAAG\VE-000000000225-DOC_1-AANVRAAG.pdf
Jean-Luc Rouvroye van het BHIC: ‘Op dit moment staan nog niet alle bouwvergunningen in het e-depot van het BHIC, omdat de bewerking de nodige tijd kost. In totaal gaat het om een kleine 200.000 bestanden (op papier 400 strekkende meter). Het e-depot dat wij hebben kan echter maximaal 15.000 bestanden per ingest aan, dus we moeten het opknippen. Het voordeel van de generieke ToPX-functionaliteit in de RMTool is dat we bij andere projecten op een vergelijkbare manier te werk kunnen gaan. Bijna alle bij het BHIC aangesloten gemeenten hebben op eenzelfde wijze hun bouwvergunningen laten scannen, dus we zijn de komende tijd nog wel even bezig.’