Een nieuwe oplossing voor dataopslag: DNA- gecodeerde documenten

Het Nationaal Archief van Frankrijk[1] heeft als eerste instituut ter wereld digitale documenten opgenomen die zijn opgeslagen in DNA-formaat. Deze nieuwe technologie kan een revolutie betekenen op het gebied van dataopslag. Onderzoekers van de Sorbonne slaagden erin om twee teksten om te zetten in DNA-code: de Verklaring van de rechten van de mens uit 1789 en de Verklaring van de rechten van de vrouw uit 1791. De onderzoekers hebben op 23 november 2021 het DNA officieel overhandigd aan het Nationaal Archief. Het artificiële DNA van de beide Verklaringen worden in een archiefkluis van het Nationaal Archief bewaard.

De DNA van beide documenten, niet groter dan een zandkorrel, bevindt zich in een kleine metalen capsule. Stéphane Lemaire, onderzoeker bij de Sorbonne, is erin geslaagd de computercode om te zetten in een genetische code. “Om de digitale informatie in DNA onder te brengen wordt het binaire systeem met nullen en enen omgezet in een quartair systeem, omdat DNA is samengesteld uit nucleotiden die worden gesymboliseerd met de letters A,T, C en G. We deden dit met een algoritme dat we ontwikkelden in het laboratorium, zo verklaart hij.

Om de documenten te lezen open je de capsule en worden de DNA-moleculen in een sequencer geplaatst die biologen doorgaans gebruiken. “We gebruiken sequencers om bijvoorbeeld varianten van het coronavirus te identificeren. Dezelfde technologie gebruiken we om de digitale informatie te lezen die in DNA-formaat is opgeslagen.” legt Stéphane uit. “Er zijn pocket sequencers, qua formaat niet groter dan een USB-stick, die je in een computer kunt inpluggen om de digitale informatie te lezen.”

Met zijn collega’s is hij overtuigd dat DNA-codering de toekomst is voor dataopslag. “De interesse in DNA is vooral ecologisch”, zo verklaarde hij. De milieu impact van digitale technologie is onmiskenbaar groot. Digitale informatieopslag genereert nu al meer CO2vervuiling dan de luchtvaart en de hoeveelheid datacenters neemt steeds sneller toe. “DNA is de beste technologie die momenteel beschikbaar is om dit probleem op te lossen, omdat het kan worden opgeslagen bij kamertemperatuur zonder energiegebruik. Om het stabiel op te slaan volstaat het om het weg te houden van lucht, vocht en licht. Onder deze condities wordt verwacht dat de informatie op DNA stabiel blijft voor meer dan 50.000 jaar” zegt Stéphane Lemaire.

Alle data van de wereld kunnen geplaatst worden in 100 gram DNA met het volume van een chocoladereep. Het Nationaal Archief van Frankrijk bewaart op haar servers meer dan 70.000 gigabytes aan documenten, foto’s, video’s, e-mails…. “Elk jaar hebben we meer terabytes. Er zijn miljarden bestanden. We verwachten dat we in de komende twee tot drie jaar de grens van 200 Terabytes  overschrijden” zegt Béatrice Herold, directeur belast met digitale conservering. “Het wezen van archivist betekent dat we meer moeten denken over de toekomst dan aan het verleden, dus we zijn allen zeer betrokken bij deze onderwerpen” zegt ze.

Het Franse Nationaal Archief is niet de enige die zijn hoop stelt op deze nieuwe technologie. Microsoft bijvoorbeeld heeft een machine ontwikkeld die automatisch digitale informatie wegschrijft in DNA. Hiervoor maakten onderzoekers gebruik van het biotechnisch bedrijf Twist, een van de leiders in synthetisch DNA. “Het probleem is niet om te bewijzen dat het werkt, het is het reduceren van de kosten, zo verklaart de directeur van Twist, Emily Leproust. “Vandaag de dag zijn de kosten van DNA € 1000 per megabyte, terwijl die voor een terabyte op een harde schijf € 100 bedragen. Dat zijn dus nog steeds onvergelijkbare grootheden. Servers hebben echter een grote ecologische voetafdruk, dus wanneer je deze kleine capsule ziet, ga je dromen over de gigantische capaciteit om grote hoeveelheden informatie op te slaan.”

Om deze kosten te reduceren moet dus nog heel wat werk worden verzet voordat er sprake kan zijn van een kostenefficiënt systeem. Maar volgens Emily Leproust zal de DNA-technologie de datasector behoorlijk veranderen. DNA is erg traag bij hergebruik. De doelstelling van DNA-opslag is dan ook  langetermijnopslag. Maar: 60% van de datacenters doen niet anders. De verwachting is dan ook dat  langetermijnarchivering in de toekomst gebeurt via opslag in DNA-formaat. De andere 40%, waar de informatie op elk moment snel beschikbaar moet zijn, zal in snellere geheugens blijven plaatsvinden.”

De wetenschapper heeft een samenwerking van laboratoria en bedrijven opgericht om DNA-opslag te promoten. Er zijn inmiddels rond de 30 leden, waaronder universitaire laboratoria, biotechnische bedrijven en de gigant Microsoft…

 

[1] Over dit onderwerp verscheen een artikel van Boris Hallier in Governance and Recordkeeping Around The World, May 2022, vol. 6 no. 11, https://jibeop.com/a-solution-to-digital-data-storage-dna-encoded-documents-enter-the-national-archives/ Vrije vertaling Ad van Heijst, VHIC.

Gepubliceerd in Sited 197.

Terug naar overzicht