Bozza:Archiviazione dei dati digitali del DNA

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

L'archiviazione digitale dei dati del DNA [1]è il processo di codifica e decodifica dei dati binari da e verso filamenti di DNA sintetizzati. [2] [3]

Il DNA digitale per l'archiviazione di dati ha un enorme potenzialità grazie alla elevata densità di memorizzazione, al momento l'utilizzo pratico è fortemente limitato a causa del costo elevato e dei tempi di lettura e scrittura molto lenti.[4] [5]

Nel giugno 2019, gli scienziati hanno riferito che tutti i 16 GB di testo della Wikipedia inglese erano stati codificati nel DNA sintetico .[6] [7]Nel 2021, gli scienziati hanno riferito che è stato sviluppato un scrittore di dati personalizzato sul DNA . [8]

«Per convalidare il nostro metodo e sistema, abbiamo codificato e decodificato tre file di testo compressi selezionati da Wikipedia gli articoli "Esperimento di Meselson-Stahl" (File 1), "Cronologia della teoria dell'informazione" (File 2) e "Enciclopedia galattica" (File 3) combinati in 8580 byte

Metodi di codifica[modifica | modifica wikitesto]

Sono possibili molti metodi per codificare i dati nel DNA. I metodi ottimali sono quelli che fanno un uso parsimonioso del DNA e proteggono dagli errori. [10] Se il DNA del messaggio deve essere conservato per un lungo periodo di tempo, ad esempio 1.000 anni, è utile anche che la sequenza sia ovviamente artificiale e che il frame di lettura sia facile da identificare. [11]

Codifica del testo[modifica | modifica wikitesto]

Sono stati proposti diversi metodi semplici per codificare il testo. La maggior parte di questi comporta la traduzione di ciascuna lettera in un "codone" corrispondente, costituito da una piccola sequenza unica di nucleotidi in una tabella di ricerca . Alcuni esempi di questi schemi di codifica includono codici Huffman, comma code e codici alternati. [11]

Codifica di dati arbitrari[modifica | modifica wikitesto]

Per codificare dati arbitrari nel DNA, i dati vengono generalmente prima convertiti in dati ternari (base 3) anziché in dati binari (base 2). Ogni cifra (o "trit") viene quindi convertita in un nucleotide utilizzando una tabella di ricerca. Per evitare omopolimeri (nucleotidi ripetuti), che possono causare problemi con il sequenziamento accurato, il risultato della ricerca dipende anche dal nucleotide precedente. Utilizzando la tabella di ricerca di esempio riportata di seguito, se il nucleotide precedente nella sequenza è T ( timina ) e il trit è 2, il nucleotide successivo sarà G ( guanina ). [12] [13]

Trit ai nucleotidi (esempio)
Precedente 0 1 2
T A C G
G T A C
C G T A
A C G T

Possono essere incorporati vari sistemi per partizionare e indirizzare i dati, nonché per proteggerli da errori. Un approccio alla correzione degli errori consiste nell'intersecare regolarmente nucleotidi di sincronizzazione tra i nucleotidi che codificano le informazioni. Questi nucleotidi di sincronizzazione possono agire come impalcature durante la ricostruzione della sequenza da più filamenti sovrapposti. [14]

In vivo[modifica | modifica wikitesto]

Il codice genetico degli organismi viventi può potenzialmente essere cooptato per immagazzinare informazioni. Inoltre la biologia sintetica può essere utilizzata per ingegnerizzare le cellule con "registratori molecolari" per consentire la memorizzazione e il recupero delle informazioni immagazzinate nel materiale genetico della cellula. [15] L’editing genetico CRISPR [16]può essere utilizzato anche per inserire sequenze di DNA artificiale nel genoma della cellula. [15] Per la codifica dei dati del lignaggio dello sviluppo (registratore di volo molecolare), circa 30 trilioni di nuclei di cellule per topo * 60 siti di registrazione per nucleo * 7-15 bit per sito producono circa 2 TeraByte per topo scritti (ma letti solo in modo molto selettivo). [17]

La Biblioteca Lunare[modifica | modifica wikitesto]

La Biblioteca Lunare, lanciata sul Beresheet Lander dalla Arch Mission Foundation, trasporta informazioni codificate nel DNA, che include 20 libri famosi e 10.000 immagini. Questa è stata una delle scelte di conservazione ottimali, poiché il DNA può durare a lungo. La Arch Mission Foundation suggerisce che può ancora essere letto dopo miliardi di anni. [18]

«Gli organizzatori del progetto sperano di includere alla fine tutta Wikipedia, così come le mappe del genoma e gran parte delle più importanti conoscenze artistiche, musicali, letterarie e scientifiche del mondo

DNA delle cose[modifica | modifica wikitesto]

Il concetto di DNA delle cose (DoT) è stato introdotto nel 2019 da un team di ricercatori provenienti da Israele e Svizzera, tra cui Yaniv Erlich e Robert Grass. [20] [21] [22] DoT codifica i dati digitali in molecole di DNA, che vengono poi incorporate negli oggetti. Ciò dà la possibilità di creare oggetti che portano il proprio progetto, simili agli organismi biologici. A differenza dell'Internet delle cose, che è un sistema di dispositivi informatici interconnessi, DoT crea oggetti che sono oggetti di archiviazione indipendenti, completamente off-grid .

Come prova di concetto per DoT, il ricercatore ha stampato in 3D un coniglietto di Stanford che contiene il suo progetto nel filamento di plastica utilizzato per la stampa. Tagliando un pezzettino dell'orecchio del coniglio, sono stati in grado di leggere il progetto, moltiplicarlo e produrre una generazione successiva di conigli. Inoltre, la capacità di DoT di servire a scopi steganografici è stata dimostrata producendo lenti non distinguibili che contengono un video di YouTube integrato nel materiale.

Guarda anche[modifica | modifica wikitesto]

Note[modifica | modifica wikitesto]

  1. ^ Byte biologici: L'archiviazione dei dati del DNA immagazzina exabyte, su tomorrow.bio, 2 ottobre 2023.
  2. ^ vol. 20, DOI:10.1038/s41576-019-0125-3, PMID 31068682, https://oadoi.org/10.1038/s41576-019-0125-3.
  3. ^ vol. 45, DOI:10.1007/s11033-018-4280-y, PMID 30073589, https://oadoi.org/10.1007/s11033-018-4280-y.
  4. ^ Archiviare i dati, la nuova frontiera è nel Dna, su ilmessaggero.it, 16 marzo 2022.
  5. ^ (EN) vol. 8, DOI:10.1007/s13205-018-1246-7, PMID 29744271, https://oadoi.org/10.1007/s13205-018-1246-7.
  6. ^ (EN) Startup packs all 16GB of Wikipedia onto DNA strands to demonstrate new storage tech, su cnet.com, 29 giugno 2019.
  7. ^ (EN) DNA Data Storage Is About To Go Viral, su forbes.com, 3 agosto 2019.
  8. ^ (EN) The Power of DNA: Unlocking the Future of Digital Data Storage, su medium.com, 2 novembre 2023.
  9. ^ DNA-based data storage via combinatorial assembly, su biorxiv.org, 11 gennaio 2021.
  10. ^ (EN) vol. 25, DOI:10.1023/a:1024539608706, PMID 12966998, https://oadoi.org/10.1023/a:1024539608706.
  11. ^ a b vol. 25, DOI:10.1023/a:1024539608706, PMID 12966998, https://oadoi.org/10.1023/a:1024539608706.
  12. ^ (EN) vol. 494, Bibcode:2013Natur.494...77G, DOI:10.1038/nature11875, PMID 23354052, https://oadoi.org/10.1038/nature11875.
  13. ^ (EN) vol. 10, Bibcode:2019NatCo..10.2383L, DOI:10.1038/s41467-019-10258-1, PMID 31160595, https://oadoi.org/10.1038/s41467-019-10258-1.
  14. ^ vol. 10, Bibcode:2019NatCo..10.2383L, DOI:10.1038/s41467-019-10258-1, PMID 31160595, https://oadoi.org/10.1038/s41467-019-10258-1.
  15. ^ a b vol. 20, DOI:10.1038/s41576-019-0125-3, PMID 31068682, https://oadoi.org/10.1038/s41576-019-0125-3.
  16. ^ Editing genetico (CRISPR/Cas9), su it.moleculardevices.com, 6 marzo 2024.
  17. ^ (EN) vol. 361, DOI:10.1126/science.aat9804, PMID 30093604, https://oadoi.org/10.1126/science.aat9804.
  18. ^ (EN) THE LUNAR LIBRARY II (ASTROBOTIC, 2024), su archmission.org, 6 marzo 2024.
  19. ^ DNA-Coded “Lunar Library” Aims to Preserve Civilization for Millennia, su scientificamerican.com, 28 settembre 2018.
  20. ^ (EN) vol. 38, DOI:10.1038/s41587-019-0356-z, PMID 31819259, https://oadoi.org/10.1038/s41587-019-0356-z.
  21. ^ (EN) These Plastic Bunnies Got a DNA Upgrade. Next up, the World?, in Wired, 9 dicembre 2019.
  22. ^ (EN) Scientists Store Data in Synthetic DNA Embedded in a Plastic Bunny, in Wall Street Journal, 9 dicembre 2019.