Prelomová štúdia predstavuje významný krok k vývoju DNA-založený úložný systém pre digitálne dáta.
Digitálne data dnes rastie exponenciálnym tempom kvôli našej závislosti od gadgetov a vyžaduje si robustné dlhodobé skladovanie. Ukladanie dát sa pomaly stáva náročným, pretože súčasná digitálna technológia nie je schopná poskytnúť riešenie. Príkladom je, že za posledné dva roky sa vytvorilo viac digitálnych dát ako za celú históriu počítače, v skutočnosti sa na svete každý deň vytvorí 2.5 bilióna bajtu {1 quintilión bajtu = 2,500,000 2,500,000,000 XNUMX terabajtov (TB) = XNUMX XNUMX XNUMX XNUMX gigabajtov (GB)} údajov. Patria sem údaje zo stránok sociálnych sietí, online bankové transakcie, záznamy spoločností a organizácií, údaje zo satelitov, sledovanie, výskum, vývoj atď. Tieto údaje sú obrovské a neštruktúrované. Preto je teraz veľkou výzvou vysporiadať sa s obrovskými požiadavkami na ukladanie údajov a ich exponenciálnym rastom, najmä pre organizácie a korporácie, ktoré vyžadujú robustné dlhodobé ukladanie.
V súčasnosti sú dostupné možnosti pevného disku, optických diskov (CD), pamäťových kľúčov, flash diskov a pokročilejších páskových jednotiek alebo optických diskov BluRay, ktoré uchovávajú približne až 10 terabajtov (TB) údajov. Aj keď sa takéto úložné zariadenia bežne používajú, majú mnoho nevýhod. Po prvé, majú nízku až strednú trvanlivosť a musia byť skladované v ideálnych podmienkach teploty a vlhkosti, aby vydržali mnoho desaťročí, a preto si vyžadujú špeciálne navrhnuté fyzické skladovacie priestory. Takmer všetky spotrebúvajú veľa energie, sú objemné a nepraktické a môžu sa poškodiť pri jednoduchom páde. Niektoré z nich sú veľmi drahé, sú často postihnuté chybou údajov, a preto nie sú dostatočne robustné. Možnosť, ktorá bola všeobecne akceptovaná organizáciou, sa nazýva cloud computing – usporiadanie, v ktorom si spoločnosť v zásade najme „vonkajší“ server na spracovanie všetkých svojich požiadaviek na IT a ukladanie údajov, ktorý sa označuje ako „cloud“. Jednou z hlavných nevýhod cloud computingu sú problémy s bezpečnosťou a súkromím a zraniteľnosť voči útokom hackerov. Existujú aj ďalšie problémy, ako sú vysoké náklady, obmedzená kontrola zo strany materskej organizácie a závislosť na platforme. Cloud computing sa stále považuje za dobrú alternatívu pre dlhodobé ukladanie. Zdá sa však, že digitálne informácie, ktoré sa generujú na celom svete, určite predbehnú našu schopnosť ich ukladať a že sú potrebné ešte robustnejšie riešenia, aby sme pokryli túto záplavu údajov a zároveň poskytli škálovateľnosť, aby sa zohľadnili aj budúce potreby ukladania.
Môže DNA pomôcť pri ukladaní počítača?
Naše DNA (Deoxyribonukleová kyselina) sa považuje za vzrušujúce alternatívne médium na ukladanie digitálnych údajov. DNA je samoreprodukujúci sa materiál prítomný takmer vo všetkých živých organizmoch a je to, čo tvorí našu genetickú informáciu. Umelé alebo syntetické DNA je odolný materiál, ktorý možno vyrobiť pomocou komerčne dostupných strojov na syntézu oligonukleotidov. Primárnou výhodou DNA je jej dlhovekosť ako a DNA vydrží 1000-krát dlhšie ako kremík (kremík – materiál používaný na stavbu počítače). Úžasne, len jediný kubický milimeter DNA môže obsahovať kvintilión bajtov dát! DNA je tiež ultrakompaktný materiál, ktorý nikdy nedegraduje a môže byť skladovaný na chladnom a suchom mieste po stovky storočí. Myšlienka využitia DNA na uchovávanie sa objavila už dlho od roku 1994. Hlavným dôvodom je podobný spôsob, akým sa informácie ukladajú do počítača a do DNA – keďže v oboch sú uložené plány informácií. Počítač ukladá všetky údaje ako 0 a 1 a DNA ukladá všetky údaje živého organizmu pomocou štyroch báz – tymín (T), guanín (G), adenín (A) a cytozín (C). Preto by sa DNA mohla nazvať štandardným úložným zariadením, rovnako ako počítač, ak tieto bázy môžu byť reprezentované ako 0s (základy A a C) a 1 (základy T a G). DNA je pevná a trvácna, najjednoduchším odrazom je, že náš genetický kód – plán všetkých našich informácií uložených v DNA – sa efektívne prenáša z generácie na generáciu opakovaným spôsobom. Všetci softvéroví a hardvéroví giganti chcú používať syntetickú DNA na ukladanie obrovského množstva, aby dosiahli svoj cieľ, ktorým je vyriešenie dlhodobej archivácie údajov. Myšlienkou je najprv previesť počítačový kód 0s a 1s na kód DNA (A, C, T, G), prevedený kód DNA sa potom použije na výrobu syntetických reťazcov DNA, ktoré sa potom môžu uložiť do chladiarní. Vždy, keď je to potrebné, môžu byť vlákna DNA odstránené z chladiarenského skladu a ich informácie dekódované pomocou stroja na sekvenovanie DNA a sekvencia DNA je nakoniec preložená späť do binárneho počítačového formátu 1s a 0s, aby sa čítala v počítači.
Bolo to ukázané1 že len pár gramov DNA dokáže uložiť quintilión bajtov dát a udržať ich neporušené až 2000 rokov. Toto jednoduché chápanie však čelilo určitým problémom. Po prvé, je dosť drahé a tiež bolestne pomalé zapisovať dáta do DNA, tj skutočnú konverziu 0 a 1 na bázy DNA (A, T, C, G). Po druhé, akonáhle sú údaje „zapísané“ do DNA, je náročné nájsť a získať súbory a vyžaduje si techniku tzv. DNA sekvenovanie – proces určenia presného poradia báz v rámci a DNA molekula -po ktorej sa dáta dekódujú späť na 0s a 1s.
Nedávna štúdia2 vedci z Microsoft Research a University of Washington dosiahli „náhodný prístup“ k ukladaniu DNA. Aspekt „náhodného prístupu“ je veľmi dôležitý, pretože znamená, že informácie môžu byť prenesené na miesto alebo z miesta (vo všeobecnosti pamäte), v ktorom je každé miesto, bez ohľadu na to, kde v poradí, priamo prístupné. Pomocou tejto techniky náhodného prístupu možno súbory získavať z úložiska DNA selektívnym spôsobom v porovnaní s predchádzajúcim spôsobom, keď si takéto vyhľadávanie vyžadovalo sekvenovanie a dekódovanie celého súboru údajov DNA, aby bolo možné nájsť a extrahovať niekoľko požadovaných súborov. Význam „náhodného prístupu“ sa ďalej zvyšuje, keď sa množstvo údajov zvyšuje a stáva sa obrovským, pretože znižuje množstvo sekvencovania, ktoré je potrebné vykonať. Je to vôbec prvýkrát, čo sa náhodný prístup ukázal v takom veľkom rozsahu. Výskumníci tiež vyvinuli algoritmus na efektívnejšie dekódovanie a obnovu údajov s väčšou toleranciou voči chybám údajov, vďaka čomu je postup sekvenovania tiež rýchlejší. V tejto štúdii bolo zakódovaných viac ako 13 miliónov syntetických DNA oligonukleotidov, čo boli údaje s veľkosťou 200 MB pozostávajúce z 35 súborov (obsahujúcich video, zvuk, obrázky a text) s veľkosťou od 29 kB do 44 MB. Tieto súbory boli načítané jednotlivo bez chýb. Autori tiež navrhli nové algoritmy, ktoré sú robustnejšie a odolnejšie voči chybám pri písaní a čítaní sekvencií DNA. Táto štúdia publikovaná v Nature Biotechnology vo veľkom pokroku, ktorý ukazuje životaschopný rozsiahly systém na uchovávanie a získavanie DNA.
Úložný systém DNA vyzerá veľmi príťažlivo, pretože má vysokú hustotu údajov, vysokú stabilitu a ľahko sa skladuje, no očividne má pred univerzálnym prijatím veľa výziev. Len málo faktorov je časovo a pracne náročné dekódovanie DNA (sekvenovanie) a tiež syntéza DNA. Táto technika vyžaduje väčšiu presnosť a širšie pokrytie. Aj keď sa v tejto oblasti dosiahol pokrok, presný formát, v akom budú dáta dlhodobo uchovávané, ako napr DNA sa stále vyvíja. Microsoft sa zaviazal zlepšiť produkciu syntetickej DNA a riešiť výzvy, aby navrhol plne funkčný DNA skladovací systém do roku 2020.
***
Zdroj (e)
1. Erlich Y a Zielinski D 2017. DNA Fountain umožňuje robustnú a efektívnu architektúru úložiska. Veda. 355 (6328). https://doi.org/10.1126/science.aaj2038
2. Organick L a kol. 2018. Náhodný prístup vo veľkom úložisku dát DNA. Prírodná biotechnológia. 36. https://doi.org/10.1038/nbt.4079
***
