ДНК като стабилно съхранение на данни

Биомолекулите съхраняват цифровата информация надеждно

Основният код на ДНК е идеално подходящ за съхранение на данни © thinkstock
чете на глас

Вместо твърд диск: изследователите са съхранявали големи количества цифрови данни в ДНК. Те кодираха два мегабайта компресирана информация под формата на биомолекули - и след това ги прочетоха без грешка. Особеността: Методът, използван от екипа, е не само ефективен, но и изключително здрав. Тъй като дори от множество копирани ДНК, оригиналните данни все още биха могли да се възстановят перфектно.

Човечеството произвежда все повече и повече данни. В същото време обаче цифровото забравяне заплашва, защото днешните носители за съхранение са доста краткотрайни. Поради постоянната промяна на технологиите и липсата на трайност на носителите на данни, днес архивите на цифрови данни трябва редовно да се копират. Това, което е на нормален твърд диск, в противен случай може да бъде нечетливо за няколко десетилетия.

Дълготраен и никога не остарял

За да избегнат този проблем в бъдеще, учените сега се обръщат към древна среда за съхранение на природата: ДНК. Основният им код не само съхранява изключителната генетична информация на живи същества. Той е добър и като съхранение на цифрови данни. Защото кодовият език на природата е много подобен на двоичния език на компютрите. Единствената разлика: нулите и тези представляват данните на твърдия диск, в ДНК те са базите A, C, T и G.

В сравнение със съхранението в твърдо състояние обаче, биомолекулата има ясно предимство: може да продължи хиляди години без увреждане, ако се съхранява при правилните условия. "За разлика от касетите и компактдисковете, този носител за съхранение никога няма да остарее - и ако се случи, ще имаме други проблеми", казва Янив Ерлих от Нюйоркския геномен център.

Два мегабайта като буквен код

Ерлих и колегата му Дина Зелински сега впечатляващо доказаха колко надеждно могат да се съхраняват огромните количества данни в нашето общество в ДНК. Те кодираха шест файла като ДНК - включително текст от теоретика на информация Клод Шенън, френски филм, компютърен вирус и цялостна компютърна операционна система. показ

За да преобразуват тези в компресирана форма общо два мегабайта данни, изследователите използваха специален алгоритъм - наречен Код на фонтана - информацията, произволно пакетирана в малки пакети и след това отново да се събере в правилния ред. Системата кодира информацията няколко пъти. По този начин не се губят данни, дори ако някои ДНК нуклеотиди от по-късната памет трябва да бъдат повредени. Особеността: Въпреки добавянето на излишна информация, процесът на кодиране е много ефективен.

Без грешки въпреки многократното копиране

Като цяло, Erlich и Zielinski така генерираха 72 000 ДНК нишка с дълъг код, в който всеки направление се състои от 200 бази. Тази последователност от писма ги изпраща в лаборатория, която използва този шаблон за синтезиране на молекули на ДНК. Тогава дойде вълнуващият момент: ще се възстанови ли оригиналната информация от тези молекули?

Всъщност изследователите успяха да декодират правилно своите данни, използвайки софтуер. Много по-невероятно обаче: същият успех би могъл да се постигне и с копия на ДНК. Учените умножили биомолекулите отново и отново, използвайки верижната реакция на полимеразата. Тези копия, както и техните копия и т.н., могат да бъдат декодирани без грешка. Това показва, че процесът на кодиране, използващ кода на Фонтан, е изключително здрав, заяви екипът.

Скъпа процедура

Изследователите също показаха, че с техния метод те могат да съхраняват информация не само безопасно, но и ефективно в големи количества. По този начин, един грам ДНК е достатъчен за съхраняване на 215 петабайта данни. Единствената уловка в процеса на съхранение: цената. Само 7 000 долара струват за синтеза на биомолекули. Изследователите похарчиха още 2000 долара, за да прочетат данните си. (Science, 2017; doi: 10.1126 / science.aaj2038)

(Инженерно-приложното училище на Колумбийския университет, 06.03.2017 - DAL)