Spirala bitów i bajtów

Szyfrowanie i dekodowanie informacji w łańcuchu DNA.

Miejscem do ukrycia cennych danych przed niepożądanym dostępem może być… probówka. Cząsteczka DNA nadaje się znakomicie do przechowywania i kodowania poufnych informacji. Istotne dane w probówce chowają się wśród innych cząsteczek.

Hilmar Rauhe, biolog i informatyk pracujący na uniwersytetach w Dortmundzie i Kolonii, ostrożnie dolewa do płynu w probówce jakiś wodnisty roztwór. Wstrząsa i… „Już gotowe” – mówi z uśmiechem.-„Dane są teraz zakodowane”. W szkle znajdują się miliony cząsteczek DNA, a pomiędzy nimi te nieliczne, które Rauhe chce ochronić przed niepożądanym dostępem.

Zaszyfrować DNA

Kod genetyczny zapisany w DNA niezbyt interesuje Rauhego. Podczas gdy genetycy całego świata pracują nad rozszyfrowaniem słynnej podwójnej helisy (figura przypominająca nić nawiniętą na walec), grupy robocze Rauhego na uniwersytetach Dortmundu i Kolonii starają się zakodować dane, wykorzystując ten niezwykły materiał. Rauhe jest założycielem zespołów badawczych, które używają biologicznego nośnika informacji genetycznej do cyfrowego zapisu danych. W Polsce podobnymi problemami zajmuje się prof. Jan Mulawka z Politechniki Warszawskiej.

Helisa DNA nadaje się również do kodowania i przechowywania informacji. Kod genetyczny to kolejność czterech nukleotydów – części składowych DNA: adeniny, cytozyny, guaniny i tymidyny (A, C, G, T). A łączy się z T, a C z G, wskutek czego występują one zawsze parami. W 1994 roku amerykański uczony Leonard Adleman badał analogie między kodem binarnym a budową cząsteczki DNA. Wykazał on, że na takich cząsteczkach można wykonywać obliczenia, używając przy tym algorytmów stosowanych w informatyce.

Z pojedynczych fragmentów DNA, będących odpowiednikami zer i jedynek, można zbudować nici zawierające dowolne informacje.

W komputerze biologicznym informacje można by zapisywać w sekwencji nukleotydów. Jeśli jedna ich para stanowiłaby jeden bit informacji (odpowiednio 0 lub 1), to 1 MB danych zmieściłby się w cząsteczce o długości 1 cm. Małe rozmiary DNA sprawiają, że w objętości 1 mm

3

mieści się 10 mld takich cząstek, czyli 10 mld megabajtów informacji. Jak widać, pojemność pamięci biologicznej jest znacznie większa niż stosowanych dzisiaj nośników. Probówka z roztworem DNA zastępująca dysk w komputerze to wciąż tylko utopia. Być może badania w tej dziedzinie przyśpieszy odkryta niedawno wydajna technika nanoszenia DNA na stały nośnik.

Celem, do którego dążą badacze, jest molekularny superkomputer. W jednej probówce można umieścić nawet 10

20

cząsteczek, które pełniłyby funkcję procesora, wykonując równolegle wiele operacji. Do ich przeprowadzenia służyłyby reakcje enzymatyczne. Wydaje się jednak, że przedsięwzięcie to utknęło obecnie w martwym punkcie, głównie dlatego, że odczytanie uzyskanych tą metodą informacji jest wciąż bardzo czasochłonne. Wymaga ono m.in. analizowania otrzymanego DNA w laboratorium i może trwać kilka dni. Wyszukanie informacji i jej zapis są wprawdzie bardzo szybkie, a do tego realizowane równolegle, ale prace nad przyśpieszeniem rozszyfrowania tak uzyskanych informacji znajdują się dopiero we wczesnej fazie. Ponadto informacja ulega zniszczeniu w procesie odczytywania.

Dane schowane w probówce

Ze względów praktycznych jako odpowiedniki zer i jedynek w kodzie binarnym Hilmar Rauhe stosuje nie pojedyncze pary nukleotydów, lecz krótkie odcinki DNA, które łatwo można łączyć w odpowiedniej kolejności.

Ciekawa jest możliwość łatwego szyfrowania informacji w cząsteczkach. Opiera się ona na zasadzie steganografii: interesujące nas dane są ukrywane w masie innych. Metody otrzymywania nici DNA o potrzebnej sekwencji, czyli łączenia jego elementów składowych w ściśle określonej kolejności, są już dziś znane. Aby ukryć dane, wystarczy otrzymane cząsteczki z zakodowaną informacją umieścić w mieszaninie innych cząstek. Rozkodowanie przypomina przysłowiowe szukaniu igły w stogu siana – bez klucza jest to praktycznie nieosiągalne.

Obróbka DNA pozwala uzyskać zapis przypominający kody kreskowe. Trzy nici (a, b, c) po naświetleniu ultrafioletem dają trzy różne obrazy. Z tego można już odczytać informację.

Do rozszyfrowywania takiej informacji naukowcy stosują zautomatyzowaną metodę, powszechnie wykorzystywaną w genetyce do powielania DNA: tzw. reakcję PCR (reakcja łańcuchowa polimerazy). Metoda ta została tak zmodyfikowana, aby wiadomości mogły być otrzymywane w postaci podobnej do kodów kreskowych. W cząsteczce oprócz zer i jedynek występują sekwencje oznaczające początek i koniec strumienia danych. Tylko posiadacz niewielkiej cząsteczki, zwanej primerem, odpowiadającej początkowi bloku danych, jest w stanie odszukać ukrytą wśród chaosu cząsteczek informację. Po powieleniu primera informację na niej zawartą można odczytać standardowymi metodami.

Genetyczne odciski palców

Badacze wykazali, że sposób zaszyfrowania danych w cząsteczkach DNA jest bezpieczny według kryteriów stosowanych dla systemów komputerowych. Mimo to oba te światy pozostają na razie rozdzielone. Szyfrowanie informacji w DNA nie zostało pomyślane jako konkurencja dla istniejących już systemów kryptografii. Hilmar Rauhe przewiduje, że metoda ta może być używana do celów znakowania. Na przykład numer seryjny pojazdu mógłby być – jego zdaniem – kodowany w cząsteczkach DNA domieszanych do lakieru. Przy wypadku samochód taki pozostawiłby niemożliwy do pomylenia z innym „genetyczny odcisk palców” w postaci śladów lakieru. W ten sam sposób można by znakować np. żywność, ale też nadawać certyfikaty płytom z muzyką czy filmami lub chronić cenne przedmioty: notebooki, telefony komórkowe oraz sprzęt hi-fi.

Info
Grupy dyskusyjne
Pytania, uwagi i komentarze: #
0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.