Сколько информации помещается в одной молекуле ДНК
В каждой твоей клетке лежит инструкция длиной в два метра, записанная всего четырьмя буквами. Если перевести её в гигабайты, окажется, что природа придумала самый компактный жёсткий диск на планете — и он работает уже миллиарды лет.
В каждой твоей клетке свёрнута молекула длиной около двух метров, а записана она всего четырьмя буквами. Сколько же реальных данных, если измерить их так, как мы меряем фотки и видео — в битах и гигабайтах? Ответ оказывается одновременно скромным и совершенно сумасшедшим.
Алфавит из четырёх букв
ДНК — это длинная цепочка, и вдоль неё нанизаны звенья, которые называют азотистыми основаниями. Их всего четыре вида, и каждому досталась своя буква: A (аденин), T (тимин), G (гуанин) и C (цитозин). Вся наследственная информация — рост, цвет глаз, форма носа, как переваривать молоко — записана именно последовательностью этих букв. Не картинками, не словами, а порядком A-T-G-C-C-A-T и так далее.
Самое красивое, что буквы ходят парами. Напротив A всегда стоит T, а напротив G всегда стоит C — они держатся друг за друга, как две половинки застёжки-молнии. Поэтому ДНК и выглядит как закрученная лесенка: две нити, а между ними перекладины из пар букв. Это не просто эстетика. Благодаря парности клетка может расстегнуть молнию пополам и по каждой половинке достроить недостающую — так информация копируется без потерь.
Считаем в битах
Теперь главный вопрос: сколько данных в одной такой букве? В компьютере минимальная единица — бит, это ответ на вопрос с двумя вариантами: 0 или 1. Одним битом можно выбрать одно из двух. А у нас вариантов четыре: A, T, G или C. Чтобы различить четыре варианта, нужно ровно два бита (00, 01, 10, 11 — как раз четыре комбинации).
Значит, одна буква ДНК несёт два бита информации. Восемь бит — это байт, поэтому одна пара оснований — это четверть байта. Запомни эту цифру, дальше начнётся магия больших чисел.
Одна буква ДНК = два бита. Природа выбрала тот же принцип, что и инженеры компьютеров: кодировать всё комбинациями простых символов.
Сколько всего букв в человеке
В одной клетке человека помещается полный набор инструкций — геном. В нём примерно 3,2 миллиарда пар оснований. Умножаем на два бита и получаем около 6,4 миллиарда бит. Делим на восемь — выходит примерно 800 мегабайт чистой последовательности. А поскольку у тебя двойной набор хромосом (один от мамы, один от папы), общий объём — около 1,5 гигабайта.
Полтора гигабайта. Это меньше, чем один фильм в хорошем качестве. Вся инструкция по сборке живого человека влезла бы на старую флешку. И вот тут пора удивиться по-настоящему: эта инструкция упакована в каждую из примерно 37 триллионов клеток твоего тела. Если бы каждая клетка была флешкой, ты носил бы в себе хранилище, рядом с которым все дата-центры мира выглядят скромно.
- 1 буква — 2 бита
- 1 геном — около 1,5 гигабайта
- 1 человек — те же 1,5 ГБ, но скопированные триллионы раз
Чемпион по плотности записи
Представь библиотеку. Не районную, а такую, где книги стоят настолько плотно, что между ними не просунуть и лист бумаги. ДНК записывает данные именно так — на уровне отдельных молекул. Учёные подсчитали, что в один грамм ДНК теоретически можно упаковать сотни миллионов гигабайт. Для сравнения: всю информацию, которую человечество создало за всю историю, можно было бы записать в объёме, который поместится в ладони.
Поэтому инженеры всерьёз пробуют использовать ДНК как настоящий накопитель данных. Уже сейчас в лабораториях записывают в синтетическую ДНК музыку, картинки и целые книги, а потом считывают обратно. У этого есть огромный плюс: правильно хранимая ДНК не портится тысячи лет, в отличие от жёстких дисков, которые умирают за десяток лет. Мамонтов давно нет, а их ДНК учёные всё ещё читают из костей.
Почему это вообще работает
Может показаться, что 1,5 гигабайта — это маловато для такого сложного существа, как человек. И тут кроется самый хитрый трюк природы. ДНК хранит не готовую картинку тебя, а рецепт. Рецепт борща занимает полстранички, но из него вырастает целая кастрюля еды — потому что в рецепте записан процесс, а не каждая молекула супа по отдельности.
Так и геном: он не описывает, где стоит каждая клетка. Он описывает правила, по которым клетки сами делятся, перемещаются и решают, кем им стать. Из компактного набора инструкций разворачивается невероятная сложность — примерно как из коротенькой программы вырастает огромный узор фрактала. Вот почему полутора гигабайт хватает: ДНК хранит не результат, а способ его получить.
В следующий раз, глядя на флешку, вспомни: природа решила ту же задачу хранения данных задолго до нас. Четыре буквы, два бита на штуку, и из этого — всё разнообразие жизни на Земле. Неплохо для молекулы, которую не разглядеть даже в обычный микроскоп.