РНК и центральная догма молекулярной биологии
Информация в клетке течёт по маршруту ДНК → РНК → белок. Этот маршрут — каркас всей молекулярной биологии.
Центральная догма молекулярной биологии: генетическая информация передаётся от ДНК к РНК (транскрипция), а от РНК к белку (трансляция).
Зная этот маршрут, вы понимаете, что на каждом шаге происходит со строками: ДНК переписывается в РНК почти буква в букву, а РНК уже переводится в белок по таблице кодонов. Большинство задач курса — это какой-то из шагов этой догмы.
Чем РНК отличается от ДНК
РНК (рибонуклеиновая кислота) — тоже строка из четырёх букв, но с двумя отличиями от ДНК:
- Вместо T (тимин) используется U (урацил). То есть алфавит РНК — {A, U, G, C}.
- РНК обычно одноцепочечная (одна нить, а не двойная спираль).
Для кода это значит, что транскрипция ДНК→РНК — это буквально замена T на U.
dna = "ATGGCATTGCATAA"
rna = dna.replace("T", "U")
print("ДНК:", dna)
print("РНК:", rna)Вывод:
ДНК: ATGGCATTGCATAA РНК: AUGGCAUUGCAUAA
Три шага догмы
| Шаг | Из чего | Во что | Что делает код |
| Транскрипция | ДНК | мРНК | замена T→U |
| Трансляция | мРНК | белок | чтение по 3 буквы, таблица кодонов |
мРНК (матричная РНК) — это «рабочая копия» гена, которую клетка несёт к рибосоме, чтобы собрать белок. Ген хранится в ДНК как мастер-копия; РНК — расходный экземпляр. Аналогия из программирования: ДНК — это исходный код в репозитории, мРНК — собранный артефакт, который отправляют на исполнение, а белок — результат работы программы. Клетка не «исполняет» ДНК напрямую — она каждый раз делает свежую РНК-копию нужного гена, и таких копий может быть много одновременно. Это даёт регуляцию: меняя число копий мРНК, клетка управляет тем, сколько белка произвести, не трогая саму ДНК. Именно поэтому анализ экспрессии (сколько мРНК каждого гена в клетке) — отдельная большая ветка биоинформатики, которой мы коснёмся в разделе про омиксные данные.
Важно и то, что у эукариот (например, человека) между транскрипцией и трансляцией есть промежуточный шаг — сплайсинг: из первичной РНК вырезаются некодирующие куски (интроны), а кодирующие (экзоны) сшиваются. Один ген за счёт разных вариантов сшивки может давать несколько разных мРНК и, значит, несколько белков. Для кода это значит, что «ген → белок» не всегда прямое соответствие один-к-одному, и при анализе реальных геномов это приходится учитывать.
Зачем биоинформатике эта схема
Догма задаёт, что осмысленно считать. Например, мутация в ДНК важна ровно настолько, насколько она меняет белок (через РНК). Поэтому в анализе вариантов мы всегда мысленно прогоняем изменение по цепочке ДНК→РНК→белок. Покажем мини-конвейер целиком.
# Мини-догма: ДНК -> РНК (трансляцию белка добавим в разделе про код)
dna = "ATGTTCGGA"
rna = dna.replace("T", "U")
codons = [rna[i:i+3] for i in range(0, len(rna), 3)]
print("ДНК: ", dna)
print("РНК: ", rna)
print("Кодоны:", codons)Вывод:
ДНК: ATGTTCGGA РНК: AUGUUCGGA Кодоны: ['AUG', 'UUC', 'GGA']
Видно, как строка естественно разбивается на тройки-кодоны — следующий раздел превратит эти тройки в аминокислоты.
Как работает под капотом: догма с исключениями
Классическая догма ДНК→РНК→белок — упрощение. Есть важные дополнения: обратная транскрипция (РНК→ДНК, так делают ретровирусы вроде ВИЧ), а также множество РНК, которые сами по себе функциональны и не превращаются в белок (рРНК, тРНК, регуляторные РНК). Биоинформатик про это помнит, но для базовых задач хватает прямого маршрута.
Частые ошибки
- Оставить T в РНК. После транскрипции в строке РНК не должно быть T — только U.
- Считать, что вся РНК становится белком. Многие РНК функциональны сами по себе.
- Транслировать ДНК напрямую. Таблица кодонов написана для РНК (с U); сначала транскрипция.
Итог
- РНК — строка из {A, U, G, C}, U заменяет T, обычно одноцепочечная.
- Центральная догма: ДНК → (транскрипция) → РНК → (трансляция) → белок.
- Транскрипция в коде — это замена T на U; трансляция — чтение тройками.
- Есть исключения (обратная транскрипция, функциональные РНК), но базовый маршрут прямой.