РНК и центральная догма молекулярной биологии

Информация в клетке течёт по маршруту ДНК → РНК → белок. Этот маршрут — каркас всей молекулярной биологии.

Центральная догма молекулярной биологии: генетическая информация передаётся от ДНК к РНК (транскрипция), а от РНК к белку (трансляция).

Зная этот маршрут, вы понимаете, что на каждом шаге происходит со строками: ДНК переписывается в РНК почти буква в букву, а РНК уже переводится в белок по таблице кодонов. Большинство задач курса — это какой-то из шагов этой догмы.

Чем РНК отличается от ДНК

РНК (рибонуклеиновая кислота) — тоже строка из четырёх букв, но с двумя отличиями от ДНК:

  • Вместо T (тимин) используется U (урацил). То есть алфавит РНК — {A, U, G, C}.
  • РНК обычно одноцепочечная (одна нить, а не двойная спираль).

Для кода это значит, что транскрипция ДНК→РНК — это буквально замена T на U.

dna = "ATGGCATTGCATAA"
rna = dna.replace("T", "U")
print("ДНК:", dna)
print("РНК:", rna)

Вывод:

ДНК: ATGGCATTGCATAA
РНК: AUGGCAUUGCAUAA

Три шага догмы

ШагИз чегоВо чтоЧто делает код
ТранскрипцияДНКмРНКзамена T→U
ТрансляциямРНКбелокчтение по 3 буквы, таблица кодонов

мРНК (матричная РНК) — это «рабочая копия» гена, которую клетка несёт к рибосоме, чтобы собрать белок. Ген хранится в ДНК как мастер-копия; РНК — расходный экземпляр. Аналогия из программирования: ДНК — это исходный код в репозитории, мРНК — собранный артефакт, который отправляют на исполнение, а белок — результат работы программы. Клетка не «исполняет» ДНК напрямую — она каждый раз делает свежую РНК-копию нужного гена, и таких копий может быть много одновременно. Это даёт регуляцию: меняя число копий мРНК, клетка управляет тем, сколько белка произвести, не трогая саму ДНК. Именно поэтому анализ экспрессии (сколько мРНК каждого гена в клетке) — отдельная большая ветка биоинформатики, которой мы коснёмся в разделе про омиксные данные.

Важно и то, что у эукариот (например, человека) между транскрипцией и трансляцией есть промежуточный шаг — сплайсинг: из первичной РНК вырезаются некодирующие куски (интроны), а кодирующие (экзоны) сшиваются. Один ген за счёт разных вариантов сшивки может давать несколько разных мРНК и, значит, несколько белков. Для кода это значит, что «ген → белок» не всегда прямое соответствие один-к-одному, и при анализе реальных геномов это приходится учитывать.

Зачем биоинформатике эта схема

Догма задаёт, что осмысленно считать. Например, мутация в ДНК важна ровно настолько, насколько она меняет белок (через РНК). Поэтому в анализе вариантов мы всегда мысленно прогоняем изменение по цепочке ДНК→РНК→белок. Покажем мини-конвейер целиком.

# Мини-догма: ДНК -> РНК (трансляцию белка добавим в разделе про код)
dna = "ATGTTCGGA"
rna = dna.replace("T", "U")
codons = [rna[i:i+3] for i in range(0, len(rna), 3)]
print("ДНК:   ", dna)
print("РНК:   ", rna)
print("Кодоны:", codons)

Вывод:

ДНК:    ATGTTCGGA
РНК:    AUGUUCGGA
Кодоны: ['AUG', 'UUC', 'GGA']

Видно, как строка естественно разбивается на тройки-кодоны — следующий раздел превратит эти тройки в аминокислоты.

Как работает под капотом: догма с исключениями

Классическая догма ДНК→РНК→белок — упрощение. Есть важные дополнения: обратная транскрипция (РНК→ДНК, так делают ретровирусы вроде ВИЧ), а также множество РНК, которые сами по себе функциональны и не превращаются в белок (рРНК, тРНК, регуляторные РНК). Биоинформатик про это помнит, но для базовых задач хватает прямого маршрута.

Частые ошибки

  • Оставить T в РНК. После транскрипции в строке РНК не должно быть T — только U.
  • Считать, что вся РНК становится белком. Многие РНК функциональны сами по себе.
  • Транслировать ДНК напрямую. Таблица кодонов написана для РНК (с U); сначала транскрипция.

Итог

  • РНК — строка из {A, U, G, C}, U заменяет T, обычно одноцепочечная.
  • Центральная догма: ДНК → (транскрипция) → РНК → (трансляция) → белок.
  • Транскрипция в коде — это замена T на U; трансляция — чтение тройками.
  • Есть исключения (обратная транскрипция, функциональные РНК), но базовый маршрут прямой.
Проверьте себя
1. Какая буква в РНК заменяет тимин (T) из ДНК?
AG
BU
CC
DA
2. Как в коде выглядит транскрипция ДНК в РНК?
AПеревернуть строку
BЗаменить каждую T на U
CЗаменить A на T
DУдалить все гласные
3. Что описывает центральная догма молекулярной биологии?
AДНК → РНК → белок
BБелок → РНК → ДНК всегда
CТолько хранение ДНК
DДеление клетки