Кодирование и измерение информации
Кодирование и измерение информации: бит, байт, КБ, МБ; формулы I=K·i и N=2^i, кодирование текста, графики, звука. Разбор заданий ЕГЭ и ОГЭ по шагам.
Эта шпаргалка собирает все формулы и приёмы, которые нужны на ЕГЭ и ОГЭ по информатике для задач на измерение и кодирование информации: единицы измерения и степени двойки, алфавитный (объёмный) и содержательный (вероятностный) подходы, кодирование текста, растровой графики и звука, а также расчёт скорости передачи данных. Каждый блок сопровождается формулами и разобранными по шагам задачами.
Единицы измерения информации
Наименьшая единица информации — бит (один разряд двоичного кода, 0 или 1). Восемь битов образуют байт. Все крупные единицы получаются умножением на 1024 = 2^10 (а не на 1000!). Это ключевой момент: переход между соседними единицами — это домножение или деление на 2^10.
| Единица | Обозначение | В предыдущих | В байтах | В битах |
|---|---|---|---|---|
| бит | бит / b | — | 1/8 байта | 1 |
| байт | Б / B | 8 бит | 1 | 8 = 2^3 |
| килобайт | КБ / KB | 1024 байта | 2^10 = 1024 | 2^13 = 8192 |
| мегабайт | МБ / MB | 1024 КБ | 2^20 | 2^23 |
| гигабайт | ГБ / GB | 1024 МБ | 2^30 | 2^33 |
| терабайт | ТБ / TB | 1024 ГБ | 2^40 | 2^43 |
Правило перевода: чтобы перевести из старшей единицы в младшую — умножай на 1024; из младшей в старшую — дели на 1024. Например: 5 МБ = 5 · 2^20 байт = 5 · 2^23 бит.
Степени двойки — выучить наизусть
Большинство задач ЕГЭ сводится к представлению числа в виде степени двойки. Эту таблицу нужно знать на память.
| n | 2^n | n | 2^n |
|---|---|---|---|
| 0 | 1 | 9 | 512 |
| 1 | 2 | 10 | 1024 |
| 2 | 4 | 11 | 2048 |
| 3 | 8 | 12 | 4096 |
| 4 | 16 | 13 | 8192 |
| 5 | 32 | 14 | 16384 |
| 6 | 64 | 15 | 32768 |
| 7 | 128 | 16 | 65536 |
| 8 | 256 | 20 | 1048576 |
Алфавитный (объёмный) подход
Алфавитный подход не зависит от смысла сообщения — он считает только количество символов и мощность алфавита. Главная идея: каждый символ алфавита кодируется i битами, и весь объём сообщения равен сумме этих битов.
Основные формулы:
N = 2^i — связь мощности алфавита и информационного веса символа
i = log2(N) — сколько бит занимает один символ
I = K · i — информационный объём всего сообщения
- N — мощность алфавита (число различных символов);
- i — информационный вес одного символа (в битах);
- K — количество символов в сообщении;
- I — информационный объём сообщения (в битах).
Если N — точная степень двойки, то i — целое число. Если нет — берут ближайшую большую степень двойки (символ нельзя закодировать «дробным» числом бит).
Задача 1. Найти объём сообщения
Условие. Алфавит племени содержит 32 символа. Сообщение состоит из 60 символов. Каков информационный объём сообщения?
Решение по шагам:
- Мощность алфавита
N = 32 = 2^5, значитi = log2(32) = 5бит на символ. - Количество символов
K = 60. - Объём:
I = K · i = 60 · 5 = 300бит. - Переведём в байты:
300 / 8 = 37,5байта.
Ответ: 300 бит (37,5 байта).
Задача 2. Найти мощность алфавита
Условие. Сообщение из 20 символов занимает 100 бит. Какова мощность алфавита?
- Вес одного символа:
i = I / K = 100 / 20 = 5бит. - Мощность алфавита:
N = 2^i = 2^5 = 32символа.
Ответ: 32 символа.
Содержательный (вероятностный) подход. Формула Хартли
Содержательный подход измеряет количество информации в сообщении о том, что произошло одно из N равновероятных событий. Связь числа исходов и количества информации описывает формула Хартли:
N = 2^i — N равновероятных исходов
i = log2(N) — количество информации в сообщении об одном исходе (в битах)
Это та же математическая зависимость, что и в алфавитном подходе, но смысл другой: здесь i — это информация, которую несёт сообщение о наступившем событии, а N — число равновероятных вариантов.
Задача 3. Угадывание числа
Условие. В коробке лежат 64 шара, среди которых один выигрышный. Сколько информации несёт сообщение о том, какой шар выигрышный?
- Число равновероятных исходов
N = 64 = 2^6. - Количество информации:
i = log2(64) = 6бит.
Ответ: 6 бит.
Подсказка: если N не является степенью двойки (например, 50), то i ищут как наименьшее целое, при котором 2^i ≥ N. Для 50: 2^5=32 < 50 ≤ 64=2^6, поэтому i = 6 бит.
Кодирование текста
Каждому символу текста ставится в соответствие двоичный код. Объём текста по алфавитному подходу: I = K · i, где i зависит от кодировки.
| Кодировка | Бит на символ | Байт на символ | Размер алфавита N |
|---|---|---|---|
| ASCII | 8 | 1 | 256 = 2^8 |
| Windows-1251 / КОИ-8 | 8 | 1 | 256 |
| Unicode (UTF-16) | 16 | 2 | 65536 = 2^16 |
| UTF-8 (кириллица) | 16 | 2 | — |
| UTF-8 (латиница) | 8 | 1 | — |
На что обратить внимание: в задачах ЕГЭ обычно прямо указывают, сколько бит занимает символ. Классика — «каждый символ кодируется 1 байтом» (ASCII) или «2 байтами» (Unicode/КОИ-8 не путать). Пробелы и знаки препинания — тоже символы!
Задача 4. Объём текста
Условие. Статья содержит 30 страниц, на каждой странице 40 строк по 60 символов. Каждый символ кодируется 16 битами (Unicode). Найдите объём статьи в килобайтах.
- Всего символов:
K = 30 · 40 · 60 = 72000. - Объём в битах:
I = 72000 · 16 = 1 152 000бит. - В байтах:
1 152 000 / 8 = 144 000байт. - В килобайтах:
144 000 / 1024 ≈ 140,6КБ.
Ответ: примерно 140,6 КБ.
Кодирование графики (растровое изображение)
Растровое изображение состоит из пикселей. Каждый пиксель хранит цвет, закодированный i битами — это глубина цвета (битовая глубина). Чем больше глубина, тем больше различных цветов.
N = 2^i — число различных цветов в палитре
i = log2(N) — глубина цвета (бит на пиксель)
I = K · i — объём изображения, где K — число пикселей
K = ширина · высота (в пикселях)
| Глубина цвета i | Число цветов N = 2^i | Тип |
|---|---|---|
| 1 бит | 2 | чёрно-белое |
| 4 бита | 16 | палитра 16 цветов |
| 8 бит | 256 | оттенки серого / 256 цветов |
| 16 бит | 65536 | High Color |
| 24 бита | 16 777 216 | True Color (RGB) |
Задача 5. Объём растрового рисунка
Условие. Рисунок размером 1024 × 512 пикселей закодирован с палитрой из 256 цветов. Найдите объём файла без сжатия (в КБ).
- Глубина цвета:
N = 256 = 2^8, значитi = 8бит на пиксель. - Число пикселей:
K = 1024 · 512 = 524288 = 2^19. - Объём в битах:
I = K · i = 2^19 · 8 = 2^19 · 2^3 = 2^22бит. - В байтах:
2^22 / 8 = 2^22 / 2^3 = 2^19байт. - В килобайтах:
2^19 / 2^10 = 2^9 = 512КБ.
Ответ: 512 КБ.
Совет: в таких задачах удобно всё представлять степенями двойки и не считать «в лоб» — тогда вычисления сводятся к сложению и вычитанию показателей степени.
Кодирование звука
Аналоговый звук оцифровывают двумя параметрами: частотой дискретизации (сколько замеров громкости в секунду, измеряется в Гц) и глубиной кодирования (сколько бит на один замер). Дополнительно учитывают число каналов: 1 — моно, 2 — стерео.
I = t · f · i · k
где
t — время звучания (в секундах)
f — частота дискретизации (в Гц = замеров в секунду)
i — глубина кодирования (бит на один замер)
k — число каналов (1 — моно, 2 — стерео)
Запомни: 1 кГц = 1000 Гц (здесь обычные десятичные килогерцы, не 1024!). А вот получившийся объём в КБ/МБ переводят уже через 1024.
Задача 6. Объём звукозаписи
Условие. Производилась двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и глубиной кодирования 16 бит. Запись длилась 1 минуту. Определите размер файла в мегабайтах (без сжатия).
- Переведём время:
t = 1 мин = 60 с. - Частота:
f = 16 кГц = 16000 Гц. - Объём в битах:
I = t · f · i · k = 60 · 16000 · 16 · 2 = 30 720 000бит. - В байтах:
30 720 000 / 8 = 3 840 000байт. - В мегабайтах:
3 840 000 / 1024 / 1024 ≈ 3,66МБ.
Ответ: примерно 3,66 МБ.
Скорость передачи данных
Скорость передачи показывает, сколько информации проходит по каналу связи за единицу времени. Измеряется в битах в секунду (бит/с), килобитах в секунду (Кбит/с) и т. д.
V = I / t — скорость передачи (объём, делённый на время)
I = V · t — объём переданных данных
t = I / V — время передачи
Важно про единицы: для скорости (биты в секунду) приставки кило/мега обычно означают 1000 и 1 000 000 в десятичном смысле, но в задачах ЕГЭ чаще берут двоичные приставки 2^10. Внимательно читай условие. Обязательно следи за согласованием единиц: и объём, и скорость должны быть в одинаковых единицах (биты с битами).
Задача 7. Время передачи файла
Условие. Файл размером 9 МБ передаётся по каналу со скоростью 3 Мбит/с. Сколько секунд займёт передача? (1 МБ = 2^20 байт, 1 Мбит = 2^20 бит.)
- Объём файла в битах:
I = 9 · 2^20 байт · 8 = 9 · 2^20 · 2^3 = 9 · 2^23бит. - Скорость в битах/с:
V = 3 · 2^20бит/с. - Время:
t = I / V = (9 · 2^23) / (3 · 2^20) = 3 · 2^3 = 3 · 8 = 24с.
Ответ: 24 секунды.
Задача 8. Сравнение двух каналов (типичный ЕГЭ)
Условие. Документ объёмом 5 МБ передавали по каналу A за некоторое время. Затем тот же документ передали по каналу B, который вдвое быстрее. На сколько секунд быстрее прошла передача по B, если скорость A равна 2^20 бит/с?
- Объём:
I = 5 · 2^20 · 8 = 5 · 2^23бит. - Время по A:
tA = I / VA = (5 · 2^23) / 2^20 = 5 · 2^3 = 40с. - Канал B вдвое быстрее, значит время вдвое меньше:
tB = 40 / 2 = 20с. - Выигрыш:
40 − 20 = 20с.
Ответ: на 20 секунд быстрее.
Шпаргалка формул на одном экране
| Тема | Формула | Что находим |
|---|---|---|
| Алфавит ↔ вес символа | N = 2^i, i = log2(N) | мощность алфавита / бит на символ |
| Объём сообщения | I = K · i | информационный объём текста |
| Формула Хартли | N = 2^i | информация о равновероятном событии |
| Графика | I = K · i, K = ш · в | объём растрового изображения |
| Звук | I = t · f · i · k | объём звукозаписи |
| Скорость | V = I / t | скорость / время / объём передачи |
Главные ошибки на экзамене: путать 1000 и 1024 при переводе единиц; забывать перевести байты в биты (или наоборот) перед делением; не учитывать число каналов в звуке; считать пробелы «не символами». Держи единицы согласованными и переводи всё к битам или степеням двойки — и задачи решаются за пару строк. Больше тренировки — в разделе задач и на учебнике.