Типы задач: с учителем, без учителя, с подкреплением

Три большие семьи ML-задач — и простой признак, по которому их различают.

Все задачи машинного обучения делят на три большие группы. Различие проще всего понять по одному вопросу: есть ли в данных «правильные ответы», на которых учится модель?

Обучение с учителем (supervised learning)

Обучение с учителем — модель учится на примерах, где для каждого входа известен правильный ответ (метка).

«Учитель» здесь — это размеченные данные. Вы показываете модели тысячи писем с ярлыком «спам/не спам» или квартиры с известной ценой. Модель находит связь между признаками и ответом и учится предсказывать ответ для новых объектов. Это самый частый тип задач. Внутри него — два подвида:

Регрессия — предсказываем число: цену квартиры, температуру, спрос.
Классификация — предсказываем категорию: спам/не спам, кошка/собака, болезнь/здоров.

Обучение без учителя (unsupervised learning)

Обучение без учителя — у данных нет готовых ответов; модель сама ищет в них структуру.

Здесь меток нет. Вы даёте модели данные о клиентах и просите: «найди группы похожих». Модель сама разобьёт клиентов на сегменты, хотя никто заранее не сказал, какие сегменты существуют. Типичные задачи: кластеризация (разбить на группы) и понижение размерности (упростить данные, сохранив суть).

Обучение с подкреплением (reinforcement learning)

Обучение с подкреплением — агент учится действовать в среде методом проб и ошибок, получая награды и штрафы.

Здесь нет фиксированного набора ответов. Есть агент, который совершает действия, и среда, которая отвечает наградой или штрафом. Цель — научиться действовать так, чтобы суммарная награда была максимальной. Так обучают игровых ботов, роботов, системы управления. Аналогия — дрессировка: за нужное действие — лакомство, и со временем поведение закрепляется.

Как различать на практике

Тип	Есть ответы?	Пример задачи
С учителем	Да, для каждого примера	Предсказать цену по характеристикам
Без учителя	Нет	Разбить клиентов на сегменты
С подкреплением	Нет, но есть награда за действия	Научить бота играть в игру

В этом курсе мы подробно разберём первые два типа — они составляют основу прикладного ML. Обучение с подкреплением — отдельная большая тема, мы лишь обозначим её идею.

Почему важно сразу определить тип задачи

Тип задачи — это первое, что специалист определяет, берясь за проект. От него зависит буквально всё: какие данные собирать, какие алгоритмы подойдут и какими метриками мерить успех. Спутать регрессию с классификацией — значит выбрать неподходящую модель и неверно оценить результат.

Простой алгоритм для самопроверки: сначала спросите себя, есть ли в данных правильные ответы. Если да — это обучение с учителем, и тогда уточните, что за ответ: число (регрессия) или категория (классификация). Если готовых ответов нет, но хочется найти структуру — это обучение без учителя. А если есть среда, которая реагирует на действия наградой, — обучение с подкреплением. Эти два вопроса почти всегда однозначно указывают на тип задачи.

Итог

Обучение с учителем: есть метки, предсказываем число (регрессия) или категорию (классификация).
Обучение без учителя: меток нет, ищем структуру — кластеры или упрощённое представление.
Обучение с подкреплением: агент учится через награды и штрафы методом проб и ошибок.
Главный различающий вопрос: есть ли в данных готовые правильные ответы.