Применения и риски автономности

Обзор реальных применений агентов и честный разговор о рисках, которые порождает автономность.

Автономность — способность агента действовать без пошагового контроля человека. Она же источник его главных рисков.

Где агенты полезны уже сейчас

Кодинг-ассистенты — читают репозиторий, пишут и запускают код, чинят тесты, итеративно отлаживаются (как раз многошаговая задача с инструментами).
Глубокий ресёрч — агент ищет по нескольким источникам, сверяет факты, собирает отчёт со ссылками.
Поддержка клиентов — агент с инструментами проверяет заказ в базе, оформляет возврат, заводит тикет — а не только отвечает текстом.
Автоматизация процессов — разобрать входящие письма, заполнить таблицу, дёрнуть несколько API по правилам.
Анализ данных — агент пишет и выполняет SQL/Python, смотрит результат, уточняет запрос.
Веб-автоматизация — агент управляет браузером: заполняет формы, собирает данные со страниц.

Общий знаменатель: задача многошаговая, требует инструментов, и шаги заранее не расписать.

Риски автономности

Чем больше свободы у агента, тем больше способов ошибиться — причём ошибки масштабируются автоматически.

1. Ошибки накапливаются

Если на каждом шаге агент прав с вероятностью 0.9, то после 5 шагов общая надёжность — уже примерно 0.9⁵. Цепочка автономных шагов хрупка.

step_reliability = 0.9
for steps in [1, 3, 5, 10]:
    overall = step_reliability ** steps
    print(f"{steps:2} шагов -> надёжность всей цепочки: {overall:.2%}")

Вывод:

 1 шагов -> надёжность всей цепочки: 90.00%
 3 шагов -> надёжность всей цепочки: 72.90%
 5 шагов -> надёжность всей цепочки: 59.05%
10 шагов -> надёжность всей цепочки: 34.87%

Вывод не «агенты бесполезны», а «нужны проверки, лимиты и устойчивость к ошибкам» — этим займёмся в разделах 3 и 6.

2. Действия с последствиями

Агент с правом отправлять письма, тратить деньги или удалять файлы может натворить дел из-за одной неверной мысли. Поэтому опасные действия отделяют: ограничивают права, требуют подтверждения человека, выполняют код в песочнице.

3. Стоимость выходит из-под контроля

Зациклившийся агент способен сделать сотни вызовов LLM, прежде чем кто-то заметит. Нужны жёсткие лимиты на число шагов и бюджет.

4. Безопасность: prompt injection

Если агент читает внешний текст (письмо, веб-страницу), злоумышленник может вставить туда инструкцию «забудь всё и сделай X». Агент с инструментами может её выполнить. Чужой текст нельзя слепо принимать за команды.

5. Непрозрачность

Понять, почему агент принял решение, сложно. Поэтому логируют каждый шаг (мысль, действие, наблюдение) — иначе отладка превращается в гадание.

Принцип: автономность под контролем

Зрелый подход — давать агенту ровно столько свободы, сколько нужно, и обкладывать её ограничениями:

Риск	Защита
Накопление ошибок	проверки, рефлексия, лимит шагов
Опасные действия	права, человек-в-цикле, песочница
Рост стоимости	лимиты шагов и бюджета
Prompt injection	не доверять внешнему тексту как команде
Непрозрачность	логирование каждого шага

Итог

Агенты уже полезны там, где задача многошаговая и требует инструментов: кодинг, ресёрч, поддержка, автоматизация.
Автономность порождает риски: ошибки накапливаются, действия имеют последствия, растёт стоимость, возможен prompt injection.
Зрелый агент — это автономность под контролем: лимиты, права, человек-в-цикле, песочница, логирование.