Снижение галлюцинаций

Модель уверенно выдумывает — это свойство, а не баг; задача промпт-инженера — загнать её в рамки проверяемого.

Галлюцинация — правдоподобный, но неверный или выдуманный ответ модели, поданный с той же уверенностью, что и факт.

Почему модель выдумывает

Модель оптимизирована продолжать текст правдоподобно, а не «знать правду». Если в её «памяти» нет точного факта, она всё равно сгенерирует наиболее вероятное продолжение — и оно может звучать убедительно, будучи ложным. Особенно опасны точные на вид детали: даты, цифры, цитаты, имена, ссылки.

Приём 1: заземление на контекст (grounding)

Дайте модели нужные факты в промпте и запретите выходить за них. Это основа RAG-систем.

Ответь на вопрос, используя ТОЛЬКО текст в блоке «Контекст».
Если ответа там нет — напиши «В контексте нет ответа».
Не используй сторонние знания.

Контекст:
"""
Гарантия на устройство — 24 месяца с даты покупки.
"""

Вопрос: Какая гарантия на устройство?

Заземление превращает задачу из «вспомни факт» (где модель фантазирует) в «найди ответ в данном тексте» (где ошибиться труднее).

Приём 2: разрешить «не знаю»

По умолчанию модель «не хочет» признавать незнание. Явно разрешите это — резко падает доля выдумок.

Если ты не уверен или данных недостаточно,
ответь «Не знаю» вместо предположения.

Приём 3: требовать опоры и проверяемость

Просите указывать, откуда взят каждый факт, или цитировать фрагмент контекста. Это и снижает выдумки, и даёт возможность проверить ответ.

После каждого утверждения в скобках цитируй
точный фрагмент контекста, на котором оно основано.
Если подтверждения нет — не пиши утверждение.

Чего ждать и не ждать

Приём	Что даёт
Заземление на контекст	Резко меньше выдумок по фактам из контекста
Разрешение «не знаю»	Меньше уверенной лжи
Цитаты/ссылки	Проверяемость, самоконтроль
Низкая температура	Меньше «креатива» в фактах

Важно: просьба «дай ссылки» без реального контекста не спасает — модель может выдумать и сами ссылки. Ссылки надёжны только когда есть проверяемый источник (заземление) или модель реально ходит в инструмент/поиск.

Итог

Галлюцинации — следствие того, что модель продолжает текст правдоподобно, а не знает истину.
Заземляйте ответ на данный контекст и запрещайте выходить за него.
Явно разрешайте «не знаю» — выдумок становится меньше.
Требуйте цитаты/опору для проверяемости; «дай ссылки» без источника не помогает.