Few-shot для классификации и извлечения

Классификация и извлечение — задачи, где few-shot раскрывается полностью: примеры фиксируют и метки, и формат, и поведение на краю.

Извлечение (extraction) — выделение из текста структурированных сущностей (имена, даты, суммы, поля), обычно в строгий формат.

Классификация с фиксированными метками

Главная ловушка классификации — «свободные» метки: модель придумывает новые названия классов. Лекарство — закрытый список меток плюс примеры на каждый.

Классифицируй тикет в один из классов:
[баг, фича, вопрос, другое]. Отвечай ровно одним классом.

Тикет: "Кнопка оплаты не работает на iPhone"  -> баг
Тикет: "Хочу тёмную тему"                       -> фича
Тикет: "Как сменить пароль?"                    -> вопрос
Тикет: "Спасибо за сервис!"                     -> другое

Тикет: "Приложение вылетает при входе"          ->

Закрытый список + по примеру на класс почти гарантируют метку из множества и снимают разнобой формулировок.

Извлечение сущностей

Для извлечения примеры показывают и какие поля доставать, и что делать с отсутствующими. Единая разметка критична — иначе формат «поплывёт».

Извлеки поля: контрагент, сумма, дата. Формат — JSON.
Нет данных -> null.

Текст: "Оплата ООО Ромашка, 12000 руб, 5 мая"
-> {"контрагент": "ООО Ромашка", "сумма": 12000, "дата": "5 мая"}

Текст: "Перевод от Иванова"
-> {"контрагент": "Иванов", "сумма": null, "дата": null}

Текст: "Возврат 3500 рублей 1 июня"
->

Второй пример (с отсутствующими полями) важен: он учит модель ставить null, а не выдумывать сумму и дату.

Чек-лист few-shot для этих задач

Приём	Зачем
Закрытый список меток	Не плодить лишние классы
По примеру на каждый класс	Баланс и охват
Пример с пустыми полями	Учит ставить null, а не выдумывать
Единая разметка во всех примерах	Стабильный формат
Граничный/каверзный пример	Поведение на сложных входах

Связка с предыдущим

Эти задачи объединяют почти всё из курса: роль (опционально), few-shot, строгий формат вывода, обработку краевых случаев и проверяемость (метка из множества легко валидируется в коде). Именно так промптинг превращается в надёжный компонент системы.

Итог

Для классификации задавайте закрытый список меток и по примеру на класс.
Для извлечения показывайте поля и обязательно пример с пустыми значениями.
Держите единую разметку во всех примерах — иначе формат «поплывёт».
Эти задачи легко делать проверяемыми: метка из множества валидируется кодом.