Качество и подбор примеров

Few-shot хорош ровно настолько, насколько хороши примеры; плохие примеры систематически портят ответы.

Подбор примеров — выбор показательных пар «вход → выход», которые покрывают разнообразие задачи и задают единый формат.

Что делает пример хорошим

Репрезентативность. Примеры похожи на реальные входы, а не на удобные искусственные случаи.
Разнообразие. Покрывают разные ситуации, а не три варианта одного и того же.
Граничные случаи. Включите трудный пример (ирония, смешанная тональность, пустое поле) — он учит модель краю.
Единый формат. Все примеры размечены идентично; любая мелкая разница «протекает» в ответ.
Корректность. Ошибка в примере воспроизводится моделью как «правило».

Баланс классов

Для классификации не давайте подряд примеры только одного класса — модель решит, что он самый частый, и будет смещаться к нему. Если классов три, дайте примеры всех трёх. Порядок тоже имеет значение: иногда модель тяготеет к классу последнего примера, поэтому стоит перемешивать.

// Плохо: перекос — три раза «спам», один раз «не спам».
// Модель начнёт чаще отвечать «спам».

// Хорошо: сбалансированно и вперемешку
Письмо: "Вы выиграли миллион, перейдите по ссылке"  -> спам
Письмо: "Напоминание о встрече в 15:00"             -> не спам
Письмо: "Скидка 90% только сегодня, кликай!"        -> спам
Письмо: "Отчёт за квартал во вложении"              -> не спам

Граничный пример учит модель краю

Если в задаче есть «ловушки», покажите их. Для тональности — отзыв с «но»: положительное и отрицательное в одном предложении. Без такого примера модель будет хвататься за первое попавшееся слово-маркер.

Отзыв: "Интерфейс красивый, но постоянно вылетает."
Тональность: отрицательная   // вывод важнее красоты UI

Один точный граничный пример часто полезнее пяти простых.

Частые ошибки подбора

Ошибка	Последствие
Все примеры одного класса	Смещение к этому классу
Разный формат у примеров	«Гуляющий» формат ответа
Ошибка в эталонном ответе	Модель копирует ошибку
Только лёгкие случаи	Провал на трудных входах
Примеры не похожи на прод	Хорошо в демо, плохо в бою

Итог

Примеры должны быть репрезентативными, разнообразными и единообразно размеченными.
Включайте граничные случаи — они учат модель краю задачи.
Балансируйте классы и перемешивайте порядок.
Любая ошибка в примере становится «правилом» для модели.