Структура промпта, веса и стили

Урок даёт практический каркас промпта: из каких частей он состоит и как расставлять акценты.

Промпт — текстовое описание желаемой картинки; его структура и порядок слов сильно влияют на результат.

Каркас хорошего промпта

Удобно строить промпт по блокам: субъект (что/кто) → детали (какой, во что одет, что делает) → окружение (где, фон) → стиль (фотография, акварель, 3D) → качество/освещение (мягкий свет, высокая детализация). Не обязательно заполнять все блоки, но такой порядок помогает не забыть важное.

[субъект], [детали], [окружение], [стиль], [свет/качество]

пример:
рыжий кот, в очках, сидит на стопке книг,
уютная библиотека на фоне, цифровая иллюстрация,
мягкий тёплый свет, высокая детализация

Порядок и веса

Слова в начале промпта обычно влияют сильнее (вспомните лимит токенов CLIP). Многие интерфейсы позволяют задавать веса акцентов — синтаксис вроде (закат:1.3) усиливает влияние слова, а (туман:0.7) ослабляет. Это удобнее, чем десять раз повторять слово.

# синтаксис весов (Automatic1111-стиль):
(красный плащ:1.4)   # усилить
(фон:0.6)            # ослабить
((важно))            # двойные скобки тоже усиливают

Указание стиля

Стиль — мощный рычаг. «фотореализм», «акварель», «пиксель-арт», «в стиле гравюры» радикально меняют картинку при том же субъекте. Можно ссылаться на технику или эпоху, а не только на конкретных авторов — об этичных границах такого использования поговорим в разделе про право.

Как работает под капотом

Веса буквально масштабируют вклад соответствующих токенов в текстовом эмбеддинге: усиленный токен сильнее «притягивает» расшумление через cross-attention. Поэтому слишком большие веса (например, 1.8) ломают композицию — модель перетягивает картинку к одному понятию в ущерб остальным. Хорошая практика — держать веса в коридоре примерно 0.7–1.4 и менять по чуть-чуть.

Частые ошибки

  • Каша из десятков слов без структуры. Модель «размазывает» внимание; лучше короткий, но осмысленный промпт.
  • Огромные веса. (слово:1.9) чаще портит картинку, чем помогает.
  • Противоречивые требования. «минимализм, очень детализированно» — модель запутается; убирайте конфликты.

Итеративная доводка промпта

Хороший промпт почти никогда не пишется с первого раза. Рабочий цикл такой: написали базовый промпт по каркасу, сгенерировали несколько вариантов с разными seed, посмотрели, чего не хватает, добавили или усилили нужные слова, повторили. Меняйте по одному элементу за итерацию, иначе непонятно, что именно дало эффект. Зафиксированный seed здесь незаменим: он позволяет менять только промпт, наблюдая чистое влияние правки.

Полезно держать «библиотеку» удачных формулировок: какие слова надёжно дают нужный свет, какие — нужную фактуру, какие стили хорошо сочетаются. Со временем у вас сложится личный словарь приёмов. Это и есть промпт-инжиниринг: не магические заклинания, а накопленный через эксперименты навык точно описывать желаемое на «языке», который модель понимает.

Итог

  • Стройте промпт по блокам: субъект → детали → окружение → стиль → свет/качество.
  • Начало промпта весомее; веса (слово:1.3) точечно усиливают или ослабляют акценты.
  • Избегайте каши, гигантских весов и взаимоисключающих требований.
Проверьте себя
1. Какой порядок блоков промпта удобен как каркас?
AКачество → стиль → субъект
BСубъект → детали → окружение → стиль → свет/качество
CСлучайный набор слов
DТолько название стиля
2. Что обычно происходит при слишком большом весе токена, например (слово:1.9)?
AКартинка становится идеальной
BМодель перетягивает результат к одному понятию и ломает композицию
CГенерация ускоряется
DВес игнорируется без последствий