Как создать идеальное изображение при помощи ИИ
Многие до сих пор относятся к нейросетям скептически. Кто-то вспоминает ранние попытки ИИ рисовать руки с шестью пальцами, а кто-то считает, что алгоритмы пока «слишком глупы», чтобы понять задумку автора.
Но нейросеть — это всего лишь инструмент. А любым инструментом нужно уметь пользоваться. Давайте на примере Telegram-бота @NeuralImage_Bot разберем, как получать именно те изображения, которые вы рисуете в своем воображении.
Попытка №1: Стандартный запрос

Если мы отправим боту короткую фразу: «Человек гладит кота», то получим вполне стандартный результат.
Выглядит неплохо, но это ли вы хотели увидеть? Скорее всего, нет. Проблема в том, что параметры заданы слишком обобщенно, и нейросеть «додумала» всё остальное за вас.
Попытка №2: Осознанный промпт
Давайте усложним задачу и добавим конкретики:
«Мужчина средних лет, черные волосы, с легкой щетиной, карие глаза, сидит на сером диване в гостиной, обставленной викторианской мебелью. Мужчина одет в строгий черный костюм-тройку с черным галстуком и белой рубашкой. Рядом с ним лежит пушистый черно-белый кот породы мейн-кун. Мужчина гладит кота».

Теперь результат либо идеально совпадает с задумкой, либо максимально к ней близок. Почему так вышло?
В генерации изображений (как и видео) работает правило: чем точнее ТЗ, тем лучше результат. Чтобы добиться успеха, следуйте пяти главным принципам:
- Объект. Это центр композиции. Чем детальнее описание, тем лучше. Вместо абстрактного «человек» мы описали возраст, внешность и одежду. Мы также конкретизировали второго персонажа: не просто «кот», а «пушистый черно-белый мейн-кун».
- Локация. Место действия создает контекст. В первом случае фон был случайным, во втором мы задали атмосферу викторианской гостиной и даже цвет дивана.
- Действие. Здесь мы оставили всё как было: взаимодействие героев (мужчина гладит кота).
- Стиль. Самый мощный рычаг. По умолчанию бот выдает реализм. Но что, если добавить в запрос «в стиле аниме»? Одно уточнение — и картинка кардинально меняется.

- Настроение. Вы можете управлять эмоциями кадра. Добавьте «мрачное освещение» или «солнечное, веселое настроение», и восприятие изображения станет совсем другим.

Итог
Всё ограничивается лишь вашей фантазией. Чем больше деталей вы дадите нейросети, тем точнее она вас поймет. И тем лучше будет результат генерации.
А в следующей статье мы пойдем еще дальше и оживим наше изображение при помощи бота @NeuralVideo_Bot.