Генерация изображений с помощью ИИ
Чтобы нейросеть создала нужную картинку, которая бы понравилась и подошла, важно правильно написать для работы промт. Общие принципы одинаковы в любых нейросетях. Изучим, как правильно составить запрос для генерации изображений в нейросетях, чтобы искусственный интеллект вас понял корректно.
Составляем несложный запрос
Даже несколько слов в промте способны привести к хорошему результату. Однако при отсутствии уточнений в нем нейросеть заполнит пробелы самостоятельно, что может привести к неожиданным результатам.
Для достижения цели важно сначала создать простой и понятный запрос, а затем добавить уточнения.
Основные принципы составления промтов
Учитывайте язык нейросети - каждая нейросеть лучше воспринимает промты на своём «родном» языке. Например, Midjourney оптимально работает с запросами на английском, а Kandinsky, разработанная Сбером, – на русском.
Выбор объекта – объект является центральным элементом любого изображения. Нейросети обучаются на обширных наборах данных, но, если указать только один объект, то результат может быть предсказуемым. Для разнообразия можно комбинировать понятия, например, «женщина-кошка» или «город будущего».
Если нужно изобразить несколько объектов, то обязательно уточните их количество. Вместо «люди на улице» напишите «пять человек на улице». Без конкретики нейросеть сама определит их число, что может привести к нежелательным результатам. Однако важно помнить, что чем больше объектов вы указываете, тем сложнее нейросети их отобразить с высокой детализацией.
Абстракции - нейросети способны визуализировать абстракции, такие как «радость» или «мечта». Но лучше избегать сложных концепций, которые требуют глубокого анализа. Замените абстрактные термины конкретными визуальными образами. Например, вместо «любовь» можно указать «пара, держащаяся за руки».
Что не надо использовать в промтах
- Отрицания - слова «не», «без», «кроме» и подобные конструкции могут запутать нейросеть. Например, запрос «человек без очков» может быть интерпретирован как человек в очках. Более эффективным будет заменить отрицание описанием, например, «человек с чистым лицом».
- Излишняя детализация - не стоит указывать слишком много объектов или детализировать каждый из них. Например, запрос «три собаки разных пород в лесу, каждая с различными аксессуарами», скорее всего, приведёт к ошибкам в изображении. Лучше сократить запрос до более общего: «три собаки в лесу».
- Попытки получить точные копии реальных объектов - нейросети не способны создать точную копию известных городов, зданий или людей. Например, запрос «Москва» приведёт к созданию образа, который лишь частично напоминает столицу, но не будет идентичен ей.
- Использование архетипов - для упрощения задачи нейросети предпочтительно использовать архетипы. Например, вместо «человек, управляющий машиной скорой помощи» лучше написать «водитель скорой помощи». Вместо «человек в белом халате с медицинскими инструментами» лучше использовать «врач».
- Сложные пространственные отношения – нейросети могут ошибаться в интерпретации сложных пространственных конструкций. Например, запрос «человек стоит на мосту, а под ним плывёт лодка, а ещё дальше – город» может привести к неверному расположению объектов. Лучше указывать объекты в порядке важности и избегать запутанных описаний, например, «человек стоит на мосту, внизу река с лодкой, на фоне город».
- Неоднозначные прилагательные и абстрактные понятия – слова вроде «красивый», «странный», «необычный» могут быть интерпретированы по-разному и дать неожиданный результат. Вместо этого лучше использовать конкретные характеристики: «дом с витражными окнами» вместо «красивый дом», «пейзаж с туманом и лунным светом» вместо «загадочный пейзаж».
- Длинные и сложные предложения – чем длиннее и сложнее промт, тем выше вероятность, что нейросеть неправильно распределит элементы изображения. Лучше разбивать запрос на несколько простых фраз, например, вместо «мужчина в чёрном костюме сидит на кожаном диване в классическом интерьере с камином» – «мужчина в чёрном костюме сидит на кожаном диване. В комнате классический интерьер, есть камин».
- Редкие или вымышленные термины – нейросети плохо распознают редкие слова, термины или вымышленные названия, особенно если они не широко представлены в обучающих данных. Например, вместо «автомобиль будущего из 3025 года» лучше написать «футуристический автомобиль с аэродинамическим дизайном».
- Перечисление множества мелких деталей – слишком подробные запросы могут привести к тому, что некоторые элементы будут упущены или смешаны. Например, запрос «человек в красной рубашке, с синими джинсами, зелёными кроссовками, чёрной сумкой и часами» может дать неожиданный результат. Лучше сократить его до «человек в яркой одежде с сумкой и часами».
- Запросы на стилизацию под конкретных современных художников или бренды – большинство нейросетей фильтруют подобные запросы из-за авторских прав. Например, вместо «в стиле Disney» лучше использовать «мультяшный стиль с мягкими линиями и яркими цветами», а вместо «как у Gucci» – «роскошный дизайн с золотыми элементами и узорами».
Запрос для генерации картинки
Детализируем объект
Четко указывайте расположение объектов
Опишите, что должно быть в центре изображения, а что – на заднем плане. Для уточнения деталей используйте существительные, прилагательные и глаголы. Вместо «маг» напишите: «грустный маг в колпаке вечером работает за компьютером в офисе». Не забывайте, что у большинства нейросетей есть ограничение на длину запроса.
Добавляйте действие
Формулируйте действия так, чтобы их легко можно было изобразить. Используйте глаголы вроде «идет», «сидит», «стоит». Например, вместо «мечтает» лучше написать: «сидит и смотрит в небо».
Определяйте цвета и палитру
Укажите базовые цвета или выберите художественную палитру:
- базовые: синий, красный, зеленый и т. д.;
- художественные: черно-белая гамма, неон, сепия;
- цветовые палитры: пастельные тона, радужные, цвета Pantone;
- duotone: минималистичные двухцветные изображения;
- например, можно задать, что платье должно быть красным, а фон – пастельным.
Используйте прилагательные для передачи настроения
Прилагательные помогают передать атмосферу сцены. Например, «мрачно», «темно», «плохо освещено» создадут ощущение хоррора. Для усиления эффекта не используйте слово «очень». Лучше заменять его синонимами: вместо «очень красивый» – «прекрасный».
Опишите технические параметры изображения
Если хотите конкретный стиль или эффект, укажите тип камеры, объектив, фокусное расстояние, выдержку.
Держите баланс деталей
Старайтесь быть детализированными, но не перегружайте запрос. Слишком сложное описание может привести к неудачному результату.
Пишите запрос кратко и структурировано
Составляйте запрос списком и избегайте избыточной информации.
ВАЖНО: Конкретизация деталей и баланс между лаконичностью и содержательностью помогут получить желаемый результат.
Задаем стилистику
Визуализация с помощью нейросети позволяет работать с тысячами различных стилистик. Например, можно создать изображение кошки-геймера в стиле готики, нуара, манги, фэнтези, сюрреализма, пиксель-арта или других художественных направлений.
Правильная настройка стиля помогает получить более точный и интересный результат.
Экспериментируйте с сочетанием стилей
Для создания уникального изображения можно комбинировать два стиля. Например, сочетать пиксель-арт с киберпанком. Важно помнить, что объединение противоположных или взаимоисключающих стилей может привести к смешанному результату: нейросеть выберет один из указанных стилей или создаст неудачную интерпретацию.
Используйте конкретные примеры
Для достижения желаемого эффекта указывайте примеры. Это могут быть:
- имена известных классических художников (например, Ван Гог, Моне);
- современные иллюстраторы, авторы комиксов, дизайнеры или фотографы;
- названия студий, игр, фильмов или проектов с характерной визуальной эстетикой.
Примеры помогают нейросети лучше понять, какой стиль изображения вам нужен.
Уточняйте форму искусства
Укажите в запросе, какой именно формат изображения требуется. Например:
- иллюстрация;
- постер;
- фотография;
- татуировка;
- скульптура;
- оригами;
- чертеж;
- трехмерная модель;
- вышивка;
- мозаика;
- кофе-арт;
- набор из деталей конструктора.
Такая конкретизация помогает нейросети точнее определить способ визуализации.
Определение стилистики текста
Собираем правильный запрос
При создании запроса для нейросети важно соблюдать определенный порядок.
Расположение параметров влияет на итоговый результат, так как слова в начале промта имеют больший вес, чем в конце.
Оптимальная структура запроса
- Укажите, какой формат требуется: фото, иллюстрация, кадр из фильма, картинка-референс и т.д.
- Опишите главный элемент изображения, который будет находиться в центре внимания.
- Добавьте описание действий и характеристик объекта. Например, его позу, одежду, эмоции.
- Уточните цветовую палитру, эстетику, стиль или укажите автора, чья работа вдохновляет.
- Укажите такие детали, как освещение, время суток, погода, графические эффекты.
- Добавьте технические параметры: пропорции, разрешение, уровень стилизации, уровень хаотичности.
- Разделяйте элементы запроса с помощью двойных двоеточий (::) или запятых. Чем точнее запрос, тем выше вероятность получить нужный результат.
- Используйте прилагательные, чтобы детально описать объект.
- Формируйте запросы, соблюдая следующую структуру: кто, как, где, стиль изображения. Такой подход делает запросы понятными и логичными для нейросети.
Как избегать ошибок
- Чёткое описание поз и взаимодействий - нейросеть может неправильно интерпретировать пространственные отношения между объектами, поэтому важно описывать позы и действия максимально понятно. Например, запрос «руководитель смотрит через плечо подчиненной» может привести к тому, что нейросеть просто изобразит двух людей рядом, не указывая направление взгляда. Чтобы избежать недоразумений, лучше использовать уточняющие формулировки: «руководитель стоит позади подчинённой и смотрит через её плечо, пока она печатает на клавиатуре».
- Использование ключевых слов и уточняющих деталей - если изображение не соответствует ожиданиям, попробуйте переформулировать запрос, добавляя или убирая слова. Например, вместо «мальчик держит воздушный шарик» попробуйте «мальчик держит в руке красный воздушный шарик, который слегка колеблется на ветру».
- Правильный порядок слов - порядок слов в запросе имеет значение. Например, запрос «чёрный кот и белая собака» может привести к неожиданным результатам, поскольку нейросеть может неправильно распределить цвета. Лучше уточнять: «чёрный пушистый кот сидит рядом с белой собакой».
- Избегайте лишней детализации - если запрос содержит слишком много деталей, нейросеть может пропустить часть информации или перепутать элементы. Например, запрос «три собаки разных пород, одна с ошейником, другая с шарфом, третья без аксессуаров, на фоне леса и гор» может привести к несоответствующему изображению. В таких случаях лучше упростить описание: «три собаки разных пород сидят на лесной поляне, две из них носят аксессуары».
Заключение
Создание качественного изображения с помощью нейросети требует точности и продуманности в формулировке запросов. Учитывайте особенности нейросети, избегайте сложных конструкций и отрицаний, а также используйте архетипы для передачи вашей идеи.
Следуя этим рекомендациям, вы сможете получить изображения, которые максимально соответствуют вашим ожиданиям.
Конкретизируйте объекты, добавляйте детали, цветовые схемы, настроение, но избегайте перегрузки нейросети избыточными описаниями. Придерживайтесь баланса между детализацией и лаконичностью.
Работа со стилями и формами искусства открывает огромные возможности для творчества. Правильно задавая параметры стиля, комбинируя направления и уточняя детали, можно создавать уникальные изображения.
Домашняя работа
Изучите материал. Составьте промт и с помощью нейросети создайте любую картинку.