Компания Midjourney выпустила на своем сервере Discord альфа-версию V6 своей уже впечатляющей модели генерации изображений с помощью искусственного интеллекта.
V6 поставляется с рядом значительных улучшений, но самое большое обновление - Midjourney теперь может добавлять текст к изображениям. Добавление текста к изображениям с правильным написанием было проблемой для всех генераторов изображений AI. ДАЛЛ-И добавила эту функцию в свой последний релиз, и ожидание пользователями Midjourney подобной функциональности наконец-то закончилось.
Размещение текста, орфография и соответствие стилистическим подсказкам не 100%, но все равно очень хорошо.
Midjourney V6 .... У нас есть ТЕКСТ!
Она может быть то удачной, то неудачной, но я все еще изучаю, как она работает.
Все эти 4 человека принадлежали к одному поколению.
Возможно, вам повезло 🤷♂️
Подсказка на изображении 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcommunity #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489- Орктон (@OrctonAI) 21 декабря 2023 года
Уровень детализации и реалистичности генерируемых изображений также значительно повысился. Объявляя о выпуске V6, основатель Midjourney Дэвид Хольц сказал: "Эта модель может генерировать гораздо более реалистичные изображения, чем все, что мы выпускали раньше".
Некоторые из снимков, которыми поделилось сообщество пользователей Midjourney, выглядят потрясающе.
Midjourney V6 выглядит очень аппетитно!
Огромное увеличение детализации при том же разрешении.
Это НЕ окончательные изображения модели и не увеличенные.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC- GifCo (@giffboake) 20 декабря 2023 года
Как и в любом другом генераторе изображений, качество результата во многом зависит от творческого подхода пользователя. Поскольку V6 гораздо лучше следит за нюансами подсказок, конечные изображения лучше соответствуют идее, которую задумал создатель.
Крис Перна, который в течение 22 лет был арт-директором Epic Games, проверил Midjourney V6 на прочность и создал несколько действительно хороших изображений.
Посмотреть это сообщение на Instagram
Новые методы подсказки
Чтобы заставить предыдущие версии Midjourney выдать нужное изображение, приходилось прибегать к различным хитростям. Пользователи указывали модели камер, типы объективов, разрешение изображения и множество других фраз, чтобы получить нужный вид.
С появлением V6 ситуация сильно изменилась. "Подсказки в V6 значительно отличаются от V5. Вам придется "заново" учиться подсказывать. V6 гораздо более чувствительна к вашим подсказкам. Избегайте "мусора" вроде "награда, фотореалистичность, 4k, 8k"", - объясняет Хольц.
Хольц говорит, что пользователям придется более четко формулировать свои подсказки, и теперь V6 позволяет использовать более длинные и подробные подсказки, чтобы изображения более точно соответствовали видению пользователя.
В V6 также улучшена работа с ремиксами изображений и апскейлерами. Поскольку это альфа-версия, некоторые функции пока не поддерживаются. Панорамирование, масштабирование и изменение региона доступны в V5.2, но нам придется подождать некоторое время, пока они не будут добавлены в V6.
Удивительно видеть, как продвинулись генераторы изображений с искусственным интеллектом. Легко забыть, как мы радовались, когда они только появились, несмотря на то, что они генерировали довольно плохие изображения. Этот пост от Марко Недермейера - отличный пример того, как Midjourney улучшился с июля 2022 года.
В середине пути от v1 до v6, одна и та же подсказка".
Белый фон, портрет крупным планом очень старого злого мужчины, 92 года, морщины, реалистичная кожа, студийное освещение, canon f/4#midjourneyV6 #midjouney #aiartcommunity pic.twitter.com/g8wAALAbH3
- Марко Недермейер (@MNedermeijer) 21 декабря 2023 года
Выбирать между различными генераторами изображений AI становится все сложнее, поскольку их возможности сближаются. Пользователи Midjourney в большинстве своем застряли на интерфейсе Discord, хотя пользователям, сгенерировавшим более 10 000 изображений, предлагается доступ к веб-платформе.
Большое преимущество Midjourney перед другими вариантами, такими как DALL-E, заключается в том, что он позволяет генерировать изображения реальных людей. Это, вероятно, делает его лучшим инструментом для тех, кто пытается создать пародийный контент или дезинформация.
Что ждет Midjourney дальше? В последнее время в сети появилось несколько хороших аниматоров изображений или инструментов для преобразования текста в видео. Возможно, в следующем выпуске Midjourney позволит нам добавлять движение в наши изображения.