Несколько недель назад компания OpenAI показала нам "DALL-E 3", а теперь любой желающий может бесплатно воспользоваться генератором изображений ИИ на сайте Bing от Microsoft.
В первом пресс-релизе, OpenAI заявила, что "ДАЛЛ-И 3 будет интегрирована в платную версию ChatGPT. Демонстрационное видео, показывающее, как это будет работать, было впечатляющим, но пользователи ChatGPT все еще ждут своей очереди.
Похоже, что компания Microsoft уже в очереди: впечатляющий генератор изображений теперь свободно доступен для пользователей Чат Bing или его Создатель изображений платформы.
Microsoft также выпускает свой инструмент Paint Cocreator на базе DALLE-3, который является творческим помощником в приложении Paint.
Как только был сделан анонс, серверы Microsoft были быстро перегружены количеством пользователей, желающих опробовать новую версию DALL-E. Генеральный директор по рекламе и веб-сервисам Microsoft Михаил Парахин написал в Твиттере: "Мы ожидали сильного интереса, но не ожидали такого большого".
Друзья, мы знаем, что создание DALL-E 3.0 сейчас занимает больше времени, чем обычно. Мы ожидали сильного интереса, но не ожидали такого количества, особенно учитывая, что это выходные. Если мы добавим больше графических процессоров, то скоро ситуация улучшится.
- Михаил Парахин (@MParakhin) 1 октября 2023 года
Обещанные дополнительные серверы, должно быть, подействовали, потому что, когда я попробовал, изображения были сгенерированы довольно быстро.
Microsoft подтвердила заявления OpenAI о том, что DALL-E 3 стал прорывом в создании текста в изображение. Модернизированный инструмент обещает более точное следование подсказкам, большую согласованность, улучшенную фотореалистичность и эстетику.
Ранее OpenAI уже намекала на то, что цифровой водяной знак находится в разработке, и сообщение в блоге Microsoft подтвердило, что он добавляет невидимый цифровой водяной знак, который соответствует спецификации C2PA. Будет интересно посмотреть, будет ли это водяной знак может быть нарушен, как и все остальные..
В DALL-E 3 встроена строгая модерация контента, поэтому вы не сможете создать ни одного NSFW-изображения.
Изображения, которые мне удалось сгенерировать, выглядели довольно неплохо, хотя и не вполне соответствовали моим ожиданиям фотореализма.
Задача: мальчик и девочка плещутся в лужах после дождя, фотореалистично
Одной из действительно впечатляющих особенностей DALLE-3 является то, насколько хорошо он справляется с генерацией текста, что является общей проблемой для генераторов изображений искусственного интеллекта.
Задача: снимок старика, читающего "Тома Сойера" через плечо
Изображения создаются в разрешении 1024×1024, что отлично подходит для использования в Интернете. Надеюсь, они добавят возможность изменять соотношение сторон, потому что сейчас вы застряли на 1:1. Также было бы здорово добавить опцию outpaint и upscaling.
На данный момент это один из лучших генераторов изображений AI, и, что самое приятное, он совершенно бесплатен.