По сообщениям, OpenAI разрабатывает DALL-E 3, обновленную версию своего генератора текста в изображение.
По словам ютубера MattVidPro AI, около 400 человек в настоящее время имеют доступ к частному тестовому серверу DALL-E 3, и уже было несколько утечек изображений его работы.
Видео, которым поделился ИИ MattVidPro, показывает, как продвигались тестовые версии DALL-E с мая по июль.
Эта эволюционировавшая версия DALL-E, похоже, способна генерировать фотореальные изображения и использовать особые техники, такие как мазки кистью или карандашный рисунок.
Невышедшая версия DALL-E также может генерировать изображения, на которых запечатлен призрак, кровь и контент, защищенный авторским правом, утверждает MattVidPro AI - он привел несколько примеров фотографий с батончиком Snickers и Subway.
Он также отлично справляется с созданием типографики - ахиллесовой пятой прошлых и нынешних моделей преобразования текста в изображение.
Ютубер описал инструмент как "чрезвычайно захватывающий. Он превосходит все, что мы видели раньше. Это безумие".
Он также заявил, что "Midjourney не может конкурировать на этом уровне. Я даже не думаю, что Midjourney шестой версии сможет конкурировать на этом уровне".
Комментаторы видеоролика отмечают плохую способность MidJourney следовать подсказкам, которую DALL-E 3 якобы решает.
Он продолжает: "Вы можете делать точные копии произведений искусства и материалов, защищенных авторским правом. Она идеально копирует персонажей, защищенных авторским правом, логотипы, абсолютно точные изображения знаменитостей и полные изображения экстремального насилия", и далее он говорит, что модель иногда создает неподобающие изображения, не будучи явно запрограммированной на это.
"Им явно предстоит доработать и обеспечить безопасность, - говорит Мэтт.
Сравнение с другими ИИ преобразования текста в изображение
Сравнение нового DALL-E с последней моделью Midjourney показало, что контент OpenAI превосходит его по качеству, а также по точности следования заданным подсказкам и качеству изображения.
Однако обновление DALL-E 3 все еще находится в разработке, и дата его официального релиза остается неопределенной. Конечно, этот ролик на YouTube создан для того, чтобы прорекламировать DALL-E 3, и публичная версия, скорее всего, будет сильно отличаться от всех "секретных" тестовых версий.
После выхода "ДАЛЛ-И 3", вероятно, будет иметь несколько ограничений, таких как отказ от изображений, связанных с кровью, кровотечением, содержанием, защищенным авторским правом, и воспроизведением произведений искусства.
Сможет ли "ДАЛЛ-И 3" вернуть OpenAI лидерство на рынке ИИ для создания изображений?