DALL-E — это искусственный интеллект, разработанный OpenAI, способный автоматически генерировать изображения из текстов . Она прошла обучение на 12 миллиардах изображений и научилась связывать их с ключевыми словами. Технология, лежащая в основе Dall-E, весьма впечатляет, но есть еще несколько недостатков, которые следует учитывать, хотя многие из них были улучшены с появлением DALL-E 2. Вот посмотрите, на что способен этот ИИ следующего поколения.
DALL-E 2: что это такое?
DALL-E 2 — это новый искусственный интеллект, разработанный OpenAI, исследовательской компанией искусственного интеллекта, основанной выпускниками Google Brain, SpaceX и Tesla. Он был создан с целью создания изображений из описаний, написанных людьми. .
В январе 2021 года OpenAI представила DALL-E. Год спустя, в 2022 году, была представлена новейшая система DALL-E 2, которая теперь генерирует еще более реалистичные и точные изображения с разрешением, в четыре раза превышающим разрешение, создаваемое С-Е 1 .
Какова цель OpenAI с DALL-E?
Хотя OpenAI теперь является коммерческой компанией, компания поделилась на своем веб-сайте целью проекта:
«Мы надеемся, что DALL-E 2 позволит людям творчески проявить себя. DALL-E 2 также помогает нам понять, как передовые системы ИИ видят и понимают наш мир, что необходимо для нашей миссии по созданию ИИ на службе человечества. »
Как работает искусственный интеллект DALL-E?
DALL-E 2 изучил взаимосвязь между изображениями и текстом, используемым для их описания. ИИ использует процесс, называемый «рассеиванием», который начинается с набора случайных точек и постепенно меняет этот рисунок на изображение по мере того, как он распознает определенные аспекты этого изображения.
На что действительно способен DALL-E 2?
DALL-E 2 может создавать оригинальные и реалистичные изображения и иллюстрации из текстового описания. . Он может сочетать концепции, атрибуты и стили.
DALL-E 2 способен генерировать изображения любого типа:
- картины, похожие на картины,
- фотографии с людьми, которых не существует,
- поддельные пейзажные изображения,
- изображения, выполненные в стиле комиксов,
- поддельные логотипы,
- 3D-представления фиктивных элементов,
- …
Помимо создания изображений, DALL-E также может:
- вносить реалистичные изменения в существующие изображения из подписи на естественном языке,
- добавлять или удалять элементы из изображения с учетом теней, отражений и текстур.
- генерировать варианты исходного изображения на основе оригинала.
DALL-E 1 против DALL-E 2: какие конкретные отличия?
Компания OpenAI провела исследование для оценки производительности DALL-E 2 по сравнению с его более старой версией DALL-E 1.
В целом, DALL-E 2 предпочтительнее DALL-E 1 из-за соответствия изображений, сгенерированных первоначальным запросам.
Фотореализм также считается лучшим рецензентами, которым предлагается сравнить 1000 поколений изображений каждой модели.
Что касается производительности, изображения, генерируемые DALL-E 2, имеют разрешение в 4 раза выше, чем изображения, генерируемые DALL-E 1.
Как посмотреть примеры изображений, созданных искусственным интеллектом DALL-E?
Лучший способ увидеть примеры визуальных эффектов, созданных искусственным интеллектом благодаря DALL-E, — это подпишитесь на их аккаунт в Instagram @openaidalle на котором они делятся своими самыми красивыми поколениями:
Как протестировать DALL-E 2? Какова будет цена?
Для тестирования DALL-E 2 больше нет очереди. ИИ теперь доступен для всех, все, что вам нужно сделать, это создать учетную запись на сайте, чтобы иметь возможность протестировать его бесплатно.
В бета-версии каждый пользователь, создавший учетную запись, получает пакет из 50 бесплатных кредитов для использования в течение первого месяца использования .
Бесплатная учетная запись предлагает 15 кредитов в месяц. .
Каждый кредит будет генерировать 4 варианта изображений из одной и той же подсказки или 3 варианта изображений в случае запроса на изменение или создание варианта.
Во время этой бета-фазы будет предложена система кредитов для покупки. Гостевые пользователи смогут заказать 115 дополнительных кредитов за 15 долларов. 115 кредитов создадут в общей сложности 460 изображений с ИИ (115 поколений или вариаций).
Являются ли изображения, созданные DALL-E, бесплатными?
Хотя DALL-E нельзя сравнивать с бесплатными сайтами изображений, пользователи ИИ будут иметь полные права на использование изображений, которые они создают. Таким образом, они смогут использовать изображения в коммерческих целях (информационные бюллетени, иллюстрации к статьям, графические монтажи, видеомонтажи, обложки книг, раскадровки, фильмы и т. д.) или продавать их напрямую.
Каковы ограничения DALL-E?
DALL-E был обучен генерировать изображения из текста или изображений, но у него есть ограничения. Она может только генерировать образы того, что уже видела, и не может интерпретировать значение и контекст слов.
По понятным причинам, OpenAI также ограничил способность DALL-E 2 создавать изображения насилия, ненависти или изображения для взрослых. . Удалив наиболее явный контент из обучающих данных, OpenAI свел к минимуму воздействие этих концепций на DALL-E 2. Компания также использовала передовые методы для предотвращения создания фотореалистичных лиц реальных людей, в том числе общественных деятелей.
Политика в отношении контента OpenAI также не позволяет пользователям создавать насильственный, взрослый или политический контент среди других категорий. OpenAi оставляет за собой право блокировать создание изображений, если установленные фильтры выявляют текстовые подсказки и загрузки изображений, которые могут нарушать их политику. Для предотвращения злоупотреблений также были предоставлены автоматизированные системы и системы наблюдения за людьми.