«Слишком просто» — Midjourney тестирует впечатляющую новую версию своего генератора изображений с искусственным интеллектом.

Увеличить / Восемь изображений, которые мы создали с помощью альфа-версии Midjourney v4. Арс-Техника
В субботу сервис изображений AI Midjourney начал тестировать альфа-4 («v4») версию своей сводной модели преобразования текста в изображение, которая доступна подписчикам на его сервере Discord. Новая модель предоставляет больше деталей, чем ранее было доступно в сервисе, что вдохновило некоторых специалистов по искусственному интеллекту на замечание о том, что в версии 4 почти "слишком легко" получать высококачественные результаты с помощью простых подсказок.

Midjourney был открыт для публики в марте в рамках первой волны моделей синтеза изображений с помощью ИИ. Он быстро приобрел большое количество поклонников благодаря своему особому стилю и доступности для аудитории до DALL-E и Stable Diffusion. За короткое время работы, созданные Midjourney, попали в заголовки газет, выиграв художественные конкурсы, предоставив материалы для потенциально исторических записей, защищенных авторским правом, и появившись на веб-сайтах с иллюстрациями (позже запрещенными).

Со временем Midjourney совершенствовала свою модель, добавляя больше обучения, новые функции и детали. Текущая модель по умолчанию, известная как «v3», дебютировала в августе. Сейчас Midjourney v4 тестируется тысячами участников сервера Discord сервиса, которые создают изображения с помощью бота Midjourney. В настоящее время пользователи могут попробовать v4, добавив "--v 4" в свои приглашения.

«V4 — это совершенно новая кодовая база и совершенно новая архитектура искусственного интеллекта», — написал основатель Midjourney Дэвид Хольц в объявлении Discord. "Это наша первая модель, обученная на новом сверхкластере искусственного интеллекта Midjourney, и мы работали над ней более 9 месяцев".

Увеличить / Сравнение вывода Midjourney v3 (слева) и v4 (справа) с подсказкой «мускулистый варвар с оружием рядом с ЭЛТ-телевизором, кинематографический, 8K, студийное освещение». Арс-Техника
При тестировании модели Midjourney v4 мы обнаружили, что она обеспечивает гораздо большее количество деталей, чем v3, лучшее понимание подсказок, лучшую композицию сцен и иногда лучшую пропорциональность в своих объектах. При поиске фотореалистичных изображений некоторые результаты, которые мы видели, могут быть трудно отличимы от реальных фотографий с более низким разрешением.

По словам Хольца, другие функции v4 включают:

- Гораздо больше знаний (о существах, локациях и т. д.) - Гораздо лучше улавливаются мелкие детали (во всех ситуациях) - Обрабатывает более сложные подсказки (с несколькими уровнями детализации) - Лучше с многообъектными/многосимвольными сценами

Технологии Nov 10, 2022 0 17 Add to Reading List

«Слишком просто» — Midjourney тестирует впечатляющую новую версию своего генератора изображений с искусственным интеллектом.

Восемь изображений, которые мы создано с помощью альфа-версии Midjourney v4.

В субботу сервис изображений AI Midjourney начал тестировать альфа-4 («v4») версию своей сводной модели преобразования текста в изображение, которая доступна подписчикам на его сервере Discord. Новая модель предоставляет больше деталей, чем ранее было доступно в сервисе, что вдохновило некоторых специалистов по искусственному интеллекту на замечание о том, что в версии 4 почти "слишком легко" получать высококачественные результаты с помощью простых подсказок.

Midjourney был открыт для публики в марте в рамках первой волны моделей синтеза изображений с помощью ИИ. Он быстро приобрел большое количество поклонников благодаря своему особому стилю и доступности для аудитории до DALL-E и Stable Diffusion. За короткое время работы, созданные Midjourney, попали в заголовки газет, выиграв художественные конкурсы, предоставив материалы для потенциально исторических записей, защищенных авторским правом, и появившись на веб-сайтах с иллюстрациями (позже запрещенными).

Со временем Midjourney совершенствовала свою модель, добавляя больше обучения, новые функции и детали. Текущая модель по умолчанию, известная как «v3», дебютировала в августе. Сейчас Midjourney v4 тестируется тысячами участников сервера Discord сервиса, которые создают изображения с помощью бота Midjourney. В настоящее время пользователи могут попробовать v4, добавив "--v 4" в свои приглашения.

«V4 — это совершенно новая кодовая база и совершенно новая архитектура искусственного интеллекта», — написал основатель Midjourney Дэвид Хольц в объявлении Discord. "Это наша первая модель, обученная на новом сверхкластере искусственного интеллекта Midjourney, и мы работали над ней более 9 месяцев".

Сравнение результатов Midjourney v3 (слева) и v4 (справа) с подсказкой

При тестировании модели Midjourney v4 мы обнаружили, что она обеспечивает гораздо большее количество деталей, чем v3, лучшее понимание подсказок, лучшую композицию сцен и иногда лучшую пропорциональность в своих объектах. При поиске фотореалистичных изображений некоторые результаты, которые мы видели, могут быть трудно отличимы от реальных фотографий с более низким разрешением.

По словам Хольца, другие функции v4 включают:

- Гораздо больше знаний (о существах, локациях и т. д.) - Гораздо лучше улавливаются мелкие детали (во всех ситуациях) - Обрабатывает более сложные подсказки (с несколькими уровнями детализации) - Лучше с многообъектными/многосимвольными сценами