«Слишком просто» — Midjourney тестирует впечатляющую новую версию своего генератора изображений с искусственным интеллектом.
В субботу сервис изображений AI Midjourney начал тестировать альфа-4 («v4») версию своей сводной модели преобразования текста в изображение, которая доступна подписчикам на его сервере Discord. Новая модель предоставляет больше деталей, чем ранее было доступно в сервисе, что вдохновило некоторых специалистов по искусственному интеллекту на замечание о том, что в версии 4 почти "слишком легко" получать высококачественные результаты с помощью простых подсказок.
Midjourney был открыт для публики в марте в рамках первой волны моделей синтеза изображений с помощью ИИ. Он быстро приобрел большое количество поклонников благодаря своему особому стилю и доступности для аудитории до DALL-E и Stable Diffusion. За короткое время работы, созданные Midjourney, попали в заголовки газет, выиграв художественные конкурсы, предоставив материалы для потенциально исторических записей, защищенных авторским правом, и появившись на веб-сайтах с иллюстрациями (позже запрещенными).
Со временем Midjourney совершенствовала свою модель, добавляя больше обучения, новые функции и детали. Текущая модель по умолчанию, известная как «v3», дебютировала в августе. Сейчас Midjourney v4 тестируется тысячами участников сервера Discord сервиса, которые создают изображения с помощью бота Midjourney. В настоящее время пользователи могут попробовать v4, добавив "--v 4" в свои приглашения.
«V4 — это совершенно новая кодовая база и совершенно новая архитектура искусственного интеллекта», — написал основатель Midjourney Дэвид Хольц в объявлении Discord. "Это наша первая модель, обученная на новом сверхкластере искусственного интеллекта Midjourney, и мы работали над ней более 9 месяцев".
При тестировании модели Midjourney v4 мы обнаружили, что она обеспечивает гораздо большее количество деталей, чем v3, лучшее понимание подсказок, лучшую композицию сцен и иногда лучшую пропорциональность в своих объектах. При поиске фотореалистичных изображений некоторые результаты, которые мы видели, могут быть трудно отличимы от реальных фотографий с более низким разрешением.
По словам Хольца, другие функции v4 включают:
- Гораздо больше знаний (о существах, локациях и т. д.) - Гораздо лучше улавливаются мелкие детали (во всех ситуациях) - Обрабатывает более сложные подсказки (с несколькими уровнями детализации) - Лучше с многообъектными/многосимвольными сценами
В субботу сервис изображений AI Midjourney начал тестировать альфа-4 («v4») версию своей сводной модели преобразования текста в изображение, которая доступна подписчикам на его сервере Discord. Новая модель предоставляет больше деталей, чем ранее было доступно в сервисе, что вдохновило некоторых специалистов по искусственному интеллекту на замечание о том, что в версии 4 почти "слишком легко" получать высококачественные результаты с помощью простых подсказок.
Midjourney был открыт для публики в марте в рамках первой волны моделей синтеза изображений с помощью ИИ. Он быстро приобрел большое количество поклонников благодаря своему особому стилю и доступности для аудитории до DALL-E и Stable Diffusion. За короткое время работы, созданные Midjourney, попали в заголовки газет, выиграв художественные конкурсы, предоставив материалы для потенциально исторических записей, защищенных авторским правом, и появившись на веб-сайтах с иллюстрациями (позже запрещенными).
Со временем Midjourney совершенствовала свою модель, добавляя больше обучения, новые функции и детали. Текущая модель по умолчанию, известная как «v3», дебютировала в августе. Сейчас Midjourney v4 тестируется тысячами участников сервера Discord сервиса, которые создают изображения с помощью бота Midjourney. В настоящее время пользователи могут попробовать v4, добавив "--v 4" в свои приглашения.
«V4 — это совершенно новая кодовая база и совершенно новая архитектура искусственного интеллекта», — написал основатель Midjourney Дэвид Хольц в объявлении Discord. "Это наша первая модель, обученная на новом сверхкластере искусственного интеллекта Midjourney, и мы работали над ней более 9 месяцев".
При тестировании модели Midjourney v4 мы обнаружили, что она обеспечивает гораздо большее количество деталей, чем v3, лучшее понимание подсказок, лучшую композицию сцен и иногда лучшую пропорциональность в своих объектах. При поиске фотореалистичных изображений некоторые результаты, которые мы видели, могут быть трудно отличимы от реальных фотографий с более низким разрешением.
По словам Хольца, другие функции v4 включают:
- Гораздо больше знаний (о существах, локациях и т. д.) - Гораздо лучше улавливаются мелкие детали (во всех ситуациях) - Обрабатывает более сложные подсказки (с несколькими уровнями детализации) - Лучше с многообъектными/многосимвольными сценами
What's Your Reaction?