Midjourney випустила нову потужну модель для створення зображень

Сайт Midjourney на екрані ноутбука. Фото: Unsplash

Midjourney випустила модель V7 — першу майже через рік після попереднього релізу. Компанія є однією з перших платформ для створення зображень за допомогою штучного інтелекту.

Про це пише TechCrunch.

Що вміє нова модель Midjourney V7

Запуск цієї версії розпочався в альфа-режимі. Новинка з'явилася приблизно за тиждень після того, як OpenAI представила свій популярний генератор зображень у ChatGPT, що швидко привернув увагу здатністю створювати ілюстрації у стилі Ghibli.

Перш за все, потрібно оцінити приблизно 200 зображень, щоб сформувати "персоналізований" профіль. Ця система налаштована за замовчуванням саме у V7. Після проходження персоналізації можна вмикати чи вимикати V7 на сайті Midjourney та в офіційному Discord-сервері.

За словами CEO Midjourney Девіда Хольца, V7 створена на повністю новій архітектурі й тепер краще реагує на текстові та графічні підказки. Зображення виходять більш деталізованими, з покращеними текстурами, а руки, тіла та об'єкти відображаються з кращою точністю.

Модель пропонує два режими — Turbo (дорожчий) і Relax, а також новий Draft Mode, який працює вдесятеро швидше, але з нижчою початковою якістю. Процес покращення в Draft Mode відбувається одним кліком.

На момент запуску для V7 не передбачені деякі стандартні функції Midjourney, як-от покращена зміна роздільної здатності (upscaling) та оновлення текстур — вони з'являться пізніше, орієнтовно протягом найближчих двох місяців.

Midjourney, створена у 2022 році Девідом Хольцем (одним із засновників Leap Motion), поки не залучала зовнішніх інвестицій. За оцінками, наприкінці 2023 року компанія могла отримати до 200 млн доларів доходу. Водночас Midjourney працює над апаратними розробками та моделями для відео- й 3D-генерації, хоча подробиць про ці проєкти поки немає.

Компанія також стикається з низкою позовів, у яких її звинувачують у порушенні прав мільйонів митців через навчання ШІ на зображеннях, зібраних із мережі без згоди авторів.

Нагадаємо, Runway випустила нову модель для генерування відео Gen-4. Вона вирізняється одним з найвищих рівнів візуальної якості серед конкурентів.

Також ми писали, що розробники ШІ звертаються до більш креативних способів тестування можливостей генеративного штучного інтелекту. Один школяр вирішив використовувати гру-пісочницю Minecraft як бенчмарк.