Нейромагия. Как MidJourney, ChatGPT и Claude создают наше будущее - страница 5



Во многих реализациях отправной точкой выступает диффузионный процесс, где сеть на каждом шаге «очищает» зашумлённое изображение, приближая его к нужному результату. В классической схеме GAN задействованы две части: генератор (пытается сгенерировать реалистичное изображение) и дискриминатор (оценивает, насколько изображение правдоподобно). В MidJourney могут применяться различные комбинации этих методов или их более современные модификации:

– При получении текстового описания («две фигуры в стиле кубизма, на фоне закатного неба») сеть формирует набор первичных признаков, связывая их с контекстом слов.


– Из случайного шума начинается генерация – грубый набросок, который итерация за итерацией становится всё детальнее.


– Нейросеть использует многослойные свёрточные блоки и механизмы внимания, чтобы корректировать цветовую гамму, формы объектов и фактуру.


– В итоге получается иллюстрация, которая может выглядеть реалистичной, абстрактной или стилизованной – в зависимости от запроса.

Преимущество подобного подхода в том, что пользователю не нужно уметь рисовать или знать нюансы дизайна. Достаточно описать желаемый сюжет, стиль, настроение, и модель выдаст несколько вариантов изображений. Это резко сокращает путь от идеи до визуального концепта.

2.1.2. ПРИМЕНЕНИЕ В ИСКУССТВЕ, МАРКЕТИНГЕ И МЕДИЦИНЕ

Искусство и дизайн. Традиционно создание эскизов, концептов и пробных вариантов для художников было трудоёмкой процедурой. С MidJourney появляются возможности быстро создавать десятки альтернативных набросков, выбирать наиболее интересные и дорабатывать вручную. Также можно исследовать разные стили: барокко, минимализм, кубизм, сюрреализм и т.д.

Маркетинг. Рекламным агентствам нужны свежие идеи для визуальных кампаний. MidJourney может генерировать концепты баннеров, иллюстраций для презентаций и постов в соцсетях. Эксперименты со стилями и цветовыми палитрами, подбор изображений под ключевые слова и смысловые ассоциации становятся проще и быстрее.

Медицина. Первые попытки использования генеративных моделей в медицине связаны с «дорисовкой» снимков и моделированием ситуаций, где исходных данных недостаточно. В принципе MidJourney или аналогичные системы могут генерировать синтетические снимки, помогающие при обучении алгоритмов диагностики. Возможные приложения: дополнение редких кейсов, визуализация анатомических структур, проработка гипотетических сценариев.

2.1.3. ВОЗМОЖНЫЕ ПРОБЛЕМЫ И ОГРАНИЧЕНИЯ

Авторские права. Когда нейросеть генерирует изображение, возникает вопрос, кому принадлежит результат. Пользователю, написавшему промпт? Разработчикам системы, чьи алгоритмы формируют картинку? Споры вокруг интеллектуальной собственности только набирают обороты.

Этические вопросы. Система может создавать «правдоподобные фейки», искажающие реальность. Подделка фотографий, подмененные сцены, визуальные провокации – всё это порождает дискуссию о необходимости регуляций и способов проверки достоверности изображений.

Если вам понравилась книга, поддержите автора, купив полную версию по ссылке ниже.

Продолжить чтение