Невероятный искусственный интеллект Easy Diffusion. Учебное пособие для школьников средних и старших классов - страница 8
Итак, начнем…
Для того чтобы создать изображение из текста, в окне «Enter Prompt» нам необходимо написать правильный текстовый запрос («Prompt»):
Окно «Enter Prompt» («Ввод запроса»)
Обратите внимание на то, что в окне «Enter Prompt» мы пишем не литературное описание той картинки, которую хотим получить, а именно запрос. Искусственный интеллект, с которым мы работаем, к сожалению, еще не читает наши мысли, и для него важно, чтобы мы говорили с ним на понятном ему языке. Уже большое достижение разработчиков заключается в том, что запрос пишется набором из ключевых фраз (состоящих из простых для понимания и человека, и машины слов), разделенных запятой, и исключительно на английском языке.
Давайте рассмотрим конкретный пример.
Мы создадим с вами изображение киборга с искусственным интеллектом.
Для этого выполним следующие действия:
– В окне «Enter Prompt» напишем следующую фразу на английском языке: «Artificial intelligence cyborg» («Киборг с искусственным интеллектом»). Если у вас возникли сложности с переводом, то рекомендую пользоваться помощью онлайн-переводчиков.
– Выберем алгоритм «Realistic Vision».
– Автоэнкодер (Custom VAE): vae-ft-mse-840000-ema-pruned. Автоэнкодер будет вам полезен в дальнейшей работе. Он помогает решить проблему с появляющимися артефактами и дефектами на лицах.
Найти файл можно в сети Интернет, а также скачать по ссылке:
https://huggingface.co/stabilityai/sd-vae-ft-mse-original/blob/main/vae-ft-mse-840000-ema-pruned.ckpt
Скачанный файл нужно перенести в папку:
С:\ EasyDiffusion\models\vae
или
D:\EasyDiffusion\models\vae
Если не получается найти и скачать файл, оставьте поле пустым.
– Sampler (Сэмплер): DPM++2s Ancestral (Kerras)
Все остальные параметры оставляем без изменений и жмем кнопку «Make image» («Создать изображение»).
Рабочая область программы Easy Diffusion
Давайте в окне «Enter Prompt» добавим небольшое уточнение про цвет глаз нашего киборга: «Artificial intelligence cyborg, green eyes».
Все остальные параметры оставляем без изменений и жмем кнопку «Make image».
В результате мы получим изображение, похожее на предыдущее, но уже цвет глаз киборга будет зеленым:
Рабочая область программы Easy Diffusion
Обратите, пожалуйста, свое внимание на то, что Easy Diffusion обрабатывает ваш запрос слева направо по порядку следования фраз, разделенных запятой.
Основная магия искусственного интеллекта заключается в том, что даже если вы все сделали так же, как я, то в большинстве случаев вы получите либо совсем другую картинку, либо очень похожую, при условии, что вы нажмете на кнопку «Make image» много раз.
Связано это с тем, что система Easy Diffusion каждый раз будет интерпретировать фразу «Artificial intelligence cyborg» как ей захочется, по причине того что наша ключевая фраза очень простая и носит общий характер, а также требует дополнительных уточнений.
Сделаем еще один шаг. В окне «Enter Prompt» добавим уточнение про цвет волос нашего киборга: «Artificial intelligence cyborg, green eyes, blue hair».
Все остальные параметры оставляем без изменений и жмем кнопку «Make image».
В результате мы получим изображение, похожее на предыдущее, но уже цвет волос киборга будет… зеленым:
Рабочая область программы Easy Diffusion
Как же так?
Мы же определили, что цвет волос должен быть голубым.
Для такого случая есть еще один полезный прием, который заставит искусственный интеллект обратить более пристальное внимание на наше уточнение про волосы.