Стараюсь изучать возможность использовать генерации изображений на основе текста, или изображения, их модификации- удаление, чистка, апскейлинг, а также оцветнение чернобелых изображений. За полгода очень многое меняется, завтра не удивлюсь, что все не так и по другому.
То что использую сейчас и примеры генерации. Например такой промпт:
Собака смотрит в окно, за окном виднеется зеленый луг, уходящий в бескрайний космос с звездами и галактиками. Визуализация мыслей собаки: в воздухе вокруг ее головы изображены небольшие облачка или пузыри, внутри которых показаны ее мечты и фантазии — косточка, летающая тарелка, бескрайние поля для игр, планеты и звезды. Стиль: красочный, слегка сюрреалистичный, с акцентом на детали и эмоции собаки. Освещение: мягкое, с сочетанием дневного света и космического сияния.
The dog looks out the window, outside the window is a green meadow, which goes into endless space with stars and galaxies. The visualization of the dog’s thoughts: in the air around her head, small clouds or bubbles are depicted, inside of which her dreams and fantasies are shown - a bone, a flying saucer, endless fields for games, a planet and star. Style: colorful, slightly surrealistic, with an emphasis on the details and emotions of the dog. Lighting: soft, with a combination of daylight and cosmic radiance.
Fooocus (SDXL)
Довольно простой инструмент, но имеет вполне хорошие возможности по частым операциям, я бы сказал стандартным- повысить резкость, разрешение, раширить по сторонам, поменять объект. Но что то более сложное, с масками или картой глубины уже не так просто делается.
Вот тот же промпт и что вышло, использовал 2 модели.
Не очень соответсвовало заявке, не хватает существенной части- мыслей собаки, да и однообразно.
ComfyUI
Самый удобный и мощный инструмент, но требует погружения. Скачать можно тут. У меня моделей и прочего накачено уже более 260 Гб. Удобная ( для меня, может) структура нод. Здесь больше всего разнообразия и в т.ч. результаты так же от убогих до шедевров. Но много чего мой ноутбук не вывозит, долго, а когда нужно попробовать, то это превращается в ужас. Зато все последние фишки и хайп, в т.ч. видео все это здесь. Но если ограничится только одной задачей то структура простая, а если начнешь в одной схеме учитывать несколько сценариев, как пример- сгенерить картинку- потом ее апскейлит, убрть что то, добавить, растянуть, поменять стиль. — приходится использовать несколько схем все это путает и так же долго все, если не вылетает по памяти.
В схеме FLUX schneel что выполняется 4 шага есть «приемущество» выполнить только 1-й шаг. Это по времени примерно секунд 15 и увидеть вариант, который потом можно «довести до ума»
1 шаг | 4 шага |
![]() |
![]() |
KRITA+ AI
Редактор с доп плагином для генерации. Программа бесплатная, ставится из репозитория. Ставим плагин ( еще инструкция Plugin Installation | Krita AI Handbook) По сути внутри автономный ComfyUI с соответсвующими моделями, включая FLUX. Но не такой свободы, Зато все организовано логично, и главное в редакторе по слоям, т.е. можно генерировать, модифицировать, улучшать, заменять прямо в редакторе используя где нужно AI. Мне этот вариант сейчас больше всего нравится в использовании.
из всех вариантов, наиболее адекватны модели FLUX
Le Chat Mistral AI
Есть возможность бесплатного использования для генерации изображения на ресурсе https://chat.mistral.ai. Тот же запрос дает такой результат
На вопрос какую модель использует чат, получил такой ответ:
Я использую модель от BlackForest Labs для генерации изображений. Точные параметры, которые я использую для генерации изображения, включают:
Модель: bf_v1
Размер изображения: 1024×1024 пикселей
Формат изображения: JPG
Эти параметры обеспечивают высокое качество изображения и позволяют создавать детализированные и красочные визуализации.
Ну, оно и видно, что изображения напоминают FLUX.