Честно говоря я попал в собственную ловушку- я сам все хотел автоматизировать, чтобы и посты писать, делиться оперативно своими историями. Но такой огромный объем информации, ширина охвата в нейросетях от поиска информации, составления отчетов, помощи в трудных ситуациях, написание кода, просто веселые идеи и до серверов с автоматизацией некоторых процессов, созданием медиаконтента, создание сайтов и приложений. Когда писать то? А дежурные заметки о новостях в мире ИИ, кому они тут нужны?
И вот и ДР прошел и конец года, и какое то окно ( наверное щель) появилась, почему бы не описать как итоги года, что было… ну для себя же , чтобы потом сравнить итоги года 2025 и итоги 2026?
Ну текста будет достаточно, но и картинок накидаю.
Что на текущий момент есть:
Cloud.ru Россия- VPS сервер Ubuntu + S3 хранилище
Beget Литва- VPS сервер Ubuntu + S3 хранилище

На обоих серверах развернуты сборки в основе n8n,
БД Postgresql ,векторная БД Qdrant, мониторинг Grafana. Стоял Flowise, но не много я на нем чего то делал, только пробовал разные агентские схемы. Пока убрал.

На n8n я делаю разные автоматизации, от простых ботов в Telegram, которые подключены к агенту AI, а тот уже к LLM моделям.
Также чат бот для этого сайта. Все это конечно всегда в процессе улучшений, Например для сайта бот только по семантическому поиску работает в векторной БД, а выдать заметки по дате или какая последняяя- это еще надо будет «прикрутить».
Инструкции у агентов для разных случаев уникальны, где то ответы только на вопросы по заданной теме и без интернета (магазинчик флористики) , а где-то многоступенчатые агенты, которые для ответа на вопрос уточняют необходимость нужных экспертов и запрашивают их мнение. Подключал к своей почте , календарю, мой ассистент помогает поставить отследить мероприятия.
Пробовал загружать анализ изображения (можно чек покупки, документ закинуть он распознает ответит).Ну и наконец генерят картинки по описанию, также делал автоматизацию производства видеороликов, чтобы освоить этот процесс.
И ролик по событиям вроде праздника гигантской колбасы, или занимательные видео разрезания стеклянных предметы, Рекламу- Пушкин продает свои книги на Марктплейсах


Подключил на NAS OpenWebUI к локальным моделям и сделал интеграцию с N8N, для использования моделей по API

Сделал подключения к внешним ресурсам:
OpenAI — Доступ по API к моделям GPT 4 — GPT 5 и их embedding моделям,
альтернативный источник доступа к разым LLM моделям Openrouter,
доступ к моделям генерации изображения и видео FAL ( цены кусаются),
альтернативный и адекватный по ценам KIE, удобно еще тем, что принимает платежи из РФ.
https://api.together и https://replicate.com/ тоже для генерации медиа, на последней есть некоторые бесплатные старые модели вроде FLUX schnell.
Ну и на наши ресурсы делал интеграцию на Yandex Cloud, тоже не сильно задействовал, только скорей для доступа к диску, по генерациям или транскрайба аудио денег хотят, что дешевле через openAI ,
AItunell — отечественный агрегатор вроде KIE, для доступа к разным моделям и оплатой в рублях. Использовать можно с серверами в РФ.
Сервера БД, векторные, пробовал много, но с появлением сборки и локального ресурса отпала необходимость.
Далее «серьезно».
Все таки агенты свои это в некоторых случаях «изобретение велосипеда», например с генерацией видео или фото, как автоматизация- вещь полезная, но когда недо не просто ЛЮБОЙ ответ получить, а работа с инструментами, тюнить, то лучше использовать мощные готовые инструменты.
Для кодинга- CludeCode, Gemini CLI. Это сейчас очень перспективная часть.
Установка локально на рабочей машине или даже на VPS позволяет работать с кодом и давать в работу свои ресурсы, машины, т.е. если нужно что то настроить или же с файлами разобраться- по идее надо почитать что и как делать потом копи паст, получать ошибку и так по кругу пока не получится, а в случается CLI режимом в консоли можно разрешать действия (предварительно модель все подробно описывает, делает план и каждый шаг проверяет сама) и получается что достаточно словами описать что ты хочешь и модель сама все сделает, например установит компоненты, настроит их и пр. Для VPS если бы не было сборки- то поиск в сети ресурсов разных как ставить Docker, настроить FW, конфигурировать- это вся ручная часть заменяется на автоматизацию. Ну и я пробовал с помощью них делать проект сайта ( параллельно с другим способом) и результат был хорошим, конечно не с первого раза все было- но тут удобно , что модель сама все проверяет и правит ошибки. Но это еще впереди. там n8n тоже через кодинг можно настроить и сами процессы не самому делать, а базу из 6-8 нод модель сама построит и настроит.
Google это отдельная тема- есть свои мощные инструменты, но они в подписке от PRO и выше, например Google Ai Studio, где собраны инструменты работы с AI- генерация изображений и видео, кодинг, и создание на всем этом приложений, сайтов, некоторой автоматизации. Сейчас появился Antigravity, но меня блокируют даже через три буквы, не получается попробовать.
Но и прочие инструменты очень крутые, NotebookLM — называют блокноты, сюда загружаешь документы, ссылки, в т.ч. можно там же сделать поиск схожие источники также добавить, затем модель автоматом все это индексирует и можно общаться с агентом по этим материалам, но самое классное- это создавать инфографику, презентации, отчеты, хронологии, аудио и видео подкасты, создавать карточки викторин, обучающие материалы. и регулируется и глубина этих действий и как это сделать, можно устроить дебаты по материалам, или сделать себе карточки для обучения по книге или произведению. Я пробовал и видео загружать, он по нему давал аналитику, разборы, строил схемы,даже то что на видео не показывалось, а только говорили.
По Ромео и Джульетте я закидывал несколько вариантов перевода и просил исследовать противоречия, затем делал по этим выводам поиск в интернете критических статей и также добавлял в анализ и на выходе получал трактовки глав, что очень интересно.
Интересный раздел Эксперименты- там собраны разные приложения от генерации изображений и видео ( там свои лимиты) и для автоматизации много полезного НО- главная проблема- не все доступно даже через три буквы.
У них очень хорошая модель Gemini, сейчас уже версия 3 PRO и Flash, они в конце года вырвали первенство у конкурентов, и есть основания предположить, что к ежегодной конференции они таки выкатят еще что то.
Можно бесконечно про Гугл говорить, в общем это мои любимые инструменты.
Но есть еще Perplexity.
Это очень крутой инструмент. Сначала я «слез» с поиска , т.е. я перестал Гуглить и Яндексить, а запросы отправлял в PP, потом заполучив подписку ПРО я просто в засос залез в нее. Я использую пространства (Spaces, где для каждого генерирую ( с помощью этого жэе пространства) для него системный промпт.
Как он должен работать со мной как отвечать где и что искать, затем в этом же пространстве я делаю исследование по теме пространства ( например 3д Моделирование), чтобы обработав информацию которую нашел сделал мне файлы для базы знаний этого пространства.


Я их туда загружаю и далее моя работа в пространстве становится очень удобной, любые вопросы всегда адекватные ответы именно по знаниям и промпту, никаких левых поисков в интернете . периодически я делаю аудит этой базы знаний и мне PP отдает обновленные файлы, которыми я заменяю старые.
для каких то отчетов, диаграмм инфографики есть режим LAB, он позволяет представить материалы нагляднее, можно даже сделать в виде сайта и страницами. Т.е. в этом режиме происходит также кодинг. Доступ в PRO есть к свежим моделям GPT-5.2, Gemini 3, Grok 4.1, Claude Sonnet 4.5, которые обычно доступны по отдельным подпискам. Недавно вышел их браузер Comet, где есть встроенный ассистент, и можно даже работать параллельно просматривая страницы и общаясь. Справа обвел диалог с ассистентом.

Ассистент может многое, например можно спросить какая почта пришла, какие письма стоит посмотреть, что как спам, и т.п. можно открыть сайт с формой ввода и попросить заполнить ее и много всего. Ну и конечно он и зависает или в цикл попадает. но вот тоже пример ИИ в качестве помощника. Кстати на меркет плесе где много карточек товаров- можно открыть OZON и дать команду поискать товар или же открыв карточку товара спросить его что и как какие отзывы верна ли информация найти похожие или лучшие предложения и все это он сделает сам. Даст аналитику, пео технике я обычно сверяю артикулы и наименования моделей, поскольку от букв также есть разница в комплектации.
Смотрю на часы- и вижу, что «окно» для написания заметки уже слишком широко отрылось. пора закрывать. Бесконечно можно теперь говорить про ИИ, ну коснусь в конце ( заметки) про генерацию контента.
Выше упоминал, что использовал по API модели, но пришел к тому, что лучше и правильнее использовать непосредственно интерфейсы которые предлагают производители этих моделей. Там весь спектр функций, в т.ч. «премиальные» , которые доступны только там. Да и удобство работы выше, особенно при творческом подходе, когда ищешь, пробуешь. По API лучше и проще делать уже готовую автоматизацию, с уже настроенными промптами и структурой, когда результат проверен.
Для генерации изображений и видео я сейчас остановился на Higgsfield как мощном агрегаторе моделей и широком инструментарии по его созданию, также не мало важно- это скидки и режимы unlimited на некоторых моделях, что позволяет попробовать не траты свои кредиты подписки. Да подписка тут нужна. Но за то время, что я использовал ее Я сделал медиаконтента больше чем за полгода, ну а в ИИ наверное за все время.
Тут можно делать практически все, и картинки и стилизацию и трюки с эффектами, и видео и редактирование видео и замена на видео, работа с персонажем, аватаром, и пр.

Кстати, вот будет интересно недавнее тестирование,которое вытекало из разговора с другом, Артуром. Его интересовали сервисы , где можно делать генерации и я советовал некоторые бесплатные, например Qwen. Сразу закинул два изображения , и текст промпта, чтобы сравнить как модели поведут себя на одинаковом запросе и не удобном материале- «мужчина на фото1 одет в одежду с рисунка на фото 2»
Изначальные изображения просто с телефона старые и рисунок , который делал Егор давным давно , может в д/с.

Вот что выдал Qwen — одежду он свою придумал, лицо хоть оставил- короче в мусор
Ниже что выдал Chat GPT 5, у них там модель вроде новая должна быть. Радужная тема, конечно сквозит, но стиль и штаны даже попыталась, а тапки стали варежками. Но лучше, т.е. при желании можно «дожать»
И то что выдали из Higgsfield Flux2Pro, Nano Banana Pro, Seedream 4.5
Flux- штаны нарисовал на прохожем, надписи решил использовать и на футболке, хотя именно это в подобных случаях как раз не надо делать, и формально даже тапки есть.
Банана — максимально использовала объем куртки и сделала меня качком, в целом стиль перенесла, и также одели прохожего в штаны и даже тапки!
Seedream — что творит! Я может и хотел попробовать себя в ролли великана но не тут, и где тапки!? штаны и футболка по стилю норм.
Это конечно больше шутка, чем тест, простов процессе разговора сразу возникло желание из первых двух фото случайных. Конечно есть «правила», которые тут нарушены — это много людей на фото, по хорошему надо было бы сначала фото 1 подготовить к работе, очистить, одеть и вернуть людей, да и промпт был простой, без деталей. Но с другой стороны, ребята!! конец 2025! и это так работает!! что было полгода назад, а что год?
Для примера я эту игру в одевание уже проделал со своим аватаром. Да это не я, я сделал аватара на основе своих фото, но именно чтобы использовать в генерациях не реального человека.

Ну одеть, поместить героя сейчас это не сложно

ой, боюсь не успею. видео? ну давайте в другой раз, это вообще пласт.
Что еще успею- музыка.
Я использую несколько генераторов, в т.ч. через API, где инструкцией можно сделать автоматизацию, Например, использовать своего аватара — артиста, у которого уже есть свой слепок голоса, и генерить и тексты и музыку в выбранном жанре с ним, получится альбом. Но чтобы понять и попробовать эти инструкции, как и что ставить, как модель понимает или не понимает, русский и его особенности слогов и рифм, жанры, стили, спецэффекты.. лучше конечно использовать ресурсы по генерации :
https://brev.ai , https://www.tunee.ai, https://suno.com и есть даже в МАКС- в Гигачате такая возможность, но скорей для галочки- туда текст только маленький войдет, даже не использовал.


А использую SUNO, тоже подписка, бесплатно попробовать можно, но быстро кончаются кредиты, а на картинке видно сколько уже нагенерил, а сколько в корзине.. но «шедевры» или любимчики, их с десяток наберется. Но зато песни к событиям или в порыве души, это очень интересные процессы, каие-то нравятся сейчас, а спустя время и другие тоже. Что будет в будущем трудно сказать- вроде есть риск что генерации станут сильно урезаны или появится доп плата. Лейблы в США сильно взялись за ИИ генерации музыки. А это в свою очередь можно проследить и далее, с фото и видео. Поживем увидим.
Что в процессе освоения ИИ нравится, да и я писал про Зд принтер и моделирование похожие мысли- это то, что сейчас время, когда многие задумки , что были где то глубоко, легко реализовать. Т.е не ждать когда появится, а взять и сделать самому.
Просто шел и напел какой то ритм, тут же записал в SUNO- он добавил инструментов, получилась аранжировка, сделал несколько вариантов, какая то понравилась, ее тут же в кавер- накидал слова .. получил песенку, что родилась еще час или минуты назад!
Поехал в отпуск, делаешь фото разные, не думаешь , что люди или провода, что то мешает. Все это правится за секунды , ну ок, минуты. Есть два фото тебя и жены или детей, но нет его вместе? Ловким движением.. вот и есть.
Вспомнил дедушку, открыл старое фото, минута и фото почищено, можно слегка цвет добавить, Ну и наконец «оживить».
Думаешь над тем как разместить мебель в комнате- сделай фото- нарисуй примерный план, сделай фото- скажи модели — она сделает по твоем плану, диван не там- вот уже в углу, цвет? меняй.
Идешь за покупками- список нужен- бот в помощь. Просто в течении недели , дней сообщай ему что тебе надо купить и где, а он пусть записывает, а уже в магазине- так, что я хотел? Дай ка список для Ашана или рынка. Купил? все купил? проверять? да нет- чек сфотографируй и отправь боту- пусть проверит и проставит по списку сам.
И это далеко не все. У каждого будет свой список , и он точно найдется как использовать ИИ.
2025г , декабрь. Что дальше?













