Перейти к содержимому

Нейросети конец 2025г

Честно говоря  я попал в собственную ловушку- я сам все хотел автоматизировать, чтобы  и посты писать, делиться оперативно своими историями. Но такой огромный объем информации,  ширина охвата в нейросетях  от    поиска информации,  составления отчетов,  помощи в трудных ситуациях, написание кода, просто  веселые идеи и до  серверов с автоматизацией некоторых процессов, созданием медиаконтента, создание сайтов и приложений. Когда писать то? А дежурные  заметки о новостях в мире ИИ, кому они тут нужны?
И вот и ДР  прошел и конец года, и  какое то окно ( наверное щель) появилась, почему бы не описать  как итоги года, что было… ну для себя же , чтобы потом  сравнить итоги года 2025 и итоги 2026?
Ну текста будет достаточно, но и картинок накидаю.
Что на текущий момент есть:
Cloud.ru Россия- VPS сервер Ubuntu + S3 хранилище
Beget Литва- VPS сервер Ubuntu + S3 хранилище

На обоих серверах развернуты сборки в основе n8n,

БД Postgresql ,векторная БД Qdrant, мониторинг Grafana. Стоял Flowise, но не много я на нем чего то делал, только  пробовал разные агентские схемы. Пока убрал.


На n8n  я  делаю разные автоматизации, от простых ботов в Telegram, которые подключены к агенту AI, а тот уже к LLM моделям.

 

Также чат бот для этого сайта.  Все это конечно всегда в процессе улучшений, Например для сайта  бот только по семантическому поиску работает в векторной БД, а  выдать заметки по дате или какая последняяя- это еще надо будет «прикрутить».
Инструкции у агентов для разных случаев  уникальны, где то ответы только на вопросы по заданной теме и без интернета (магазинчик флористики) , а где-то  многоступенчатые агенты,  которые для ответа на вопрос  уточняют  необходимость нужных экспертов и запрашивают их мнение. Подключал к своей почте , календарю, мой ассистент  помогает  поставить отследить мероприятия.

Пробовал загружать анализ изображения (можно чек покупки, документ закинуть он  распознает ответит).Ну и наконец  генерят картинки по описанию, также делал автоматизацию производства видеороликов, чтобы освоить этот процесс.
И ролик по событиям вроде праздника гигантской колбасы, или  занимательные видео разрезания стеклянных предметы,  Рекламу- Пушкин продает свои книги на Марктплейсах

Подключил  на NAS OpenWebUI к локальным моделям и сделал интеграцию с N8N, для использования моделей по API


Сделал подключения к внешним ресурсам:

OpenAI — Доступ по API к моделям GPT 4 — GPT 5 и их embedding моделям,

альтернативный источник доступа к разым LLM моделям Openrouter,

доступ к моделям генерации изображения и видео FAL ( цены кусаются),

альтернативный и  адекватный по ценам KIE, удобно еще тем, что принимает платежи из РФ.

https://api.together и https://replicate.com/  тоже для  генерации медиа, на последней есть  некоторые бесплатные старые модели вроде FLUX schnell.

Ну и на наши ресурсы делал интеграцию на  Yandex Cloud, тоже не сильно задействовал,   только скорей для доступа к диску, по генерациям или транскрайба аудио денег хотят, что дешевле через openAI ,

AItunell — отечественный агрегатор  вроде KIE, для доступа к разным моделям и оплатой в рублях. Использовать можно с серверами в РФ.
Сервера БД, векторные, пробовал много, но с появлением сборки и локального ресурса отпала необходимость.

Далее «серьезно».

Все таки агенты свои это в некоторых случаях «изобретение велосипеда», например с генерацией видео или фото, как автоматизация- вещь полезная, но когда недо не просто  ЛЮБОЙ ответ получить, а работа с инструментами, тюнить, то лучше использовать  мощные готовые инструменты.
Для кодинга- CludeCode, Gemini CLI. Это сейчас очень перспективная часть.

Установка локально на рабочей машине или даже на VPS  позволяет  работать с кодом и давать в работу свои ресурсы, машины, т.е. если нужно что то настроить или же с файлами разобраться- по идее надо почитать что и как делать потом копи паст, получать ошибку и так   по кругу пока не получится, а в случается CLI  режимом  в консоли можно  разрешать действия (предварительно модель все подробно описывает, делает план и каждый шаг проверяет сама)  и получается что достаточно словами описать что ты хочешь и  модель сама все сделает, например установит компоненты,  настроит их  и пр. Для VPS если бы не было сборки- то поиск в сети  ресурсов разных как ставить Docker, настроить FW, конфигурировать- это вся ручная часть заменяется на  автоматизацию. Ну и  я пробовал с помощью них делать  проект сайта ( параллельно с другим способом) и  результат был  хорошим, конечно не с первого раза все было- но тут удобно , что модель сама все проверяет и правит ошибки. Но это еще впереди. там n8n тоже  через кодинг можно настроить и сами процессы не самому делать, а базу из 6-8 нод модель сама построит и настроит.

Google это отдельная тема- есть свои мощные инструменты, но они в подписке  от PRO и выше, например Google Ai Studio, где собраны инструменты работы с AI- генерация изображений и видео, кодинг, и создание на всем этом приложений, сайтов, некоторой автоматизации. Сейчас появился Antigravity, но меня блокируют даже через три буквы, не получается попробовать.

Но и прочие инструменты очень крутые, NotebookLM — называют блокноты,  сюда загружаешь документы, ссылки, в т.ч. можно там же  сделать поиск  схожие источники также добавить, затем  модель автоматом все это  индексирует и  можно общаться с агентом по этим материалам, но самое  классное- это создавать инфографику, презентации, отчеты, хронологии, аудио и видео подкасты, создавать карточки викторин, обучающие материалы. и регулируется  и глубина этих действий и  как это сделать, можно устроить дебаты по материалам, или сделать себе карточки для обучения по  книге или произведению. Я пробовал и видео загружать, он по нему давал  аналитику, разборы, строил схемы,даже то что на видео не показывалось, а только говорили.

По Ромео и Джульетте я закидывал несколько вариантов перевода и просил исследовать противоречия, затем делал по этим выводам поиск в интернете критических статей и также добавлял в анализ и на выходе получал трактовки глав, что очень  интересно.

Интересный раздел Эксперименты- там собраны разные приложения от генерации изображений и видео ( там свои лимиты) и для автоматизации много полезного НО- главная проблема- не все доступно даже через три буквы.

У них очень хорошая модель Gemini, сейчас уже версия 3 PRO и Flash, они в конце года вырвали первенство у  конкурентов, и  есть основания предположить, что к ежегодной конференции они таки выкатят еще что то.
Можно бесконечно про Гугл говорить, в общем это мои любимые инструменты.

Но есть еще Perplexity.

Это  очень крутой инструмент.  Сначала я  «слез» с поиска , т.е. я перестал Гуглить и Яндексить, а  запросы отправлял в PP, потом заполучив подписку ПРО я  просто  в засос залез в нее.  Я использую пространства (Spaces, где  для каждого генерирую  ( с помощью этого жэе пространства) для него системный промпт.

 

Как он должен работать со мной как отвечать где и что искать, затем  в этом же пространстве я делаю исследование по  теме  пространства ( например 3д Моделирование), чтобы обработав  информацию которую нашел сделал мне файлы для базы знаний этого пространства.

Я их туда загружаю и далее моя работа в пространстве становится очень удобной, любые вопросы  всегда адекватные ответы именно по знаниям  и промпту, никаких  левых поисков в интернете . периодически  я   делаю аудит этой базы знаний и мне PP отдает обновленные файлы, которыми я заменяю  старые.

для каких то отчетов, диаграмм инфографики есть режим LAB, он  позволяет  представить материалы нагляднее,  можно даже сделать в виде сайта и страницами. Т.е. в этом режиме  происходит также кодинг. Доступ в PRO есть к свежим моделям GPT-5.2, Gemini 3, Grok 4.1, Claude Sonnet 4.5, которые обычно доступны по отдельным подпискам. Недавно вышел их браузер Comet, где есть встроенный ассистент, и можно даже  работать параллельно просматривая страницы и  общаясь. Справа обвел диалог с ассистентом.

Ассистент может многое, например можно спросить  какая почта пришла, какие письма стоит посмотреть, что как спам,  и т.п. можно открыть сайт с формой ввода и попросить   заполнить ее  и много всего. Ну и конечно он  и зависает или в цикл попадает. но  вот тоже пример ИИ в качестве помощника. Кстати  на меркет плесе где много карточек товаров- можно открыть OZON и дать  команду поискать товар или же открыв карточку товара  спросить его что и как  какие отзывы  верна ли информация найти похожие или лучшие предложения и все это он сделает сам. Даст аналитику, пео технике я обычно сверяю артикулы и наименования моделей, поскольку от букв также есть разница в комплектации.

Смотрю на часы- и вижу, что  «окно» для написания заметки уже слишком широко отрылось. пора закрывать. Бесконечно можно теперь говорить про ИИ, ну  коснусь в конце ( заметки) про генерацию контента.
Выше упоминал, что использовал по API модели, но пришел к тому, что  лучше и  правильнее использовать непосредственно интерфейсы которые предлагают производители этих моделей. Там весь спектр функций, в т.ч. «премиальные» , которые  доступны  только там. Да и удобство работы выше, особенно при  творческом подходе, когда  ищешь, пробуешь. По API лучше и проще делать уже готовую автоматизацию, с уже  настроенными промптами и структурой, когда результат проверен.
Для генерации изображений и видео я сейчас остановился на Higgsfield  как мощном агрегаторе моделей и  широком инструментарии по его созданию, также не мало важно- это скидки и режимы unlimited на некоторых моделях, что позволяет попробовать не траты свои кредиты подписки. Да подписка тут  нужна. Но за то время, что я использовал ее  Я  сделал  медиаконтента больше чем за полгода, ну а в ИИ  наверное за все время.
Тут можно делать практически все, и  картинки и стилизацию и  трюки с эффектами, и видео и  редактирование видео и замена на видео, работа с персонажем, аватаром, и пр.

Вот  за последние дни:

Кстати, вот будет интересно недавнее тестирование,которое вытекало из разговора с другом, Артуром. Его интересовали сервисы , где можно делать генерации и я  советовал некоторые бесплатные, например Qwen. Сразу  закинул два изображения ,  и текст промпта, чтобы сравнить как модели поведут себя на одинаковом  запросе и не удобном  материале- «мужчина на фото1 одет в одежду с рисунка на фото 2»
Изначальные изображения просто с телефона старые и рисунок , который делал Егор давным давно , может в д/с.

Вот что выдал Qwen — одежду он свою придумал, лицо хоть оставил-  короче в мусор

 

Ниже что выдал Chat GPT 5, у них там модель вроде новая должна быть.  Радужная тема, конечно сквозит, но стиль и штаны даже попыталась, а тапки стали  варежками. Но  лучше, т.е. при желании можно  «дожать»

И то что выдали из Higgsfield Flux2Pro, Nano Banana Pro, Seedream 4.5

Flux- штаны нарисовал на прохожем,  надписи  решил использовать  и на футболке, хотя именно  это в подобных случаях как раз не надо делать, и формально даже тапки есть.
Банана — максимально использовала объем куртки и сделала меня качком, в целом стиль перенесла,  и также одели прохожего в штаны и даже тапки!
Seedream — что творит! Я может и хотел попробовать себя в ролли великана но не тут, и где тапки!? штаны и  футболка по стилю норм.

Это конечно  больше шутка, чем тест, простов процессе разговора  сразу возникло желание из первых двух фото случайных. Конечно  есть  «правила», которые тут  нарушены — это много людей на фото, по хорошему  надо было бы  сначала фото 1 подготовить к работе, очистить, одеть и  вернуть людей, да и  промпт был простой, без деталей. Но с другой стороны, ребята!! конец 2025! и это  так работает!!  что было полгода назад, а что год?
Для примера  я эту   игру в одевание уже проделал со своим аватаром. Да это не я, я сделал  аватара на основе своих фото, но именно чтобы  использовать в генерациях не реального человека.


Ну одеть, поместить героя  сейчас это не сложно

ой, боюсь не успею. видео? ну давайте в другой раз, это вообще пласт.
Что еще успею- музыка.

Я  использую несколько генераторов, в т.ч. через API, где  инструкцией можно сделать автоматизацию,  Например,  использовать своего аватара — артиста, у которого уже есть свой  слепок голоса, и генерить  и тексты и музыку в выбранном жанре с ним, получится альбом. Но чтобы понять и попробовать эти инструкции, как и что  ставить, как модель понимает или не понимает, русский и его особенности слогов и рифм, жанры, стили, спецэффекты.. лучше конечно  использовать   ресурсы по генерации :
https://brev.ai ,  https://www.tunee.ai, https://suno.com и есть даже в МАКС- в Гигачате  такая возможность, но скорей для галочки- туда  текст  только маленький войдет, даже не использовал.


А использую SUNO, тоже подписка, бесплатно попробовать можно, но  быстро кончаются кредиты, а на  картинке видно сколько  уже нагенерил, а сколько в корзине.. но «шедевры» или любимчики, их  с десяток наберется. Но  зато  песни к событиям или в порыве души, это очень интересные процессы, каие-то нравятся сейчас, а  спустя время и другие тоже. Что будет в будущем  трудно сказать-  вроде  есть риск что генерации станут сильно урезаны или появится доп плата. Лейблы в США   сильно взялись за  ИИ генерации музыки. А это в свою очередь можно  проследить и далее, с  фото и видео. Поживем увидим.

Что  в процессе освоения ИИ нравится, да и я писал про Зд принтер и моделирование похожие мысли- это то, что сейчас время, когда  многие задумки , что были где то глубоко,  легко реализовать. Т.е  не ждать когда появится, а взять и сделать самому.

Просто шел и напел какой то ритм, тут же записал в SUNO-  он  добавил инструментов, получилась аранжировка,   сделал несколько вариантов, какая то понравилась, ее тут же в кавер- накидал слова .. получил песенку, что  родилась еще  час или минуты назад!

Поехал в  отпуск, делаешь фото разные, не думаешь , что  люди или провода, что то мешает. Все это правится за  секунды , ну ок, минуты. Есть два фото  тебя и жены или детей, но нет  его вместе?  Ловким движением.. вот и есть.

Вспомнил дедушку, открыл старое фото,   минута и фото  почищено, можно слегка цвет добавить, Ну и наконец «оживить».

Думаешь над тем как разместить мебель в комнате- сделай фото- нарисуй  примерный план, сделай фото- скажи модели  — она  сделает по твоем плану, диван не там- вот уже в углу, цвет? меняй.

Идешь за покупками- список нужен- бот в помощь. Просто в течении недели , дней сообщай ему что  тебе надо купить  и где, а он пусть записывает, а уже в магазине- так, что я хотел? Дай ка список для Ашана или  рынка. Купил? все купил? проверять? да нет- чек сфотографируй и отправь боту- пусть проверит и проставит по списку сам.

И это далеко не все. У каждого будет свой список , и он точно найдется как использовать ИИ.
2025г , декабрь. Что дальше?