Нейроцех
12.4K subscribers
640 photos
337 videos
1 file
832 links
Помогаем переложить свою работу на роботов 🤖

Вступить в Нейроцех → @neurozeh_bot

Заявление № 7090987965
Download Telegram
🟡 Приложение для работы с Claude Code с телефона

Нашел классную штуку для тех, кто работает с Claude Code и хочет управлять им не только с компьютера, но и с телефона. Я знаю, что к клод коду можно подключаться через SSH, но это будет очень неудобно. Диктовка.в таком случае плохо работает, виртуальной клавиатурой пользоваться очень неудобно, а сам интерфейс периодически глючит.

Одного парня это настолько достало, что он собрал приложение для управления агентами голосом. Потом начал добавлять фичи по мере необходимости, и постепенно из этого выросло полноценное приложение Paseo.

Суть Paseo в том, что агенты запускаются на вашем компьютере с вашим полным рабочим окружением, а телефон просто подключается к ним через интернет. То есть вы получаете доступ ко всем фишкам Клод кода: доступ к файлам, зависимостям, настройкам и т. д.

Вот, что умеет приложение:

🟡 Управлять Claude Code, Codex и OpenCode из одного интерфейса. Можно открыть несколько сессий и переключаться между ними.

🟡 Работать с Git-воркритами, чтобы запускать нескольких агентов для работы одновременно над разными задачами.

🟡 Управлять терминалом и делать Git-операции. Не нужно выходить из приложения, чтобы сделать коммит или переключить ветку.

🟡 Распознавать голос и голосовой ввод. Работает полностью локально, без отправки голоса на сторонние сервера.

Приложение бесплатное и с открытым кодом. Мобильная версия для Android уже есть на GitHub, iOS на ревью в App Store.

Ссылка на GitHub

#сервисы

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥4
Сегодня последний день, чтобы вступить в Нейроцех. Следующее окно продаж откроется минимум через месяц.

Поэтому кратенько напомним, что получают резиденты «Нейроцеха».

📄 Гайды по внедрению ИИ в свои рабочие процессы. 100+ подробных, детальных и самое главное реальных инструкций, лично протестированные нами.

📸 Лекторий с 80 вебинарами практиков. Постоянно приглашаем выступить экспертов с кейсами применения нейросетей. Они рассказывают, что конкретно они делают ИИ-шками и как это реализовали. К каждому вебинару мы делаем текстовый гайд, так что вы во всем разберетесь даже без просмотра.

🥽 Мини-курсы. Каждый из них посвящён конкретному направлению нейросетей — чтобы погрузиться в тему с полного нуля. Мы уже выпустили курсы по n8n, работе с LLM-моделями и обучение для начинающих. Сейчас готовим ещё один миникурс, который выйдет этой осенью.

🧗‍♀️Сообщество ИИ-энтузиастов, в котором вы будете окружены идеями, что же еще такого делегировать нейросетям.

💪 Кейсы резидентов. Здесь наши резиденты публично хвастаются результатами. Страница открыта для всех, можете почитать;)

Кому будет полезно. Да всем. Это сообщество про использование нейронок в работе в целом, мы стараемся не перегибать с контентом в сторону какой-то определенной темы.

В «Нейроцехе» не понравится тем, кто не верит в возможность использования нейросетей в работе; думает, что это просто бесполезная игрушка. А еще тем, кто не сможет хотя бы пару часов в неделю выделять на внедрение нейросеток в свою работу.

Если еще не решились, можете изучить полный список гайдов и вебинаров на сайте «Нейроцеха»:

Посмотреть список гайдов
Посмотреть список вебинаров
Посмотреть мини-курсы
Почтитать бесплатные кейсы
Посмотреть бесплатные статьи в блоге

Начинайте новый год правильно, вступайте в Нейроцех → @neurozeh_bot.
😁3👍21👎1🔥1💩1
😮 Что нового в мире ИИ

💛 OpenAI выпустила модель gpt-realtime-1.5 для Realtime API. Модель заточена под голосовых агентов и поддержку клиентов: напрямую обрабатывает аудиопоток, понимает интонации и акценты, автоматически распознает, когда пользователь начинает говорить, и прерывает свой ответ. В альфа-тесте на телефонных звонках уровень контакта вырос с 43,7% до 66%, а доля проблемных случаев снизилась вдвое.

🟡 ByteDance выпустила Seedream 5.0 Lite, модель генерации изображений с мультимодальным вводом. Можно описать атмосферу текстом, приложить эскиз, добавить до 14 референсных изображений, и модель соберет всё в единый результат.

🟡 В Claude Code добавили Remote Control. Теперь можно запустить задачу в терминале и продолжить управление сессией с телефона или планшета через приложение Claude или сайт claude.ai/code. Код остается на локальной машине, а мобильное устройство работает как пульт управления. Пока доступно для подписчиков Max.

💛 Google обновила свой no-code конструктор Opal, добавив агентный шаг в процессы. Вместо того чтобы вручную выбирать модель для каждого действия, теперь можно добавить агента, который сам определит наилучший подход и вызовет нужные инструменты: Veo для видео, веб-поиск для исследований и другие. Также добавили память между сессиями, динамическую маршрутизацию и интерактивный чат с пользователем.

🟡 Perplexity представила Computer, систему, которая управляет целыми проектами от начала до конца. Внутри оркестрируются 19 ИИ-моделей от OpenAI, Anthropic и Google: одни занимаются исследованиями, другие пишут код, третьи разворачивают результат. Проекты могут работать часами и даже днями. Доступно для подписчиков Max за $200 в месяц, скоро появится для Pro и Enterprise.

💛 Notion выпустил обновление 3.3 с Custom Agents. Агенты работают полностью автономно: можно задать задачу, устанавить триггер или расписание — они будут работать 24/7. Подключаются к Slack, Figma и другим сервисам. Можно попробовать бесплатно до 3 мая 2026 года, после этого понадобятся кредиты.

💛 В Cowork от Claude добавили запланированные задачи и плагины. Claude теперь может автоматически выполнять повторяющиеся задачи по расписанию: утренние брифинги, еженедельные обновления таблиц, пятничные презентации. Плагины добавляют экспертизу в области дизайна, инженерии и аналитики. Все управляется через новую вкладку «Кастомизация» в боковой панели.

🟡 MiniMax выпустил MaxClaw, облачного ИИ-агента на базе OpenClaw и модели M2.5. Работает в Telegram, WhatsApp, Slack и Discord без сложных настроек и развертывания. Не требует дополнительных затрат на API.

💛 Google Stitch добавил прямое редактирование сгенерированных дизайнов. Теперь можно вручную редактировать текст и изображения прямо в интерфейсе, а также выделить конкретную область экрана и попросить агента обновить именно ее. Раньше для любых изменений приходилось перегенерировать весь экран.

#дайджест

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
115👍6🔥4
🟡 Как сделать чат, в котором нейросети общаются между собой и вместе решают задачи

Недавно рассказывали про CodeMoot, который связывает Claude Code и Codex в одну рабочую цепочку. И вот нашел на Reddit еще один прикольный проект, который решает задачу шире: он позволяет любым ИИ-агентам общаться между собой в общем чате.

Это локальный сервер с браузерным чатом, к которому подключаются ИИ-агенты через MCP. Из коробки поддерживаются Claude Code, Codex и Gemini CLI, но подключить можно любого агента, который работает с MCP.

Работает так. В браузере открывается чат, в котором можно задавать вопросы с упоминанием нейронки. Например, можно написать @ claude — сервер автоматически вбросит промпт в терминал Claude. Claude прочитает переписку и ответит в чат. Если в ответе Claude упоминает @ codex, сервер точно так же будит Codex, и тот подхватывает разговор. Цепочка крутится сама, пока не достигнет лимита ходов, который настраивается в конфиге. После этого разговор ставится на паузу и ждет команды пользователя.

Помимо базового общения есть каналы для разных тем, закрепленные сообщения, система решений (агенты предлагают решения, человек одобряет или отклоняет), голосовой ввод и отправка картинок.

Ссылка на GitHub

#инструменты

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
👍146🔥5
SEO-машина

Последние пару месяцев я создаю сервис для помощи студентам в учебе — https://zachet.tech/
Идея простая — обертка вокруг пачки нейронок, которая генерит разные текстовые работы, презентации и решает сложные задачи.

До текущего момента я никогда не занимался продвижением диджитал сервисов и маркетингом в целом. Сейчас познаю этот дивный новый мир через призму нейронок.

Всем привет, на связи Иван Марцинкевич, менеджер проектов и продуктов, сейчас работаю Head of PMO в компании Микран, «ИКС холдинг»


Первым делом я натравил OpenClaw агента проанализировать сайты пятерых конкурентов (ai-student.ru, studgen.ru, begemot.ai, wordybot.ai, deeplom.ru и kampus.ai). Выяснилось, что половина из них активно работают над SEO, о чем OpenClaw очень подробно расписал и предложил ряд задач по SEO-оптимизации. Так была выбрана стратегия продвижения через SEO.

Вот список вещей, которые мне предложил сделать OpenClaw:

1. Добавить мета-теги (title, description) на все страницы лендинга
2. Добавить Open Graph разметку для соцсетей
3. Добавить структурированные данные JSON-LD (организация, FAQ, хлебные крошки, инструкции)
4. Настроить хлебные крошки для навигации
5. Найти и поправить все битые ссылки на сайте (404 ошибки)
6. Ускорить загрузку сайта до 130-200ms — лучшее значение среди конкурентов
7. Оптимизировать все заголовки
8. КЛЮЧЕВОЕ: Создать каталог из нескольких тысяч статических страниц по предметам и типам работ на все низкочастотные запросы в поисковиках, чтобы забирать весь этот трафик себе. Пример: Курсовая работа на тему "Внешняя политика Российской империи в XIX веке" — который будет выпадать в поиске, если пользователь будет искать такую работу.
9. Уникализировать контент всего набора этих страниц, чтобы они не выглядели как клоны (гугл это очень сильно не любит)
10. Перелинковать как можно больше страниц сайта между собой
11. Объединили все это дело в единый sitemap — индексный файл и отправить его в Google Search Console и Яндекс.Вебмастер + запросить индексацию в обеих системах

Получив эти рекомендации, я зарядил их пачкой в своего Claude и прошелся по своему фреймворку создания крупной фичи. Через пару часов разработки и отладки получилось примерно 25 тысяч статичных страниц, полностью оптимизированных, уникальных и готовых к поисковой выдаче. Прокинул все это в яндекс вебмастер и гугл серч консоль, теперь жду, когда все это проиндексируется.

Гугл и Яндекс все это очень сильно любят и радостно подхватили мой лендинг в работу — на сайт УЖЕ пошли первые пользователи.

На минуточку, я НИКОГДА не занимался SEO ранее. Кому-то может показаться, что все это стандартные задачи по продвижению сайта, но для меня это магия, ставшая реальностью.

Самое приятное, что в любой момент времени Claude вел меня по процессу поясняя все не понятные моменты и рассказывал, что происходит и зачем.

В очень интересное время живем.

#кейсы

@neurozeh
🔥16👍106🍌2🤔1
Media is too big
VIEW IN TELEGRAM
💛 Как один чел собрал команду из 13 ИИ-агентов, которые ведут ему весь маркетинг

Держите классную историю от разраба, как он построил систему из 13 агентов на базе OpenClaw. Агенты полностью ведут маркетинг его продукта: исследуют конкурентов, пишут посты, планируют кампании, делают дизайн-брифы и проверяют работу друг друга. На весь процесс автор тратит около 30 минут в день.

Каждый агент отвечает за свою область. Один пишет контент, другой занимается исследованиями и анализом конкурентов, третий строит стратегию, четвертый дает жесткую обратную связь и ловит слабые места в текстах. Есть отдельный агент-координатор, который создаёт задачи, распределяет их между остальными и следит за процессом. Автор назвал всех агентов в честь персонажей «Игры престолов» и прописал каждому характер: например, агент-критик разносит плохие тексты, а агент-стратег отслеживает, не отклоняется ли контент от общей линии.

Самое прикольное то, как устроена проверка качества. Задачи проходят через несколько этапов: бэклог, в работе, рецензия коллегами, финальная проверка, готово. Агенты не могут пропустить этап рецензии. Когда один заканчивает задачу, другие агенты, которые назначены на тот же проект, обязаны ее проверить и оставить комментарии. Только после того как все рецензенты одобрили работу, координатор передает задачу на финальную проверку автору. Ну и в конце человек или одобряет работу нейронок, или заставляет пахать их заново.

Все общение между агентами происходит через комментарии к задачам в базе данных. Когда агенту нужно внимание человека, он отправляет уведомление в Telegram. Каждый агент запускается автоматически раз в 10-15 минут: сначала проверяет задачи, которые ему назначили на рецензию, потом работает над своими, потом отчитывается о прогрессе.

Вместо того чтобы каждый день вручную придумывать задачи, автор задает долгосрочные цели (например, «развивать Twitter-аккаунт продукта»), а координатор сам генерирует по 3 задачи в день на эту тему и раздает их нужным агентам.

По стоимости на подписки Claude за $100 в месяц недельные лимиты улетают на 80-90%.

Темка очень прикольная. Хочу сделать что-нибудь подобное для своего клода-текстовика. Осталось дело за малым — нормально разобраться в OpenClaw 😎.

#кейсы

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1310👍7💩1
🟡 Как сделать из OpenClaw семейного ИИ-ассистента

Ладно, все эти бизнесы, стартапы с их автоматизациями, это все понятно. Но нужно же и привучную жизнь упрощать. Один парень так и сделал: собрал из OpenClaw полноценного семейного ИИ-ассистента, которым пользуется вся семья. Ассистент работает круглосуточно на домашнем сервере, подключен к Slack и Discord и управляет кучей вещей в доме: музыкой через Spotify, домашней сетью, родительским контролем, фитнес-трекерами и медиа-сервером. Вот это реально умный дом получился 🟡

К сожалению, он не рассказал, как все настроил. Зато поделился, какие проблемы всплыли по дороге и как он их решал. Эти советы точно пригодятся, если хотите потрогать клешню.

🟡 Раздутый контекст. OpenClaw при каждом запросе загружает в контекстное окно набор служебных файлов с инструкциями и настройками агента. Эти файлы разрастаются и занимают слишком много места, оставляя мало пространства для самого разговора. Поэтому мужик установил жесткий лимит: максимум 9 файлов общим объемом не больше 6 600 байт, а лишние сократил до заглушек.

🟡Память работала плохо. У OpenClaw есть система долговременной памяти, но при 3 000+ накопленных воспоминаний качество поиска просело. Автор поднял порог точности, добавил переранжирование и настроил ночной цикл обслуживания памяти. Каждую ночь в 2 часа запускается процесс из 7 фаз: каталогизация, закрепление важных воспоминаний, поиск связей между фактами, удаление дубликатов, выявление пробелов и генерация отчета о состоянии.

🟡 Переключение между каналами. Если кто-то из семьи начинал разговор в Discord и переключался в Slack, ассистент не помнил, о чем только что шла речь, потому что сессии привязаны к каналу. Автор собрал двухуровневую систему: при нормальном завершении сессии нейросеть извлекает ключевые факты и создает краткое резюме для следующей сессии на любом канале. А если человек просто переключился без прощания (что бывает в 90% случаев), система при первом сообщении в новом канале сама находит последнюю сессию этого пользователя на другом канале и подгружает оттуда последние 15 сообщений.

По стоимости система сжирает $50-60 в неделю на API Claude и GPT. Вся система крутится на старом NAS 2016 года с 8 ГБ оперативки, который выступает как диспетчер: принимает сообщения, решает куда их направить и запускает задачи по расписанию. Вся думающая часть происходит на серверах Anthropic и OpenAI.

#кейсы

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍5🔥1💩1
This media is not supported in your browser
VIEW IN TELEGRAM
POV: ваша нейронка пытается работать за вас, налаживать отношения, анализировать результаты медицинских анализов и готовить ужин.
😁162👍2
This media is not supported in your browser
VIEW IN TELEGRAM
💛 Как правильно ставить задачи нейросетям

На прошлой неделе в Нейроцехе выступил Роман Белов и рассказал про очень важную тему — работу с контекстом. Веб получился очень насыщенным и отлично закрыл базовый вопрос: а как правильно давать инфу нейросети?

Вот небольшая выжимка с веба — про то, как правильно структурировать информацию перед запросом

—————————————————

Чтобы выполнить конкретную задачу, нейронке нужно давать много конкретной информации: что вы строите, что именно нужно сделать прямо сейчас, какие файлы посмотреть, как выглядит готовый результат.

На вебе Роман выделил шесть слоев контекста, которые стоит подавать модели раздельно, а не загружать все разом.

Первые три слоя обязательны для любой серьезной задачи.

🟡 Системные инструкции — это файл Claude.md. Прекрасный пост про него у нас уже был.

🟡 Контекст проекта описывает, что именно вы строите: технологический стек, архитектуру, структуру директорий, зависимости. Если вы делаете маркетплейс на Node.js с приложением на Flutter и используете Clean Architecture, все это нужно зафиксировать в отдельном файле. Без прописанной архитектуры в какой-то момент начнется хаос, и вы потратите на рефакторинг больше, чем потратили бы на описание.

🟡 Контекст задачи. Здесь важна конкретика: не “сделай классный лендинг”, а пошаговый план с критериями результата. Вот как может выглядеть контекст задачи:

Цель: исправить баг логина.
План:
1. Воспроизвести ошибку.
2. Проверить логи.
3. Пропатчить auth.py.


Стоит указать, что должно получиться на выходе и какие ограничения учесть. Выбор реализации можно оставить за агентом или попросить его предложить несколько вариантов, но сама задача должна быть сформулирована четко.

Следующие три слоя необязательны — агент будет подгружать их по мере надобности.

🟡 Код и документация. Это внешние файлы, которые помогут выполнить задачу: логи ошибок, схемы, техническая документация через MCP-серверы. Вы можете указать агенту конкретные файлы и даже конкретные строки, которые нужно прочитать:

Читай src/auth.py строки 10–50. Проверяй error.log на наличие 500-ошибок.


🟡 Критерии готовности задают условия приемки: ноль ошибок, прохождение тестов, корректная работа после публикации, конкретный формат вывода. Например:
Должен пройти test_login.py. Вывод — JSON-объект, не markdown.

🟡 Примеры показывают, как должен выглядеть результат: формат вывода, структура файлов, tone of voice. Если у вас есть стандарт оформления кода или корпоративный стиль текстов, можно передать образец, и агент будет ориентироваться на него. Вот пример формата вывода, который можно приложить к задаче:
{"status": "ok", "data": [...]}

На практике каждый слой живет в отдельном файле или подключается через отдельный инструмент. Claude.md прочитается автоматически при запуске сессии. Файл с архитектурой проекта агент прочитает, когда встретит ссылку на него. Для конкретной задачи вы можете подключить нужный файл командой /add или попросить агента прочитать его через read_file — и он обратится к нужному документу. Техническую документацию по стеку агент подтянет через MCP-сервер.

———————————————
Полную версию вы как всегда можете найти в базе Нейроцеха

#инструкции

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
👍109🔥4
Вам зашли прошлые статьи-сравнения разных нейронок, поэтому я написал еще одну и сравнил китайские ИИшки.

Спойлерить не буду, можете сами заценить — читать статью

@neurozeh
12👍8
Когда мы пишем про Нейроцех, всегда рассказываем про 2 вещи:

— Наше офигенное комьюнити единомышленников. Что мы всегда помогаем друг другу, делимся клевыми лайфхаками и мотивируем использовать нейронки для разных задач,

— Гору полезного материала, который поможет вам решить свои задачи. Гайды или вебики могут даже не быть напрямую связаны с вашей задачей, но в них все равно много полехных фишек и советов, которые помогают прийти из точки А в точку Б.

Если не верите — вот 2 свежих отзыва от наших новых резидентов.

@khakimovpro за неделю собрал оптимизированный под SEO сайт для своей компании. Сэкономил компании кучу денег, получил супер работающий инструмент маркетинга, ну и осуществил мечту многих ленивых вайбкодеров, теперь сайт редактируется голосовым сообщением боту в ТГ. Раньше на улучшение сайта тратили по 10-15к в месяц, сейчас на это уходит буквально пару промптов и 20-30 минут.

@TaYakovleva пришла к нам 30 января с целью просто попробовать что-то новое, освоить ChatGPT и Perplexity, а в итоге собрала CRMку на основе телефонной книжки с фильтрацией контактов (клиент/подрядчик, сбором запросов и пайплайн стадий проектов, банком ошибок, планированием встреч с выгрузкой в таск-менеджер). Эта идея жила с ней три года, а реализовалась… за один день. И это только часть того, что она сделала. Полный отзыв читайте на скрине.

Нейроцех — место, где каждый найдет для себя что-то полезное и сможет решить свои задачи. Чтобы присоединиться к нам, вступайте в бота Нейроцеха → @neurozeh_bot

Сейчас продажи закрыты, но в боте уведомление о новом окне вы точно не пропустите.
👍137🔥5👎2💩2
😮 Что нового в мире ИИ

💛 OpenAI выпустила GPT-5.4 — модель, которая объединяет рассуждения, программирование и агентские задачи в одну систему. Раньше для каждого из этих направлений нужны были разные подходы, теперь все работает внутри одной модели. Главная фишка: GPT-5.4 умеет менять направление мысли на лету, если в процессе ответа понимает, что пошла не туда. В тесте GDPval, который имитирует реальную офисную работу в 44 сферах, модель справляется с задачами в 83% случаев (предыдущая версия набирала 71%).

🟡 OpenAI также внедрила GPT-5.3 Instant для всех пользователей ChatGPT. Улучшены отображение результатов поиска, точность ответов и естественность диалога. Модель меньше отказывается от запросов, не перегружает ответы лишними оговорками и звучит менее формально.

💛 Google выпустила Gemini 3.1 Flash-Lite — самую экономичную модель серии Gemini 3. Скорость отклика примерно в 2,5 раза выше, чем у Gemini 2.5 Flash, а производительность на 45% больше. При этом цена минимальная: $0,25 за миллион входных токенов и $1,50 за миллион выходных.

🟡 Qwen представила серию компактных моделей Qwen 3.5 в четырех размерах: 0.8B, 2B, 4B и 9B параметров. Самые маленькие версии на 0.8B и 2B рассчитаны на работу прямо в смартфонах и гаджетах. Версия на 4B подходит для цифровых помощников. Старшая модель на 9B по качеству ответов почти не уступает большим нейросетям, при этом требует значительно меньше вычислительных ресурсов.

💛 OpenAI запустила Codex на Windows. Приложение поддерживает локальное выполнение кода и интеграцию с WSL. Встроены терминалы PowerShell, CMD и Git Bash.

🟡 NotebookLM от Google научился создавать кинематографические видеообзоры из загруженных источников. Можно выбрать сюжетную линию, и NotebookLM сгенерирует видеоролик на основе материалов. Пока доступно на английском языке для подписчиков Ultra.

💛 Lightricks выпустила видеомодель LTX-2.3, которая генерирует видео в разрешении до 4K со встроенным озвучиванием диалогов. Модель точнее интерпретирует движения камеры и действия персонажей, стабильнее рендерит текст на вывесках и элементах интерфейса, поддерживает вертикальный формат для соцсетей и позволяет задавать стартовый и конечный кадры для построения переходов между сценами.

💛 Utopai Studios представила модель PAI для создания полнометражных видео. Модель генерирует последовательности до 16 сцен общей длительностью до минуты в разрешении 4K, при этом сохраняет стабильность персонажей и окружения от кадра к кадру. Можно вносить правки в отдельные части видео через текстовые команды, не перегенерируя ролик целиком.

💛 Higgsfield представил Higgsfield Audio — генератор аудио на основе ИИ. Умеет озвучивать текст с помощью 21 предустановленного голоса, заменять голос в любом видео и переводить речь на 10 языков (включая русский) с синхронизацией губ. Можно клонировать собственный голос, загрузив аудиофайл длительностью до 2 минут.

🟡 Luma представила Creative Agents — систему, которая превращает платформу из генератора видео в автономную креативную команду. Можно поручить агентам создать целую рекламную кампанию, и они автоматически задействуют модели Sora 2, Veo 3.1, Kling, ElevenLabs и другие для генерации видео, изображений и аудио в едином рабочем пространстве. Система поддерживает единый контекст бренда во всех материалах.

#дайджест

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥5👍1
Что такое RAG и как его готовить

Бывает нужно сделать умный поиск по базе знаний, когда текстов много, они разрозненные и простого поиска уже недостаточно. Для этого есть технология RAG, о которой мы сегодня и поговорим.

🧑‍💻Меня зовут Сергей Мелодин — программист, управленец и автор блога Юный менеджер. Расскажу вам свой кейс использования RAG.

Что такое RAG и как он работает

Retrieval Augmented Generation — это не один инструмент, а общий термин для технологии. Благодаря RAG нейросеть ищет информацию по текстам из документов пользователя. Работает это в достаточно простой последовательности:
1️⃣ Берём текстовые файлы, по которым хотим организовать поиск информации.
2️⃣ "Загружаем" файлы в нейросеть. Под капотом документы преобразуются так, чтобы по ним можно было делать семантический поиск.
3️⃣ Делаем интерфейс для использования или используем готовый, например, NotebookLM.
4️⃣ Пишем вопрос системе, которая ищет релевантные фрагменты документов и передаёт их нейросети.
5️⃣ Получаем ответ, на основе данных, которые наиболее близко оказались к нашему вопросу.

Но важно помнить, что нейросеть — это просто набор алгоритмов с весьма ограниченной памятью, без реального понимания текстов. Из-за этого появляются такие проблемы:
❗️ Если на вопрос нет прямого ответа в тексте, то нейросеть найдёт только похожие тексты и сделает ответ на основе того как сама "поняла" их.
❗️ RAG передаёт нейросети только несколько наиболее релевантных фрагментов (например, 5–10). Если правильный ответ оказался за пределами этого списка, модель его просто не увидит.
❗️ Просто загрузить PDF и начать с ним работать — можно, но не стоит. Чтобы поиск был быстрым, ответы точными, а интерпретация корректной, нужна разметка данных — выделить ключевые слова, явно указать связи между частями текста, превратить это всё в какой-нибудь JSONL-формат.

💼 НейроПДД как кейс для RAG

Мне давно казалось хорошей идеей загрузить в нейросеть правила дорожного движения и уточнять там ответы на свои вопросы. Нейросеть хорошо подходит для такой задачи потому что ПДД написаны для юристов, а не обычных людей. А ещё в них много противоречий и неучтённых деталей. Так как ПДД — документ юридический, в этом есть и плюс. Данные уже размечены по пунктам и сформулированы достаточно чётко.

Но на вопрос "можно ли развернуться через трамвайные пути?" я получал ответы про езду по встречным путям, но не про разворот. Так как в ПДД нет прямого ответа на вопрос, фрагмент "трамвайные пути" встретился раньше и в большем количестве мест в контексте езды по встречке.

Отсюда можно сделать важный вывод:
🧠 учитывайте стоимость ошибки

Если вы загрузили обычную книгу и общаетесь по поводу идей автора, то стоимость ошибки может быть невелика. Особенно, если скрестить информацию из RAG и обычной нейросети.

А вот с юридическими документами вам важна точность и предсказуемость. То есть, чтобы на один и тот же вопрос был один и тот же ответ, подкреплённый одними и теми же ссылками с цитатами без вольной трактовки.

🛠 Какие есть решения этих проблем

Как мы уже обсудили, для RAG данные нужно предварительно подготовить. А когда у вас данные размечены, загружены в базу и вы в них ориентируетесь, то вам и нейросети не нужны.

Вот как можно подойти к этой работе:
1️⃣ Нейросеть вытаскивает тексты из pdf, размечает их, подготавливает для RAG.
2️⃣ На RAG в несколько итераций отрабатывается поиск по размеченным данным, просто ради валидации.
3️⃣ Берётся любой нормальный инструмент с полнотекстовым поиском (Elasticsearch / PostgreSQL / Sphinx / etc) и данные загружаются в базу данных.
4️⃣ Реализуется обычный поиск по ключевым словам, алгоритмы подтягивают по разметке все связанные тексты.
5️⃣ Нейросеть помогает с раздачей весов релевантности поиска и объяснением другими словами те тексты, которые ей пришли из поиска.

Так мы сокращаем контекст, с которым нейросеть работает. То есть, тратим меньше денег на запросы к ней. При этом, получаем больше гарантий, что наш поиск не выдаст на один и тот же вопрос два противоположных ответа.

#кейсы

@neurozeh
👍1310🔥3👀2🤪2👎1😁1💩1
🟡 Как Паша Молянов разрабатывает продукты в Claude Code

Расскажу вам вместо него, а то его в этом канале фиг дождешься. К счастью, он недавно сам выложил в открытый доступ свой фреймворк для разработки — так что расскажу на его основе.

Фреймворк Паши — это набор скиллов, агентов-валидаторов и шаблонов, которые превращают Claude Code в полноценную систему разработки с планированием, ревью и тестированием.

Главная идея — не писать код сразу. Сначала фреймворк заставляет детально спланировать, что именно нужно сделать и как, согласовать спецификации, и только потом приступить к разработке. Каждый этап проверяется отдельными агентами-валидаторами, которые ищут ошибки, дыры в логике и несуществующие зависимости.

Весь процесс разбит на пять шагов.

🟡 Claude Code проводит интервью: спрашивает, что нужно сделать, зачем, для кого, сам изучает существующий код проекта и задает уточняющие вопросы про интеграцию и граничные случаи. По итогам составляет спецификацию требований на русском языке, понятную человеку без технического бэкграунда. Два валидатора проверяют результат: один смотрит на качество и тестируемость, другой на то, не получается ли решение слишком сложным или, наоборот, слишком простым для задачи.

🟡 Утвержденная спецификация переводится в техническую: архитектура, ключевые решения, стратегия тестирования, план реализации. Здесь работают уже пять валидаторов параллельно. Один ищет ссылки на файлы, функции или API, которых не существует. Другой проверяет, что все требования покрыты. Третий проводит аудит безопасности по стандарту OWASP Top 10. И так далее.

🟡 Технический план разбивается на атомарные задачи. Каждая задача получает свой файл с критериями приемки, указанием, какие тесты писать первыми, списком нужных файлов и зависимостями от других задач.

🟡 Начинается сама разработка. Здесь два режима.

— Можно делать задачи по одной, с ручным контролем на каждом этапе.

— А можно запустить параллельное выполнение — фреймворк создаст команду агентов, один из которых станет тимлидом и будет раздавать задачи остальным. Каждый агент будет работать по принципу TDD (сначала писать тесты, а потом код, который эти тесты проходит). После написания кода автоматически запустится code review и аудит безопасности.

🟡 Фреймворк обновляет документацию проекта, сохраняет принятые решения и архивирует рабочие файлы.

Отдельная фишка — Project Knowledge. Вся документация проекта хранится в структурированных файлах (описание проекта, архитектура, паттерны кода, настройки деплоя), и агент подгружает из них только то, что нужно для текущей задачи, а не весь контекст целиком. Это экономит контекстное окно.

Вот такие пироги.

Ссылка на GitHub

#инструменты

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍18🔥116🤔2
🟡 Инструмент, который сократит расходы на ИИ на 50–70%

Чаще всего все используют для работы Claude Opus, при чем для любых задач: планирования, создания кода, письма, простых запросов и даже переименования файлов. Хотя для того же коммита или переименования файла хватило бы Haiku, которая стоит в 10 раз дешевле и отвечает в 3–5 раз быстрее.

Все это знают, но никто не переключает модель вручную. Потому что когда работаешь в потоке, останавливаться и думать о выборе модели не хочется.

Чтобы не отвлекаться, можно использовать Model Matchmaker. Это скрипт, который запускается перед отправкой каждого запроса, анализирует промпт и проверяет, подходит ли выбранная модель для задачи.

Работает просто. Если на Opus попросите сделать коммит или переименовать файл, хук заблокирует запрос и предложит переключиться на Haiku. Если на Haiku или Sonnet попросите проанализировать архитектуру или продумать стратегию, хук предложит переключиться на Opus. Классификация работает чеерез ключевые слова без каких-либо вызовов к API, поэтому срабатывает мгновенно и ничего не стоит.

Сам автор скрипта проанализировал свои запросы за несколько недель и выяснил, что 60–70% всех промптов были обычной разработкой, с которой Sonnet справляется не хуже Opus. А заметная часть запросов вообще были чисто механическими операциями, которые Haiku выполняет одинаково хорошо. По его подсчетам, он сэкономил 50–70% от общих расходов на API без потери качества.

Ссылка на GitHub

#инструменты

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1912🔥8
Написал новую статью, которая давно напрашивалась — Как правильно общаться с нейросетями в 2026 году и создавать скиллы

Постарался коротко и простым языком разобрать всю базу:

— почему сейчас не нужно зацикливаться на промптах

— что такое скиллы и из чего они состоят

— как создавать скиллы самому и с помощью нейросетей

#инструкции

@neurozeh
🔥15👍103
🟡 Лучшие бесплатные инструменты для OpenClaw

OpenClaw, если кто не знаком, это open-source ИИ-агент, который работает прямо на компьютере и подключается к мессенджерам: Telegram, WhatsApp, Signal и другим. Ему можно писать в чат как обычному человеку, а он будет выполнять задачи: разбирать почту, управлять календарем, бронировать билеты и вообще делать что угодно, до чего дотянутся подключенные сервисы.


Вокруг OpenClaw выросла целая экосистема сторонних инструментов. Вот список лучших из тех, которые стоит попробовать:

🟡 Оркестрация и управление

Autensa. Бесплатный дашборд, в котором можно планировать задачи, раздавать их агентам и следить за выполнением в реальном времени.

Builderz' Mission Control. Ещё один дашборд, но с упором на контроль расходов. Показывает, сколько токенов тратит каждый агент, и помогает не сливать бюджет на API.

🟡 Инфраструктура

Clawd Cursor. Скилл, который позволяет агенту управлять компьютером как человек. Агент видит экран, двигает мышку, кликает по кнопкам и вводит текст. Можно попросить его открыть браузер, заполнить форму или изменить настройки в любой программе.

Clawzempic. Инструмент, который обещает сократить расходы на API языковых моделей до 93%. Работает как прослойка между OpenClaw и API провайдера: кэширует повторяющиеся запросы и оптимизирует потребление токенов.

PinchTab. Мост для автоматизации браузера. Если агенту нужно что-то делать на сайтах (заполнять формы, собирать данные, кликать по кнопкам), PinchTab даёт ему для этого стабильный интерфейс. Поддерживает параллельный запуск нескольких браузерных сессий.

🟡 Мониторинг

Clawmetry. Бесплатный дашборд для мониторинга. Показывает расход токенов, статус задач по расписанию (cron jobs), работу суб-агентов и использование памяти.

🟡 Память

Mengram. Добавляет OpenClaw-агенту человекоподобную память трех типов: семантическую (факты и знания), эпизодическую (события и контекст) и процедурную (навыки и алгоритмы действий). По сути, агент начинает запоминать не только что произошло, но и как действовать в похожих ситуациях.

MoltBrain. Слой долговременной памяти, который работает не только с OpenClaw, но и с Claude Code. Если агент забывает контекст между сессиями, MoltBrain решает эту проблему.

🟡 Безопасность

Clawsec. Система безопасности с открытым кодом, которая перехватывает вызовы инструментов и блокирует рискованные действия. Учитывая, что OpenClaw имеет доступ к почте, мессенджерам и другим сервисам, защита от случайных или вредоносных действий реально важна.

#сервисы

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
18🔥9👍5🗿2
🟡 Как поднять своего ИИ-агента на OpenClaw с нуля

Тут наш резидент Иван собрал подробную инструкцию по OpenClaw и рассказал все самое главное:

— как арендовать VPS, установить OpenClaw,

— как подключить API-ключи Claude и настроить Телеграм-бота.

— как настроить личность агента через систему файлов: характер, память, информацию о владельце

— как настроить кроны (это задачи по расписанию, например утренний дайджест новостей) и скиллам (модули, которые добавляют агенту новые возможности вроде поиска в интернете, генерации картинок или работы с GitHub).

Если давно хотелось попробовать поднять своего агента, это как раз тот минимум, с которого можно начать.

Ссылка на гайд

#инструкции

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍23🔥1310
Мужик за год построил ИИ-агентов для 20+ стартапов. Вот его список самых важных советов для тех, кто тоже хочет заняться ИИ-разработкой

На Reddit он написал, что постоянно видит одну и ту же ошибку: люди хотят сразу собрать автономного ИИ-помощника на каком-нибудь ноукод-конструкторе и пропустить всю инженерную часть. По его опыту, именно поэтому большинство проваливается. Надёжный агент это не длинный промпт, а системная инженерия.


🟡 Сначала нужно понять, как данные перемещаются между сервисами

Агент бесполезен, если не может забрать данные из одного сервиса и отправить в другой. Например, взять информацию о заказе из CRM и передать ее в бота, который отвечает клиенту. Для этого агенту нужно уметь отправлять запросы к API других сервисов и разбирать ответы, которые приходят в формате JSON.

На практике именно здесь застревают надолго. В обучающих материалах данные всегда приходят чистые и аккуратные. В реальности API возвращают ответы в неожиданном формате, документация оказывается неточной, а поля, которые должны быть заполнены, приходят пустыми. Разраб пишет, что 80% времени уходит не на подключение нейросети, а на то, чтобы разобраться, почему данные приходят не такими, как ожидалось. Код, который разбирает данные, важнее кода, который генерирует текст.

🟡 Потом нужно научить агента запоминать

Агент без памяти это просто генератор текста. Он не помнит, что было в прошлом разговоре, не может найти нужный кусок из документации и не отличает актуальные данные от устаревших. Чтобы это исправить, нужно разобраться в базах данных (SQL для точных фактов, векторные хранилища для поиска по смыслу в большом объёме текста) и в подготовке данных перед загрузкой.

Разраб отдельно подчеркивает: если загрузить в векторную базу мусорные документы, агент будет доставать мусорный контекст. Данные нужно вручную чистить и правильно разбивать на куски, иначе поиск будет работать неправильно.


🟡 Дальше нужно выстроить логику, по которой агент принимает решения

Агент должен помнить, на каком шаге находится разговор, и переносить контекст из одного этапа в следующий. Без этого каждое сообщение для него как первое.

И здесь же нужно понять, как работает вызов функций (function calling). Нейросеть не выполняет работу сама. Она только выбирает, какую функцию запустить, а дальше работает обычный Python-код. Если код написан с багами, никакая модель не поможет. Поэтому качество функций, которые агент вызывает, важнее качества самой модели.

🟡 Только теперь подключается нейросеть

На этом этапе нужно разобраться в трех вещах.

— Контекстное окно — это ограничение на объем текста, который модель может удержать в голове за один раз. Нельзя каждый раз скармливать ей все подряд, нужно отправлять только то, что относится к текущей задаче.

— Маршрутизация — когда вместо одного промпта на все случаи жизни строится система, которая определяет тип задачи и отправляет его специализированной функции.

— Обработка ошибок — потому что модель будет галлюцинировать, API будет падать, и нужен код, который ловит сбои и пробует заново.

🟡 И последнее — сделать так, чтобы все это работало каждый день

Можно собрать идеального агента, но если он падает раз в неделю и никто не понимает, почему, все напрасно. Нужны три вещи:

— Вебхуки (чтобы агент автоматически запускался при внешнем событии, например, когда приходит новое письмо),

— Фоновые задачи (чтобы агент работал по расписанию без участия человека)

— Логирование (запись всего, что агент делает, чтобы при сбое можно было понять, что пошло не так).

#инструкции

@neurozeh
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥1610💩2