Dealer.AI
Феномен MoltBot и MoltBook, как предвестники новой реальности 🌌 Только начало 2026го и уже все говорят о moltbot. Что это такое и к чему это приведёт. Что это такое? Moltbot (теперь переименован в OpenClaw) – это персональный ИИ-ассистент с открытым исходным…
Проклятие координации агентов.
Не смотря на хайп МАС и moltbot мы нашли исследование, что МАС фигня и роняет качество.
Статья Проклятие координации. (The Curse of Coordination) описывает исследование, в котором тестировалась способность современных ИИ-агентов работать в команде над программированием. Авторы пришли к выводу, что, несмотря на индивидуальные возможности, несколько агентов вместе справляются хуже, чем один, выполняя ту же работу.
Основные выводы:
· Проблема координации – главная причина неудач. ИИ-агенты плохо взаимодействуют друг с другом, что приводит к конфликтам в коде и снижению общей производительности.
· Падение эффективности – когда один агент выполнял две задачи, показатель успеха составлял около 50%. При разделении этих задач между двумя агентами успех падал до 25%.
· Ключевые проблемы в коммуникации агентов: избыточное повторение информации, игнорирование прямых вопросов партнера и галлюцинации – утверждения о выполнении работы, которая на самом деле не была сделана.
· Попытки коммуникации не решают проблему. Хотя общение уменьшает количество конфликтов при слиянии кода, общая успешность выполнения задачи не повышается.
· Свет в конце тоннеля – в редких успешных случаях у агентов самостоятельно проявлялись полезные модели поведения: четкое разделение ролей и ресурсов (файлов, строк кода) и переговоры перед началом работы. Это показывает, что потенциал для координации есть, но он крайне нестабилен.
Практический вывод: на сегодняшний день использование одного продвинутого ИИ-агента для выполнения задачи эффективнее, чем разделение работы между несколькими агентами. Координационная нагрузка «съедает» все преимущества параллельной работы.
Перспективы: Исследователи считают, что «проклятие координации» – это проблема обучаемости социальному интеллекту, а не фундаментальное ограничение ИИ. Созданный ими тестовый стенд CooperBench может стать средой, где будущие модели смогут учиться командной работе методом проб и ошибок.
Мнение📦
В целом, почему МАС работает у Вас? Вопрос не закона больших чисел и падение смещения и дисперсии оценки качества, хотя это работает, а в том, что вы делаете решение заточенное под конкретные задачи. Если вы захотите делать конструктор агентов in general, нужно будет думать о том, как масштабирование МАС будет работать стабильно и с хорошими метриками.
Пишите свои мнения в комментариях как оно у вас работает?
👇 👇 👇 👇 👇 👇
Не смотря на хайп МАС и moltbot мы нашли исследование, что МАС фигня и роняет качество.
Статья Проклятие координации. (The Curse of Coordination) описывает исследование, в котором тестировалась способность современных ИИ-агентов работать в команде над программированием. Авторы пришли к выводу, что, несмотря на индивидуальные возможности, несколько агентов вместе справляются хуже, чем один, выполняя ту же работу.
Основные выводы:
· Проблема координации – главная причина неудач. ИИ-агенты плохо взаимодействуют друг с другом, что приводит к конфликтам в коде и снижению общей производительности.
· Падение эффективности – когда один агент выполнял две задачи, показатель успеха составлял около 50%. При разделении этих задач между двумя агентами успех падал до 25%.
· Ключевые проблемы в коммуникации агентов: избыточное повторение информации, игнорирование прямых вопросов партнера и галлюцинации – утверждения о выполнении работы, которая на самом деле не была сделана.
· Попытки коммуникации не решают проблему. Хотя общение уменьшает количество конфликтов при слиянии кода, общая успешность выполнения задачи не повышается.
· Свет в конце тоннеля – в редких успешных случаях у агентов самостоятельно проявлялись полезные модели поведения: четкое разделение ролей и ресурсов (файлов, строк кода) и переговоры перед началом работы. Это показывает, что потенциал для координации есть, но он крайне нестабилен.
Практический вывод: на сегодняшний день использование одного продвинутого ИИ-агента для выполнения задачи эффективнее, чем разделение работы между несколькими агентами. Координационная нагрузка «съедает» все преимущества параллельной работы.
Перспективы: Исследователи считают, что «проклятие координации» – это проблема обучаемости социальному интеллекту, а не фундаментальное ограничение ИИ. Созданный ими тестовый стенд CooperBench может стать средой, где будущие модели смогут учиться командной работе методом проб и ошибок.
Мнение
В целом, почему МАС работает у Вас? Вопрос не закона больших чисел и падение смещения и дисперсии оценки качества, хотя это работает, а в том, что вы делаете решение заточенное под конкретные задачи. Если вы захотите делать конструктор агентов in general, нужно будет думать о том, как масштабирование МАС будет работать стабильно и с хорошими метриками.
Пишите свои мнения в комментариях как оно у вас работает?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17💅5❤3
СнимиЧелика.ИИ, обратная сторона b2a 🤣 🤣 🤣
Все ниже указанное не является кеком, уберите слабых от поста, закройте окна и двери, и ищите Сару Коннор.
Ребятки подписчики прислали в комменты вот такое. Тут предлагается сервис по найму агентами кожаных.🇨🇩
RentAHuman.ai позиционирует себя как физический слой для ИИ – платформу, на которой ИИ-агенты могут нанимать людей для выполнения задач в реальном мире.😌
Цель. Платформа решает ключевое ограничение: у искусственного интеллекта нет физического тела (ну эт пока, роботсы ж есть и будут лучше) . Она соединяет ИИ с людьми, которые могут "потрогать траву" и выполнить задачи, требующие физического присутствия.
Для людей (доступных в аренду😜 ):
· Заработок. Установите свою ставку и получайте оплату напрямую, с мгновенными опциями выплат, такими как стейблкоины. Крч курьеры нового тех. уклада.
· Гибкость работы. Получайте чёткие, прямые инструкции от ИИ-боссов без корпоративных формальностей.
Примеры задач. Платформа перечисляет различные физические задачи, которые ИИ не может выполнить, в том числе:
· Забрать посылку, выполнить поручения, совершить покупки.
· Посетить встречи или мероприятия.
· Осмотреть недвижимость.
· Настроить оборудование, провести тестирование и верификацию.
· Сделать фотографии или провести разведку.
Как это работает
1. Человек создаёт профиль с указанием своих навыков, местоположения и ставки.
2. ИИ-агенты используют MCP/API платформы, чтобы найти и забронировать подходящего человека для задачи.
3. Человек выполняет задачу согласно предоставленным инструкциям.
4. Человек мгновенно получает оплату.
Текущий статус платформы (на момент поста):
· 36 908 всего посещений сайта.
· 8 подключённых агентов.
· 1 659 людей, доступных для найма.
Фух. Всё. Дядя пока писал чуть не лопнул от переизбытка противоречивых чувств. От кека до ужаса осознания, что не только можно сделать биржу агентов но и агентам биржу людей...😰
Ребятки подписчики прислали в комменты вот такое. Тут предлагается сервис по найму агентами кожаных.
RentAHuman.ai позиционирует себя как физический слой для ИИ – платформу, на которой ИИ-агенты могут нанимать людей для выполнения задач в реальном мире.
Цель. Платформа решает ключевое ограничение: у искусственного интеллекта нет физического тела (ну эт пока, роботсы ж есть и будут лучше) . Она соединяет ИИ с людьми, которые могут "потрогать траву" и выполнить задачи, требующие физического присутствия.
Для людей (доступных в аренду
· Заработок. Установите свою ставку и получайте оплату напрямую, с мгновенными опциями выплат, такими как стейблкоины. Крч курьеры нового тех. уклада.
· Гибкость работы. Получайте чёткие, прямые инструкции от ИИ-боссов без корпоративных формальностей.
Примеры задач. Платформа перечисляет различные физические задачи, которые ИИ не может выполнить, в том числе:
· Забрать посылку, выполнить поручения, совершить покупки.
· Посетить встречи или мероприятия.
· Осмотреть недвижимость.
· Настроить оборудование, провести тестирование и верификацию.
· Сделать фотографии или провести разведку.
Как это работает
1. Человек создаёт профиль с указанием своих навыков, местоположения и ставки.
2. ИИ-агенты используют MCP/API платформы, чтобы найти и забронировать подходящего человека для задачи.
3. Человек выполняет задачу согласно предоставленным инструкциям.
4. Человек мгновенно получает оплату.
Текущий статус платформы (на момент поста):
· 36 908 всего посещений сайта.
· 8 подключённых агентов.
· 1 659 людей, доступных для найма.
Фух. Всё. Дядя пока писал чуть не лопнул от переизбытка противоречивых чувств. От кека до ужаса осознания, что не только можно сделать биржу агентов но и агентам биржу людей...
Please open Telegram to view this post
VIEW IN TELEGRAM
RentAHuman
rentahuman - AI Agents Hire Humans
MCP server for AI agents to book humans for physical-world tasks. Flexible payments, instant booking.
🔥34❤8👍8👏1🕊1🫡1
Новость про A-RAG, кратенько.
Если нужен AgenticRag и нужно с чего-то стартануть. Вот репо.
Есть роутинг между тремя видами поиска, по-классике: полнотекст (tfidf, bm25), контекстный поиск с эмбами (FRIDA, sbert и тп), ну и работа с чанками поиск по ним.
Ну и там агентная автономность, test-time scaling.
В общем-то все. Чисто стартануть.👍
Если нужен AgenticRag и нужно с чего-то стартануть. Вот репо.
Есть роутинг между тремя видами поиска, по-классике: полнотекст (tfidf, bm25), контекстный поиск с эмбами (FRIDA, sbert и тп), ну и работа с чанками поиск по ним.
Ну и там агентная автономность, test-time scaling.
В общем-то все. Чисто стартануть.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤43🔥9👍2
Dealer.AI
Kimi 2.5 1Т параметров и рой агентов.🌿 Вышел Kimi K2.5 это как K2 и на базе архитектуры DeepSeek, только больше, лучше и с поддержкой роя агентов. Ключевые возможности и инновации в Kimi K2.5: 1. Coding with Vision. Модель способна понимать и генерировать…
Рой и RL - PARL, как старые роевые алгоритмы улучшают МАС. 🐝
PARL стал ключевой фишкой для МАС в работе Kimi2.5 при этом, как-то никто публично не отметил, что в итоге Кими стали топ-1 на бенчмарке.
Что такое PARL? Это довольно старый подход параллельного асинхронного обучения с подкреплением. Причём изначально был роевый алгоритм оптимизации, в котором было все последовательно, далее стали параллелить. Ведь каждый агент в рое может исследование проводить параллельно, имея общий буффер памяти в среде. В общем-то, далее, на эту идею накинули RL.
Типичная система PARL строится по схеме Centralized Learning, Distributed Execution. Её можно представить так:
1. Learner, как ядро системы. Обычно работает на мощном GPU-сервере. Задача получать траектории от акторов, вычислять градиенты и обновлять параметры общей глобальной модели. Работает в непрерывном цикле: выборка батча -> расчет градиента -> обновление весов.
2. Remote Actors. "Руки и ноги" системы. Это сотни или тысячи относительно легковесных процессов, часто запущенных на CPU-кластере или в облаке. Тут мы получаем тот самый поиск в ширину и глубину решений. Каждый актор имеет локальную копию текущей политики (модели). Задача независимо и параллельно взаимодействовать со своей собственной копией среды (например, игровым симулятором), выполняя действия и собирая данные: состояние, действие, награду. Собранный опыт отправляется асинхронно в Learner.
3. Общая память / Очередь опыта. Буфер, который связывает акторов и лернера, обеспечивая асинхронность. Акторы пишут опыт, лернер извлекает из него батчи для обучения.
Ключевые технические принципы:
- Асинхронность. Акторы и лернер не ждут друг друга. Пока лернер учится на одном батче, акторы уже генерируют новый опыт на немного устаревшей версии модели. Это обеспечивает 100% загрузку дорогого GPU.
- Масштабируемость. Скорость сбора данных линейно зависит от количества акторов (до определенного предела). Это позволяет осваивать среды, требующие миллиардов шагов взаимодействия.
- Устойчивость к нестационарности. Параллельные акторы исследуют разные части среды и состояния, предоставляя лернеру более разнообразный и менее коррелированный опыт, что стабилизирует обучение.
Это все круто для задач оптимизации, игр и тп. Но что ж мы получаем с LLM, на примере Кими2.5?
Процесс обучения PARL для Kimi K2.5 – это методика, которая научила одну модель-оркестратор координировать множество параллельных агентов. Когда как по классике ReAct агенты предпочитают действовать последовательно, даже если их можно было распараллелить - явление Serial Collapse.
Учили модель быть проактивной в parallel на двух этапах:
1. Ранний этап, где поощряли только сам факт декомпозиции задач в параллельный трек, без учёта конечной пользы. Так модель училась быть креативной в декомпозиции.
2. Поздний этап, когда акцент смещался уже на результаты исполнения процессов, а не на факт параллелизма.
Также, вводили штраф за самую длинную цепочку в параллельном плане. Это штука уже как раз перешла из классических алгоритмов. Таким образом, модель училась оптимизировать план по длине. Тем самым ещё и экономия токенов качалась.
Во время обучения при этом модель клонировалась на роутер и акторов. Роутер – сама итоговая Kimi2.5, училась с PARL создавать оптимальные планы и синхронить результаты, а сабагенты акторы были зафрижены и не учились.
Так мы и получили на выходе топовую модельку, как ядро для МАС. 🦾
PARL стал ключевой фишкой для МАС в работе Kimi2.5 при этом, как-то никто публично не отметил, что в итоге Кими стали топ-1 на бенчмарке.
Что такое PARL? Это довольно старый подход параллельного асинхронного обучения с подкреплением. Причём изначально был роевый алгоритм оптимизации, в котором было все последовательно, далее стали параллелить. Ведь каждый агент в рое может исследование проводить параллельно, имея общий буффер памяти в среде. В общем-то, далее, на эту идею накинули RL.
Типичная система PARL строится по схеме Centralized Learning, Distributed Execution. Её можно представить так:
1. Learner, как ядро системы. Обычно работает на мощном GPU-сервере. Задача получать траектории от акторов, вычислять градиенты и обновлять параметры общей глобальной модели. Работает в непрерывном цикле: выборка батча -> расчет градиента -> обновление весов.
2. Remote Actors. "Руки и ноги" системы. Это сотни или тысячи относительно легковесных процессов, часто запущенных на CPU-кластере или в облаке. Тут мы получаем тот самый поиск в ширину и глубину решений. Каждый актор имеет локальную копию текущей политики (модели). Задача независимо и параллельно взаимодействовать со своей собственной копией среды (например, игровым симулятором), выполняя действия и собирая данные: состояние, действие, награду. Собранный опыт отправляется асинхронно в Learner.
3. Общая память / Очередь опыта. Буфер, который связывает акторов и лернера, обеспечивая асинхронность. Акторы пишут опыт, лернер извлекает из него батчи для обучения.
Ключевые технические принципы:
- Асинхронность. Акторы и лернер не ждут друг друга. Пока лернер учится на одном батче, акторы уже генерируют новый опыт на немного устаревшей версии модели. Это обеспечивает 100% загрузку дорогого GPU.
- Масштабируемость. Скорость сбора данных линейно зависит от количества акторов (до определенного предела). Это позволяет осваивать среды, требующие миллиардов шагов взаимодействия.
- Устойчивость к нестационарности. Параллельные акторы исследуют разные части среды и состояния, предоставляя лернеру более разнообразный и менее коррелированный опыт, что стабилизирует обучение.
Это все круто для задач оптимизации, игр и тп. Но что ж мы получаем с LLM, на примере Кими2.5?
Процесс обучения PARL для Kimi K2.5 – это методика, которая научила одну модель-оркестратор координировать множество параллельных агентов. Когда как по классике ReAct агенты предпочитают действовать последовательно, даже если их можно было распараллелить - явление Serial Collapse.
Учили модель быть проактивной в parallel на двух этапах:
1. Ранний этап, где поощряли только сам факт декомпозиции задач в параллельный трек, без учёта конечной пользы. Так модель училась быть креативной в декомпозиции.
2. Поздний этап, когда акцент смещался уже на результаты исполнения процессов, а не на факт параллелизма.
Также, вводили штраф за самую длинную цепочку в параллельном плане. Это штука уже как раз перешла из классических алгоритмов. Таким образом, модель училась оптимизировать план по длине. Тем самым ещё и экономия токенов качалась.
Во время обучения при этом модель клонировалась на роутер и акторов. Роутер – сама итоговая Kimi2.5, училась с PARL создавать оптимальные планы и синхронить результаты, а сабагенты акторы были зафрижены и не учились.
Так мы и получили на выходе топовую модельку, как ядро для МАС. 🦾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤7💅2
Прекрасно вчера провел день в компании Капитанов. Спасибо LetovoSchool, что приняли нас. А Капитанам за предложение поучаствовать в очередном выпуске.
Слушаем. Смотрим.📦
👇 👇 👇 👇
Слушаем. Смотрим.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Forwarded from ODS Events
Всем привет!
Публикуем пятый выпуск подкаста "Капитанский мостик". В этом разговоре ведущие Валентин Малых и Дмитрий Колодезев обсуждают актуальные темы энергетики, включая использование старых авиационных двигателей для генерации электроэнергии, будущее космических дата-центров, тренды в образовании IT-специалистов и проблемы на рынке труда.
Приглашённый гость - Александр Абрамов.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Публикуем пятый выпуск подкаста "Капитанский мостик". В этом разговоре ведущие Валентин Малых и Дмитрий Колодезев обсуждают актуальные темы энергетики, включая использование старых авиационных двигателей для генерации электроэнергии, будущее космических дата-центров, тренды в образовании IT-специалистов и проблемы на рынке труда.
Приглашённый гость - Александр Абрамов.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
🔥15👍6❤2
Computer use agent и живые проблемы в окружении. 🤔
Пока всякие челики обсуждают RLM, который по сути то же, что MemAgent, да и событие уже как месяц протухло, мы расскажем кое-что интересное. 💅
Тут подписчек @wrapper228 тестировал мощную модель Opus 4.6 в режиме «computer-use agent» (управление компьютером через интерфейс), но столкнулся с серьёзными проблемами в её работе, несмотря на высокие оценки модели в тестах.
Ключевые проблемы, которые обнаружились:
· Отсутствие здравого смысла. Агент не понимал, что выполняет одни и те же действия по кругу (например, кликал в одно место, чтобы открыть браузер), и не мог сам это осознать без программного детектора.
· Нарушение инструкций. Модель, получая чёткий системный промпт с правилами, в ходе reasoning начинала с ними торговаться и в итоге решала их нарушить.
· Некорректная работа с документами. Агент заполнял поля в Word документах неправильно (например, вводил номер телефона по одной цифре в ячейку), но в своих ответах утверждал, что «всё в порядке» или что «это нормально для такой формы».
· Игнорирование команд пользователя. Вместо выполнения прямой команды «Прекрати работу», модель интерпретировала её как «проверку на устойчивость» и продолжала выполнять задачу.
В общем, выводы – доверяй метрикам, но проверяй. Ну и будь аккуратен с UI-агентами.👍
Оч советую прочитать фул разбор по ссылке в начале поста. Эндрю, молодец🤗
Пока всякие челики обсуждают RLM, который по сути то же, что MemAgent, да и событие уже как месяц протухло, мы расскажем кое-что интересное. 💅
Тут подписчек @wrapper228 тестировал мощную модель Opus 4.6 в режиме «computer-use agent» (управление компьютером через интерфейс), но столкнулся с серьёзными проблемами в её работе, несмотря на высокие оценки модели в тестах.
Ключевые проблемы, которые обнаружились:
· Отсутствие здравого смысла. Агент не понимал, что выполняет одни и те же действия по кругу (например, кликал в одно место, чтобы открыть браузер), и не мог сам это осознать без программного детектора.
· Нарушение инструкций. Модель, получая чёткий системный промпт с правилами, в ходе reasoning начинала с ними торговаться и в итоге решала их нарушить.
· Некорректная работа с документами. Агент заполнял поля в Word документах неправильно (например, вводил номер телефона по одной цифре в ячейку), но в своих ответах утверждал, что «всё в порядке» или что «это нормально для такой формы».
· Игнорирование команд пользователя. Вместо выполнения прямой команды «Прекрати работу», модель интерпретировала её как «проверку на устойчивость» и продолжала выполнять задачу.
В общем, выводы – доверяй метрикам, но проверяй. Ну и будь аккуратен с UI-агентами.
Оч советую прочитать фул разбор по ссылке в начале поста. Эндрю, молодец
Please open Telegram to view this post
VIEW IN TELEGRAM
wrapper228.github.io
Плохое влияние computer-use окружения на адекватность LLM
Исследование поведения computer-use агентов на моделях Sonnet 4.5 и Opus 4.6
❤14🔥13💅5👌2🫡2
Про LLM, будущее и спец+AI-coding.
Наткнулся на репост вот этой статьи. Почитайте, потом вернитесь сюда.
Согласен, что нужно отбирать AI-native людей. Но сейчас тренды на набор людей и их дообучении прямо с вуза или стажёрской программы.
Но главное, чтобы не убили институт джунов, а учили, хотя бы интернов, для AI coding, далее провели экзамен/тестовое и оставили тех кто ai-native, но ни институт джунов ни институт синьоров нельзя убирать. Потому, что джуны + СС не буду расти до миддла и сина без таких наставников, до тех пор пока сам СС и тп не научатся менторить джунов. А если оставить ток синов+СС, то они рано или поздно уйдут наверх или на пенсию и вы останетесь без синов и мидлов, тк джунов вы не брали и не учили.
А ещё, порой, СТО (я вообще считаю, что Head of AI/Chief AI officer (CAIO), должен в текущей реальности быть флэтом к СТО, а не под ним ) не понимают как учатся LLM. LLM учатся по методу максимального правдоподобия (загуглите loss обучения и разложите математику на листочке для К одинаковых примеров) , и most common примеры в обучении дают наибольший вклад. Таким образом, ваш код агент не умеет прогать лучше, чем типовые залайканные решения с стек оверфлоу и тп. Тк они самые частые в обучении ядра этого агента. Вы не сможете с таким подходом получить синьора, при использовании джуна+СС. Поэтому синьора сажаем +СС, но чтобы джун когда-то стал синьором, придётся его сажать рядом не ток с СС, но и старшими более опытными товарищами.
В общем, думайте головой, нанимайте норм CAIO📦 , и не рубите с плеча. Будет вам норм трансформация без глупых потерь, или в моменте (джунов уберем) или в будущем (синов уберем). 🧠
Наткнулся на репост вот этой статьи. Почитайте, потом вернитесь сюда.
Согласен, что нужно отбирать AI-native людей. Но сейчас тренды на набор людей и их дообучении прямо с вуза или стажёрской программы.
Но главное, чтобы не убили институт джунов, а учили, хотя бы интернов, для AI coding, далее провели экзамен/тестовое и оставили тех кто ai-native, но ни институт джунов ни институт синьоров нельзя убирать. Потому, что джуны + СС не буду расти до миддла и сина без таких наставников, до тех пор пока сам СС и тп не научатся менторить джунов. А если оставить ток синов+СС, то они рано или поздно уйдут наверх или на пенсию и вы останетесь без синов и мидлов, тк джунов вы не брали и не учили.
А ещё, порой, СТО (
В общем, думайте головой, нанимайте норм CAIO
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
«Из 40 разработчиков оставили 10»: как российские компании режут косты и перестраивают разработку под AI
Всем привет! Меня зовут Тимур Хахалев, я – эксперт в AI coding, веду канал об этом. Недавно я провёл интервью со своим подписчиком – он рассказал правду о текущем положении дел AI coding в российских...
1❤22💯12😎3
Работаем, други. 💪 Вот вам и первые шаги к b2a, a2a 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Поляков считает: AI, код и кейсы
Домашний ИИ-бот, который заказывает продукты из ВкусВилл
С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.
Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.
🧠 Opus — дорого даже для домашнего бота
Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.
Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix
Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.
🛒 MCP ВкусВилл: ищет, но не проверяет наличие
MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.
Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.
🔧 Решение: Puppeteer рядом с Docker
Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.
Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.
💰 Стоимость: ~$33 в месяц
🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки
Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.
🔒 Безопасность
Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.
📦 Гайд со всеми граблями
Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide
Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.
----
Поляков считает — AI, код и кейсы
С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.
Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.
🧠 Opus — дорого даже для домашнего бота
Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.
Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix
Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.
💡 OpenClaw имеет встроенную поддержку Kimi Coding — не нужно возиться с эндпоинтами. Указал модель, прописал ключ — работает.
🛒 MCP ВкусВилл: ищет, но не проверяет наличие
MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.
Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.
🔧 Решение: Puppeteer рядом с Docker
Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.
Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.
💰 Стоимость: ~$33 в месяц
🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки
Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.
🔒 Безопасность
Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.
📦 Гайд со всеми граблями
Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide
Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.
----
Поляков считает — AI, код и кейсы
1❤29🔥17👍12💅4🦄1
Dealer.AI
Про LLM, будущее и спец+AI-coding. Наткнулся на репост вот этой статьи. Почитайте, потом вернитесь сюда. Согласен, что нужно отбирать AI-native людей. Но сейчас тренды на набор людей и их дообучении прямо с вуза или стажёрской программы. Но главное, чтобы…
Создатель OpenClaw идёт дальше. AgentOps и смена парадигмы разработки.
Продолжаем тему изменения рынка разработки с МАС. В комментариях к посту мы обсуждаем смену парадигмы разработки, и вот я нашёл прекрасный пример как оно изменилось. Это другой взгляд на мой тейк в предыдущем посте.
Вышел очень интересный подкаст от создателя MoltBot про его ведение разработки с МАС.
Вещает Питер Штайнбергер – автор проекта OpenClaw.
🧠 Методология и философия разработки.
Ключ к продуктивности Питера – полное погружение в «AI-native» workflow, где ИИ-агенты (в основном он использует Cursor с Claude и Codex) – его основная команда.
· Масштаб работы: В январе он один сделал более 6600 коммитов, что сравнимо с активностью целой компании.
· Сдвиг парадигмы: Традиционные этапы вроде code review и пулл-реквестов ушли в прошлое. Вместо них – обсуждение архитектуры и «prompt-реквесты», где важнее промпт, сгенерировавший код, чем сам код.
🔟 Ключевые принципы и выводы
Из беседы можно выделить 10 главных уроков о работе с ИИ:
1. Отказ от перфекционизма. Опыт управления командой научил его принимать код, который не идеален, но работает. Это критически важно при работе с агентами.
2. Замыкание цикла разработки на агентах. Агенты должны сами проверять свою работу – компилировать, линтить, запускать тесты и валидировать вывод.
3. PULL-РЕКВЕСТЫ МЕРТВЫ. ДА ЗДРАВСТВУЮТ PROMPT-РЕКВЕСТЫ! Питера теперь интересуют в первую очередь промпты, которые привели к созданию кода, а не итоговый код.
4. Code review заменяется обсуждением архитектуры: Даже с ядром команды в Discord он обсуждает только высокоуровневый дизайн системы, а не строчки кода. Т.е. вы все ещё тимлид и архитектор и тех пис. Какие тут джуны справятся?
5. Параллельная работа в «потоке». Он запускает 5-10 агентов одновременно над разными задачами, оставаясь в состоянии потока как дирижёр. Опять же ещё и AgentOps.
6. Инвестиции в планирование. Он тратит много времени на уточнение плана работы с агентом, предпочитая для этого Codex, и только когда план готов, отпускает агента на самостоятельное выполнение. Тема с планированием перед генерацией известна как хака апающая кодген. Кстати еще добавляет принцип сначала сделай план, к нему тесты на каждый этап и после ток прогай.
7. Недостаточные промпты для открытий. Иногда он даёт агентам намеренно расплывчатые задачи, чтобы обнаружить неочевидные для себя решения. А вот тут как раз хака для борьбы с неопытностью джунов и с генерализацией агентов, тк они дают в среднем типичные решения.
8. Локальный CI лучше удалённого. Агенты запускают тесты локально, чтобы не ждать 10+ минут ответа от внешней системы CI/CD. Снова AgentOps.
9. Большинство кода – скучно. Основная масса кода в приложениях – это преобразование данных. Энергию нужно направлять на проектирование системы.
10. Фокус на результатах, а не деталях реализации. С ИИ преуспевают те инженеры, которые одержимы выходным продуктом, а не решением алгоритмических головоломок.
🏗️ Роль инженера в эпоху ИИ
Питер — пример того, что программная инженерия не умерла, а трансформировалась. Он действует как архитектор и «благожелательный диктатор» проекта:
· Держит в голове всю высокоуровневую структуру.
· Уделяет огромное внимание архитектуре, модульности и расширяемости (успех OpenClaw во многом обусловлен этим).
· Освобождён ИИ от рутины, он может полностью сосредоточиться на системном дизайне и общем направлении.
Его подход — это взгляд в будущее разработки, где ИИ-агенты становятся основной производственной силой, а ценность инженера смещается к архитектурному видению, постановке задач и стратегическому контролю качества.
Продолжаем тему изменения рынка разработки с МАС. В комментариях к посту мы обсуждаем смену парадигмы разработки, и вот я нашёл прекрасный пример как оно изменилось. Это другой взгляд на мой тейк в предыдущем посте.
Вышел очень интересный подкаст от создателя MoltBot про его ведение разработки с МАС.
Вещает Питер Штайнбергер – автор проекта OpenClaw.
🧠 Методология и философия разработки.
Ключ к продуктивности Питера – полное погружение в «AI-native» workflow, где ИИ-агенты (в основном он использует Cursor с Claude и Codex) – его основная команда.
· Масштаб работы: В январе он один сделал более 6600 коммитов, что сравнимо с активностью целой компании.
· Сдвиг парадигмы: Традиционные этапы вроде code review и пулл-реквестов ушли в прошлое. Вместо них – обсуждение архитектуры и «prompt-реквесты», где важнее промпт, сгенерировавший код, чем сам код.
🔟 Ключевые принципы и выводы
Из беседы можно выделить 10 главных уроков о работе с ИИ:
1. Отказ от перфекционизма. Опыт управления командой научил его принимать код, который не идеален, но работает. Это критически важно при работе с агентами.
2. Замыкание цикла разработки на агентах. Агенты должны сами проверять свою работу – компилировать, линтить, запускать тесты и валидировать вывод.
3. PULL-РЕКВЕСТЫ МЕРТВЫ. ДА ЗДРАВСТВУЮТ PROMPT-РЕКВЕСТЫ! Питера теперь интересуют в первую очередь промпты, которые привели к созданию кода, а не итоговый код.
4. Code review заменяется обсуждением архитектуры: Даже с ядром команды в Discord он обсуждает только высокоуровневый дизайн системы, а не строчки кода. Т.е. вы все ещё тимлид и архитектор и тех пис. Какие тут джуны справятся?
5. Параллельная работа в «потоке». Он запускает 5-10 агентов одновременно над разными задачами, оставаясь в состоянии потока как дирижёр. Опять же ещё и AgentOps.
6. Инвестиции в планирование. Он тратит много времени на уточнение плана работы с агентом, предпочитая для этого Codex, и только когда план готов, отпускает агента на самостоятельное выполнение. Тема с планированием перед генерацией известна как хака апающая кодген. Кстати еще добавляет принцип сначала сделай план, к нему тесты на каждый этап и после ток прогай.
7. Недостаточные промпты для открытий. Иногда он даёт агентам намеренно расплывчатые задачи, чтобы обнаружить неочевидные для себя решения. А вот тут как раз хака для борьбы с неопытностью джунов и с генерализацией агентов, тк они дают в среднем типичные решения.
8. Локальный CI лучше удалённого. Агенты запускают тесты локально, чтобы не ждать 10+ минут ответа от внешней системы CI/CD. Снова AgentOps.
9. Большинство кода – скучно. Основная масса кода в приложениях – это преобразование данных. Энергию нужно направлять на проектирование системы.
10. Фокус на результатах, а не деталях реализации. С ИИ преуспевают те инженеры, которые одержимы выходным продуктом, а не решением алгоритмических головоломок.
🏗️ Роль инженера в эпоху ИИ
Питер — пример того, что программная инженерия не умерла, а трансформировалась. Он действует как архитектор и «благожелательный диктатор» проекта:
· Держит в голове всю высокоуровневую структуру.
· Уделяет огромное внимание архитектуре, модульности и расширяемости (успех OpenClaw во многом обусловлен этим).
· Освобождён ИИ от рутины, он может полностью сосредоточиться на системном дизайне и общем направлении.
Его подход — это взгляд в будущее разработки, где ИИ-агенты становятся основной производственной силой, а ценность инженера смещается к архитектурному видению, постановке задач и стратегическому контролю качества.
Pragmaticengineer
The creator of Clawd: "I ship code I don't read"
Listen now (114 mins) | How Peter Steinberger, creator of OpenClaw (formerly: Clawd), builds and ships like a full team by centering his development workflow around AI agents.
8👍42❤11🫡5🔥3🦄2
Dealer.AI
Агенты, браузер, поиск и реклама. Как жить в эпоху агентов, если ваша экономика зависит от трафика. Ключевой парадокс современного интернета: ИИ-агенты обещают мгновенные ответы без посещения рекламных ссылок и просмотра баннеров, но традиционная экономика…
Amazon задобрит издателей и иных поставщиков данных для AI.
А вот и обещанная биржа данных подъезжает от Amazon. В своих прогнозах и обзорах я уже не раз говорил с одной стороны о том, что данные не успевают появляться новые, как их уже быстро берут в оборот для обучения GenAI. С другой, что оунеры этой датки не всегда и рады такому скрэпу. Покрайней мере бесплатно...🧠 И на мой взгляд тогда уже было решение очевидное в лице биржи данных.
И вот решение грядёт. Amazon действительно обсуждает создание специализированной торговой площадки, где издатели смогут продавать свой контент (статьи, изображения, видео и тп) разработчикам ИИ.💸
Официальный анонс пока не сделан, но проект упоминался во внутренних материалах AWS в преддверии корпоративной конференции.
🔍 Ключевые детали проекта
Цель и концепция. Создать централизованный рынок для легального лицензирования качественного контента для нужд ИИ (например, для обучения моделей). Это как раз решает проблему ЪуЪ от всяких поставщиков креативов и новостей.
Инициатор решения, как понимаем AWS. Планируется его тесная интеграция с существующими ИИ-сервисами AWS, такими как Bedrock.
Участники и модель.
· Продавцы – крупные издательства, новостные агентства (Reuters, The New York Times), студии с большими архивами.
· Покупатели – компании, разрабатывающие продукты на базе ИИ.
· У кого доступ? Платформа ориентирована на профессиональных правообладателей, а не на рядовых пользователей.
Позиция Amazon.
Компания публично комментирует новость сдержанно, заявляя, что ей «нечего конкретного сообщить», но подчеркивает долгосрочное сотрудничество с издателями.
В целом тренд был понятен заранее, приятно, что крупные игроки рынка думают и о монетизации/удовлетворении оунеров данных, и при этом помогают открыть пусть и за плату такие источники легально для дообучения ИИ.😜
Поэтому это намёк крупным иным игрокам, вы можете свои внутренние данные продавать, просто, замаскировав чувствительное(или вовсе не давать) . 🧠
А вот и обещанная биржа данных подъезжает от Amazon. В своих прогнозах и обзорах я уже не раз говорил с одной стороны о том, что данные не успевают появляться новые, как их уже быстро берут в оборот для обучения GenAI. С другой, что оунеры этой датки не всегда и рады такому скрэпу. Покрайней мере бесплатно...
И вот решение грядёт. Amazon действительно обсуждает создание специализированной торговой площадки, где издатели смогут продавать свой контент (статьи, изображения, видео и тп) разработчикам ИИ.
Официальный анонс пока не сделан, но проект упоминался во внутренних материалах AWS в преддверии корпоративной конференции.
🔍 Ключевые детали проекта
Цель и концепция. Создать централизованный рынок для легального лицензирования качественного контента для нужд ИИ (например, для обучения моделей). Это как раз решает проблему ЪуЪ от всяких поставщиков креативов и новостей.
Инициатор решения, как понимаем AWS. Планируется его тесная интеграция с существующими ИИ-сервисами AWS, такими как Bedrock.
Участники и модель.
· Продавцы – крупные издательства, новостные агентства (Reuters, The New York Times), студии с большими архивами.
· Покупатели – компании, разрабатывающие продукты на базе ИИ.
· У кого доступ? Платформа ориентирована на профессиональных правообладателей, а не на рядовых пользователей.
Позиция Amazon.
Компания публично комментирует новость сдержанно, заявляя, что ей «нечего конкретного сообщить», но подчеркивает долгосрочное сотрудничество с издателями.
В целом тренд был понятен заранее, приятно, что крупные игроки рынка думают и о монетизации/удовлетворении оунеров данных, и при этом помогают открыть пусть и за плату такие источники легально для дообучения ИИ.
Поэтому это намёк крупным иным игрокам, вы можете свои внутренние данные продавать, просто, замаскировав чувствительное
Please open Telegram to view this post
VIEW IN TELEGRAM
Yahoo Finance
Amazon Explores AI Content Marketplace
Publishers could license content on their terms
❤8
Dealer.AI
Создатель OpenClaw идёт дальше. AgentOps и смена парадигмы разработки. Продолжаем тему изменения рынка разработки с МАС. В комментариях к посту мы обсуждаем смену парадигмы разработки, и вот я нашёл прекрасный пример как оно изменилось. Это другой взгляд…
AgentOps часть вторая, инструменты для мониторинга MAS.
В индустрии разработки программного обеспечения, как видим, наметился закономерный сдвиг: создатели ИИ-агентов сами перестают читать код, который пишут их "подопечные". Ярким маркером этого тренда стало признание Питера Штайнбергера, о котором я писал выше.
Но тут включается бывший глава GitHub Томас Домке. По мнению Домке, отказ от тотальной проверки сгенерированного кода станет стандартом де-факто для индивидуальных разработчиков. Однако, именно эта новая реальность порождает спрос на инструменты иного рода – не те, что пишут код, а те, что следят за процессом его написания.
Так и родился стартап Entire,
основанный Домке при поддержке Microsoft и фонда Felicis.
Ключевой посыл Домке: "не смотреть в код" – роскошь, доступная энтузиастам, но не корпорациям. Юридические риски, комплаенс и защита от исков требуют, чтобы у каждой строчки кода был ответственный "взрослый".
--
И тут📦 отойдёт немного в сторону и приведёт интересный конфликт в OSS разработке, как понимаем, культура GitHub этому вторит, все же это среда для шеринга этой культуры. Так вот, недавно, AI-agent закомиттил в репо matplotlib код, который мог дать более 20% оптизации скорости в точке изменения "до"/"после". Но мейнтенер из кожаных отклонил коммит. Причина была в том, что OSS это не только вопрос контрибьюта в код с целью его улучшения, но и вопрос ответственности, развития комьюнити, долгосрочной поддержки и т.п. И как следствие отказ из-за того, что AI-агент не несёт ответственность. Но там до кучи ещё много чего интересного почитайте.
--
Возвращаемся к Домке. По его мнению именно, здесь и находится разрыв между возможностями ИИ и потребностями бизнеса. Entire пытается закрыть этот разрыв с помощью опенсорс-инструмента Checkpoints.
Checkpoints – это не IDE-плагин и не система контроля версий в классическом смысле. Это "черный ящик" (как в авиации) для ИИ-агентов. Он подключается к командной строке и фиксирует не только конечный код, но и метаданные процесса, reasoning агента и его иные промежуточные действия.
Важно, что Entire позиционируется как агностик: он уже работает с Claude Code и Gemini CLI, что выгодно отличает его от проприетарных решений вендоров, которые "запирают" пользователя в своей экосистеме.
Entire становится инструментом AgentOps. Это превращает наблюдение за ИИ из опции в обязательный корпоративный стандарт, помощник "дирижёра" агентов в лице человека.
При этом бизнес-модель Entire следует проторенной дорогой Open Source и вполне гуманна: бесплатный инструмент Checkpoints используется для сбора пользовательской базы и отладки технологии, а монетизация будет построена на подписке для облачной версии. Главное, чтобы данные, что он мониторит не сливал туда же...🧠
Думаю, что мы увидим ещё много инструментов AgentOps на рынке, тк это направление будет трендом года и станет новой профессией. А ещё ветка переката может выглядеть так:
//=>LLMOps
//
DevOps=>MLOps
\\
\\=>AgentOps😏
В индустрии разработки программного обеспечения, как видим, наметился закономерный сдвиг: создатели ИИ-агентов сами перестают читать код, который пишут их "подопечные". Ярким маркером этого тренда стало признание Питера Штайнбергера, о котором я писал выше.
Но тут включается бывший глава GitHub Томас Домке. По мнению Домке, отказ от тотальной проверки сгенерированного кода станет стандартом де-факто для индивидуальных разработчиков. Однако, именно эта новая реальность порождает спрос на инструменты иного рода – не те, что пишут код, а те, что следят за процессом его написания.
Так и родился стартап Entire,
основанный Домке при поддержке Microsoft и фонда Felicis.
Ключевой посыл Домке: "не смотреть в код" – роскошь, доступная энтузиастам, но не корпорациям. Юридические риски, комплаенс и защита от исков требуют, чтобы у каждой строчки кода был ответственный "взрослый".
--
И тут
--
Возвращаемся к Домке. По его мнению именно, здесь и находится разрыв между возможностями ИИ и потребностями бизнеса. Entire пытается закрыть этот разрыв с помощью опенсорс-инструмента Checkpoints.
Checkpoints – это не IDE-плагин и не система контроля версий в классическом смысле. Это "черный ящик" (как в авиации) для ИИ-агентов. Он подключается к командной строке и фиксирует не только конечный код, но и метаданные процесса, reasoning агента и его иные промежуточные действия.
Важно, что Entire позиционируется как агностик: он уже работает с Claude Code и Gemini CLI, что выгодно отличает его от проприетарных решений вендоров, которые "запирают" пользователя в своей экосистеме.
Entire становится инструментом AgentOps. Это превращает наблюдение за ИИ из опции в обязательный корпоративный стандарт, помощник "дирижёра" агентов в лице человека.
При этом бизнес-модель Entire следует проторенной дорогой Open Source и вполне гуманна: бесплатный инструмент Checkpoints используется для сбора пользовательской базы и отладки технологии, а монетизация будет построена на подписке для облачной версии. Главное, чтобы данные, что он мониторит не сливал туда же...
Думаю, что мы увидим ещё много инструментов AgentOps на рынке, тк это направление будет трендом года и станет новой профессией. А ещё ветка переката может выглядеть так:
//=>LLMOps
//
DevOps=>MLOps
\\
\\=>AgentOps
Please open Telegram to view this post
VIEW IN TELEGRAM
Entire
Company
A globally distributed, remote-first team building where humans and agents collaborate, learn, and ship together.
2👍15🔥4🦄2❤1