Йоу, народ! Время подводить итоги, и они в этот раз не только про карьеру и агентов
Этот год был просто безумным марафоном
Мы с вами выросли до 11000+ подписчиков!
А чат до 1200+!
Мы протестировали десятки PoC и нашли кучу багов!
Спасибо каждому, кто читает, комментит и пушит этот локомотив AI экспертизы вместе со мной
Под елку мы выкатили мощный апдейт SGR Agent Core v0.5.0!
Переписали архитектуру, стандартизировали конфиги, добавили кучу фич от комьюнити (спасибо @virrius, @EvilFreelancer, @MiXaiLL76 и всем контрибьюторам!)
Теперь это полноценный пакет sgr_agent_core
Это был долгий путь от идеи "агенты на коленке" до взрослого фреймворка
Полный чейнджлог, как всегда, на Гитхабе
Пока нейронки учились "думать", мой сын учился говорить
Ему уже 1.7, и в его контекстном окне уже 100+ слов! Это лучший LLM (Little Lovely Man) в моей жизни, который обучается быстрее любой H100
Каждый день новые веса и новые навыки
Ничего бы этого не было без моей жены
Она поддерживала меня больше всех и переживала за каждое мое выступление и событие, а их в этом году было немало, поверьте)
Когда падал прод или я готовился к конфам по ночам она была рядом
Люблю бесконечно
И отдельное спасибо ВАМ
За то, что поддерживаете новичков в чате, отвечаете на вопросы и генерите идеи
Вы формируете комьюнити, наше сообщество и культуру общения
Без вас этот канал был бы просто блогом, а с вами это экосистема
Врываемся в 2026 с новыми силами! Ставьте звездочки на репо(добьем 1к?), обнимайте близких ❤️
С Наступающим Новым годом!
Stay Tuned! ✨
Этот год был просто безумным марафоном
Мы с вами выросли до 11000+ подписчиков!
А чат до 1200+!
Мы протестировали десятки PoC и нашли кучу багов!
Спасибо каждому, кто читает, комментит и пушит этот локомотив AI экспертизы вместе со мной
Под елку мы выкатили мощный апдейт SGR Agent Core v0.5.0!
Переписали архитектуру, стандартизировали конфиги, добавили кучу фич от комьюнити (спасибо @virrius, @EvilFreelancer, @MiXaiLL76 и всем контрибьюторам!)
Теперь это полноценный пакет sgr_agent_core
Это был долгий путь от идеи "агенты на коленке" до взрослого фреймворка
Полный чейнджлог, как всегда, на Гитхабе
Пока нейронки учились "думать", мой сын учился говорить
Ему уже 1.7, и в его контекстном окне уже 100+ слов! Это лучший LLM (Little Lovely Man) в моей жизни, который обучается быстрее любой H100
Каждый день новые веса и новые навыки
Ничего бы этого не было без моей жены
Она поддерживала меня больше всех и переживала за каждое мое выступление и событие, а их в этом году было немало, поверьте)
Когда падал прод или я готовился к конфам по ночам она была рядом
Люблю бесконечно
И отдельное спасибо ВАМ
За то, что поддерживаете новичков в чате, отвечаете на вопросы и генерите идеи
Вы формируете комьюнити, наше сообщество и культуру общения
Без вас этот канал был бы просто блогом, а с вами это экосистема
Врываемся в 2026 с новыми силами! Ставьте звездочки на репо(добьем 1к?), обнимайте близких ❤️
С Наступающим Новым годом!
Stay Tuned! ✨
24🔥128❤60👍20💯4
Год начинается с ИИ фичей в Telegram
Началась раскатка новой фичи TL;DR по постам, наконец то лонгриды от Сиола можно будет читать все и не скипать, фича докататилась и до моего клиента на андроид, такой мув от telegram это часть возможностей Cocoon, на текущий момент есть не во всех клиентах
На мой взгляд на как сделали сейчас мы теряем очень много микротем которые связаны между абзацами (выглядит так что саммари идет именно по ним), а так же не отражает суть и стиль автора, модель конечно же выбрать нельзя, и настроить как-то тоже, вот она мощь Cocoon (ставлю на текущий момент огромный минус такой реализации, возможно будут улучшения, ждем)
Оригинал поста из LLM под капотом
Я считаю что есть и другие ИИ фичи которых так не хватает ТГ и которые можно было бы легко раскатать через тот же Cocoon допустим векторизировать все посты и давайть возможность искать похожие перед публикацией (очень полезно авторам)
В целом искать ниши или рекламные площадки более релевантно, всего-то надо будет развернуть с 10 000 инстансов emb моделей
Давайте накидаем кому это нужно и какую ценность несет?
Началась раскатка новой фичи TL;DR по постам, наконец то лонгриды от Сиола можно будет читать все и не скипать, фича докататилась и до моего клиента на андроид, такой мув от telegram это часть возможностей Cocoon, на текущий момент есть не во всех клиентах
These summaries use open-source AI models running on Cocoon – a decentralized network built by Telegram to maximize privacy
На мой взгляд на как сделали сейчас мы теряем очень много микротем которые связаны между абзацами (выглядит так что саммари идет именно по ним), а так же не отражает суть и стиль автора, модель конечно же выбрать нельзя, и настроить как-то тоже, вот она мощь Cocoon (ставлю на текущий момент огромный минус такой реализации, возможно будут улучшения, ждем)
Оригинал поста из LLM под капотом
Я считаю что есть и другие ИИ фичи которых так не хватает ТГ и которые можно было бы легко раскатать через тот же Cocoon допустим векторизировать все посты и давайть возможность искать похожие перед публикацией (очень полезно авторам)
В целом искать ниши или рекламные площадки более релевантно, всего-то надо будет развернуть с 10 000 инстансов emb моделей
Давайте накидаем кому это нужно и какую ценность несет?
1👍20❤6🤔3💯2
Начнем год стримом про агентные архитектуры: разбираем топ-3 решения ERC3!
В гостях Алексей (топ1) и Илья топ 2 (топ 1 локал)
Почитать что такое платформа ERC3 можно тут
Отдельное спасибо Ринату за его труды по ее созданию!
Короче, пока все праздновали новый год, я собрал победителей ERC3 на стрим
Лидерборд ERC3
Мы с вами строим агентов в РФ и всех волнует один вопрос: как строить агентов в продакшене когда у тебя нет Opus и половина API заблокирована?
Алексей взял первое место в общем зачете с результатом 71.8% на Opus 4.5 через Anthropic SDK
Архитектура простой ReAct 2022 года 20 тулов в контекст плюс 80 итераций эволюции промпта через трех агентов
Никаких графов, никаких оркестраторов
Просто методичная прокачка промпта под модель которая отлично умеет работать с тулами
Репо: Github
Илья в 2024 году занял первое место в ERC2(RAG), а в ERC3(Agent) первое место в локальном зачете и второе в общем с результатом 62.1% на gpt-oss-120b через Cerebras
Архитектура PlanReAct agent с набором вспомогательных техник
Локальная модель слабее Opus, значит архитектура компенсирует
И главное это локальная модель которую можно поднять на своем железе без зависимости от API
Репо: Github
Трейсы
Я занял третье место в локальном зачете с результатом 46.6% на Qwen3-235B локально на кластере из H100
Потратил три часа на сам таск, остальное время на настройку кластера
Базовый SGR Agent Core без validators и enrichment
Спустя две недели долелал улучшенную версию до 68.3% score
На стриме разберем практические вопросы:
Посмотрим овервью на архитектуры
Насколько тяжело было решить задачи?
Что бы сделали по другому?
Сколько реально времени потратили и сколько написали кода сами?
Куда понесете опыт и есть ли реальные продукты где применяете техники?
И главное как строить на локальных моделях в продакшене?
Почему все забывают про eval?
Для рынка РФ критично владеть локальным моделями потому что Opus нет, западные API блочат, риски по безопасности высоки и единственный реальный вариант локальные модели типа Qwen3 и gpt-oss
Приходите на стрим если хотите задать свой вопрос и увидеть живой разбор
Топ-1 общего на Opus через API плюс топ-1 и топ-3 локального на gpt-oss и Qwen
Практические вопросы, конкретные ответы, реальный опыт как строить на локальных и API моделях в продакшене
Дата и время 11.01.2026 в 11:00 по мск, стрим будет на ютуб/тг(запись будет)
Добавляйтесь в календарь чтобы не пропустить
В гостях Алексей (топ1) и Илья топ 2 (топ 1 локал)
Почитать что такое платформа ERC3 можно тут
Отдельное спасибо Ринату за его труды по ее созданию!
Короче, пока все праздновали новый год, я собрал победителей ERC3 на стрим
Лидерборд ERC3
Мы с вами строим агентов в РФ и всех волнует один вопрос: как строить агентов в продакшене когда у тебя нет Opus и половина API заблокирована?
Алексей взял первое место в общем зачете с результатом 71.8% на Opus 4.5 через Anthropic SDK
Архитектура простой ReAct 2022 года 20 тулов в контекст плюс 80 итераций эволюции промпта через трех агентов
Никаких графов, никаких оркестраторов
Просто методичная прокачка промпта под модель которая отлично умеет работать с тулами
Репо: Github
Илья в 2024 году занял первое место в ERC2(RAG), а в ERC3(Agent) первое место в локальном зачете и второе в общем с результатом 62.1% на gpt-oss-120b через Cerebras
Архитектура PlanReAct agent с набором вспомогательных техник
Локальная модель слабее Opus, значит архитектура компенсирует
И главное это локальная модель которую можно поднять на своем железе без зависимости от API
Репо: Github
Трейсы
Я занял третье место в локальном зачете с результатом 46.6% на Qwen3-235B локально на кластере из H100
Потратил три часа на сам таск, остальное время на настройку кластера
Базовый SGR Agent Core без validators и enrichment
Спустя две недели долелал улучшенную версию до 68.3% score
На стриме разберем практические вопросы:
Посмотрим овервью на архитектуры
Насколько тяжело было решить задачи?
Что бы сделали по другому?
Сколько реально времени потратили и сколько написали кода сами?
Куда понесете опыт и есть ли реальные продукты где применяете техники?
И главное как строить на локальных моделях в продакшене?
Почему все забывают про eval?
Для рынка РФ критично владеть локальным моделями потому что Opus нет, западные API блочат, риски по безопасности высоки и единственный реальный вариант локальные модели типа Qwen3 и gpt-oss
Приходите на стрим если хотите задать свой вопрос и увидеть живой разбор
Топ-1 общего на Opus через API плюс топ-1 и топ-3 локального на gpt-oss и Qwen
Практические вопросы, конкретные ответы, реальный опыт как строить на локальных и API моделях в продакшене
Дата и время 11.01.2026 в 11:00 по мск, стрим будет на ютуб/тг(запись будет)
Добавляйтесь в календарь чтобы не пропустить
YouTube
Агентные архитектуры: разбираем топ-3 решения ERC3!
В гостях Алексей (https://tg-me.sbs/aostrikov_ai_agents) (топ1)
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
6🔥53❤27👍14💯2
Валера Ковальский
Пост для вопросов
YouTube
Агентные архитектуры: разбираем топ-3 решения ERC3!
В гостях Алексей (https://tg-me.sbs/aostrikov_ai_agents) (топ1)
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
❤7
Валера Ковальский
Начнем год стримом про агентные архитектуры: разбираем топ-3 решения ERC3! В гостях Алексей (топ1) и Илья топ 2 (топ 1 локал) Почитать что такое платформа ERC3 можно тут Отдельное спасибо Ринату за его труды по ее созданию! Короче, пока все праздновали…
Агентные архитектуры: разбираем топ-3 решения ERC3!
Отдельное спасибо Алексею и Илье что нашли время и записали такой сочный видос со мной!
Вам спасибо за вопросы и коменты!
Выложил запись на ютуб
Рутуб идет загрузка!
https://www.youtube.com/watch?v=vGR5m-PURCc
Отдельное спасибо Алексею и Илье что нашли время и записали такой сочный видос со мной!
Вам спасибо за вопросы и коменты!
Выложил запись на ютуб
Рутуб идет загрузка!
https://www.youtube.com/watch?v=vGR5m-PURCc
YouTube
Агентные архитектуры: разбираем топ-3 решения ERC3!
В гостях Алексей (https://tg-me.sbs/aostrikov_ai_agents) (топ1)
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
2👍34🔥20❤11 5
Forwarded from Остриков пилит агентов
Плотные и потные январские
Траву (как и желтый снег) решил не трогать.
Это были одни из самых разрывных праздников, написано аж 3 (три) новых AI агента - отбиваем название канала
- вместе с маэстро @neuraldeep кодили ai-агента для Вкусвилл, было просто невозможно остановиться. Теперь умеет: собирать корзины по запросу "что-то для души", рассказывать про отдельные товары, слушать голосовухи, находить товары по фото, рассказывать рецепты, гнобить что вы жиробас и лучше бы побегали а не жрали. Пишет детальные трассировки в LangFuse, дикпики просьба не слать, найдем по апи, забаним - не для этого Антропик свои модели делал
Но самый сок конечно кодить с Валерой вместе - сижу я такой, запилил агента, радуюсь на свою прелесть. Заходит Валера - "О щас сделаем красиво!". 15 мин и готов голосой ввод. Еще 15 мин и готова работа с фото. Хоп хоп, красивая структура репо, красивые конфиги, все запаковано в докер и развернуто. Сидишь потом и думаешь - это че вообще было... Опасный человек ☠️
бот: @vkusvill_mcp_bot 🍌🥐🍫🥗🥑
GitHub (pr принимаем без душноты, кидайте)
- наконец то познакомился с SGR и написал простой agentic web search (like Perplexity) на версии 0.5.1 и Tavily. Пришлось попотеть - claude code упорно не понимал правильный стиль фреймворка когда я просто отдал ссылку на репо и доки. Пошло лучше, лишь когда явно скормил правильные примеры, после этого он уловил православный подход к конфигурации через конфиги и все получилось. Но надо закопать еще времени и покурить детали, получилось сыровато, лажает на факт-чекинге найденной информации
бот: <здесь_могла_бы_быть_ваша_реклама>
GitHub
- получил гонорар за голосового агента для продвижения мессенжера MAX, решил что богат и перешел на аэрозольное подсолнечное масло (на фото), ну поднялся, сорян. Лишь потом понял, что заплатили токенами GigaChat MAX, хз что с ними делать теперь
- ну и вишенка на торте, наконец то дошли руки потрогать Claude Agent SDK и сделать на нем агента. Делал очень быстрый deep research по списку телеграм каналов, ты просто вводишь "че там было про claude code недавно", агент делает rephrasing запроса, бьет на более адекватные поисковые слова, потом гоняет реранкинг на локальной модели, потом через telethon в 10 потоков делает поиск по списку проплаченных TG каналов за 6 мес, аггрегирует результаты и выдает связную портянку, как вообще менялся информационный фон в AI пространстве по вашему запросу. Конфетка, очень понравилось, надо деплоить уже 🍓
бот: <сразу_после_выхода_GTA 6>
GitHub
Как только дойдут руки последние два агента задеплоить, выложу на поиграться
Как появится свободное время (в отпуске летом), буду рассказывать про детали/неочевидные вещи вы каждом из ботиков, их было полно
Ну че, го роботат ребят👊
(Или хотя бы доедем до офиса, и вспомним как зовут коллег)
#дорогойдневник
Траву (как и желтый снег) решил не трогать.
Это были одни из самых разрывных праздников, написано аж 3 (три) новых AI агента - отбиваем название канала
- вместе с маэстро @neuraldeep кодили ai-агента для Вкусвилл, было просто невозможно остановиться. Теперь умеет: собирать корзины по запросу "что-то для души", рассказывать про отдельные товары, слушать голосовухи, находить товары по фото, рассказывать рецепты, гнобить что вы жиробас и лучше бы побегали а не жрали. Пишет детальные трассировки в LangFuse, дикпики просьба не слать, найдем по апи, забаним - не для этого Антропик свои модели делал
Но самый сок конечно кодить с Валерой вместе - сижу я такой, запилил агента, радуюсь на свою прелесть. Заходит Валера - "О щас сделаем красиво!". 15 мин и готов голосой ввод. Еще 15 мин и готова работа с фото. Хоп хоп, красивая структура репо, красивые конфиги, все запаковано в докер и развернуто. Сидишь потом и думаешь - это че вообще было... Опасный человек ☠️
бот: @vkusvill_mcp_bot 🍌🥐🍫🥗🥑
GitHub (pr принимаем без душноты, кидайте)
- наконец то познакомился с SGR и написал простой agentic web search (like Perplexity) на версии 0.5.1 и Tavily. Пришлось попотеть - claude code упорно не понимал правильный стиль фреймворка когда я просто отдал ссылку на репо и доки. Пошло лучше, лишь когда явно скормил правильные примеры, после этого он уловил православный подход к конфигурации через конфиги и все получилось. Но надо закопать еще времени и покурить детали, получилось сыровато, лажает на факт-чекинге найденной информации
бот: <здесь_могла_бы_быть_ваша_реклама>
GitHub
- получил гонорар за голосового агента для продвижения мессенжера MAX, решил что богат и перешел на аэрозольное подсолнечное масло (на фото), ну поднялся, сорян. Лишь потом понял, что заплатили токенами GigaChat MAX, хз что с ними делать теперь
- ну и вишенка на торте, наконец то дошли руки потрогать Claude Agent SDK и сделать на нем агента. Делал очень быстрый deep research по списку телеграм каналов, ты просто вводишь "че там было про claude code недавно", агент делает rephrasing запроса, бьет на более адекватные поисковые слова, потом гоняет реранкинг на локальной модели, потом через telethon в 10 потоков делает поиск по списку проплаченных TG каналов за 6 мес, аггрегирует результаты и выдает связную портянку, как вообще менялся информационный фон в AI пространстве по вашему запросу. Конфетка, очень понравилось, надо деплоить уже 🍓
бот: <сразу_после_выхода_GTA 6>
GitHub
Как только дойдут руки последние два агента задеплоить, выложу на поиграться
Как появится свободное время (в отпуске летом), буду рассказывать про детали/неочевидные вещи вы каждом из ботиков, их было полно
Ну че, го роботат ребят
(Или хотя бы доедем до офиса, и вспомним как зовут коллег)
#дорогойдневник
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥36❤13👍7😁4
Валера Ковальский
Рутуб идет загрузка!
RUTUBE
Агентные архитектуры: разбираем топ-3 решения ERC3!
В гостях Алексей (https://tg-me.sbs/aostrikov_ai_agents) (топ1)
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
Репо: Github (https://github.com/maddness/erc3-agents)
Илья топ 2 (топ 1 локал)
Репо: Github (https://github.com/IlyaRice/Enterprise-RAG-Challenge-3-AI-Agents)
Практические вопросы, конкретные…
2🔥23👏9👍4💯2🖕1
Claude Cowork и мои 5 копеек
Все обсуждают очень крутой и новый вид LLM UI Agent инструмента но упускают важную деталь
Это игрушка для элиты с подпиской за 100 долларов и макбуком
Контента про новый инструмент много но доступен ли он вам?
Пока мы смотрим красивые демки 99% пользователей остаются за бортом
Коля верно подметил что под капотом там тот же Claude Code только в песочнице которая тормозит и игнорирует локальные конфиги
Ребята из Anthropic сделали это за полторы недели c тучей агентов СС O_o
Но качество пока соответствует скорости разработки
Смысл этого релиза не в продукте а в валидации гипотезы
Anthropic показали что агенты с UI нужны рынку
Прямо сейчас кто то смотрит на этот хайп и уже пилит аналог который будет работать везде и стоить вменяемых денег и работать еще хуже? Узнаем в будущем!
Cowork это демо версия будущего которое пока работает медленно и стоит дорого
Если вы не готовы платить сотку баксов за бета тест лучше оставайтесь в терминале с обычным Claude Code
Что пишут ребята из нашего AI сообщества
Коля разнес инструмент за скорость и лимиты
Костя Доронин показал как быстро улетают токены
Рефат протестировал работу с файловой системой
Саша Поляков нашел реальный кейс с договорами
Тимур Хахалев рассказал как это кодили 4 человека
UPDATE: за 72 часа китайцы уже скопировали решение!
https://github.com/DevAgentForge/Claude-Cowork
Все обсуждают очень крутой и новый вид LLM UI Agent инструмента но упускают важную деталь
Это игрушка для элиты с подпиской за 100 долларов и макбуком
Контента про новый инструмент много но доступен ли он вам?
Пока мы смотрим красивые демки 99% пользователей остаются за бортом
Коля верно подметил что под капотом там тот же Claude Code только в песочнице которая тормозит и игнорирует локальные конфиги
Ребята из Anthropic сделали это за полторы недели c тучей агентов СС O_o
Но качество пока соответствует скорости разработки
Смысл этого релиза не в продукте а в валидации гипотезы
Anthropic показали что агенты с UI нужны рынку
Прямо сейчас кто то смотрит на этот хайп и уже пилит аналог который будет работать везде и стоить вменяемых денег и работать еще хуже? Узнаем в будущем!
Cowork это демо версия будущего которое пока работает медленно и стоит дорого
Если вы не готовы платить сотку баксов за бета тест лучше оставайтесь в терминале с обычным Claude Code
Что пишут ребята из нашего AI сообщества
Коля разнес инструмент за скорость и лимиты
Костя Доронин показал как быстро улетают токены
Рефат протестировал работу с файловой системой
Саша Поляков нашел реальный кейс с договорами
Тимур Хахалев рассказал как это кодили 4 человека
UPDATE: за 72 часа китайцы уже скопировали решение!
https://github.com/DevAgentForge/Claude-Cowork
4👍28🔥25❤8👏4
Валера Ковальский
Claude Cowork и мои 5 копеек Все обсуждают очень крутой и новый вид LLM UI Agent инструмента но упускают важную деталь Это игрушка для элиты с подпиской за 100 долларов и макбуком Контента про новый инструмент много но доступен ли он вам? Пока мы смотрим…
Media is too big
VIEW IN TELEGRAM
Cowork-Local-LLM
Вставлю еще 10 копеек своих в эту историю
Решил пару интересных задач
Как запустить на windows
Как перебить на openai-sdk
Как перебить на vllm/ollama
Как запустить на qwen3-30b-a3b-instruct-2507
Точно все будет криво так как для vLLM/ollama пришлось отказаться от Claude Agent SDK (будем исправлять)
https://github.com/vakovalskii/Cowork-Local-LLM
Поставить звезду не возбраняется
Вставлю еще 10 копеек своих в эту историю
Решил пару интересных задач
Как запустить на windows
Как перебить на openai-sdk
Как перебить на vllm/ollama
Как запустить на qwen3-30b-a3b-instruct-2507
Точно все будет криво так как для vLLM/ollama пришлось отказаться от Claude Agent SDK (будем исправлять)
https://github.com/vakovalskii/Cowork-Local-LLM
Поставить звезду не возбраняется
11🔥54👍19❤11🤔2
Валера Ковальский
Cowork-Local-LLM Вставлю еще 10 копеек своих в эту историю Решил пару интересных задач Как запустить на windows Как перебить на openai-sdk Как перебить на vllm/ollama Как запустить на qwen3-30b-a3b-instruct-2507 Точно все будет криво так как для vLLM/ollama…
This media is not supported in your browser
VIEW IN TELEGRAM
Cowork-Local-LLM
Cпустя 6 часов
Остался на локал Qwen3-30b
Из глобального
Добавил память
Добавил управление памятью
Добавил поиск в интернете
Сделал билд dmg для mac m1
Решил много проблем с контекстом и UI
Переработал тулы
Проработал изоляцию папки!
Добавил режим ask run tool (адекватно как на мой взгляд)
Поля explanation для каждого тула обязательны
Сандбокска для исполнения кода пока что нет
Версия exe и под линукс в процессе (билд но все еще можно запустится из исходников)
Уж очень мне зашел electronjs
Ссылка на релиз: https://github.com/vakovalskii/Cowork-Local-LLM/releases/download/v0.0.3/Agent.Cowork-0.0.3-arm64.dmg
Репо: https://github.com/vakovalskii/Cowork-Local-LLM
Кому такое полезно?
Как по мне тем кто не любит или боится кодовых IDE и не понимает CLI (попробовать точно стоит очень хорошие UI паттеры заложили ребята(и китайцы скопировали) на старте в Cowork)
Cпустя 6 часов
Остался на локал Qwen3-30b
Из глобального
Добавил память
Добавил управление памятью
Добавил поиск в интернете
Сделал билд dmg для mac m1
Решил много проблем с контекстом и UI
Переработал тулы
Проработал изоляцию папки!
Добавил режим ask run tool (адекватно как на мой взгляд)
Поля explanation для каждого тула обязательны
Сандбокска для исполнения кода пока что нет
Версия exe и под линукс в процессе (билд но все еще можно запустится из исходников)
Уж очень мне зашел electronjs
Ссылка на релиз: https://github.com/vakovalskii/Cowork-Local-LLM/releases/download/v0.0.3/Agent.Cowork-0.0.3-arm64.dmg
Репо: https://github.com/vakovalskii/Cowork-Local-LLM
Кому такое полезно?
Как по мне тем кто не любит или боится кодовых IDE и не понимает CLI (попробовать точно стоит очень хорошие UI паттеры заложили ребята(и китайцы скопировали) на старте в Cowork)
5🔥75❤17 7
Валера Ковальский
Cowork-Local-LLM Cпустя 6 часов Остался на локал Qwen3-30b Из глобального Добавил память Добавил управление памятью Добавил поиск в интернете Сделал билд dmg для mac m1 Решил много проблем с контекстом и UI Переработал тулы Проработал изоляцию папки!…
Cowork-Local-LLM exe?
Очень осторожно выложил exe (баги точно будут)
https://github.com/vakovalskii/Cowork-Local-LLM/releases/download/v0.0.4/Agent.Cowork.0.0.3.exe
Очень осторожно выложил exe (баги точно будут)
https://github.com/vakovalskii/Cowork-Local-LLM/releases/download/v0.0.4/Agent.Cowork.0.0.3.exe
4🤣23❤18🔥13
Forwarded from Dealer.AI
https://x.com/googledeepmind/status/2011848249850630363?s=46
Upd.
TranslateGemma is a family of lightweight, state-of-the-art open translation models from Google, based on the Gemma 3 family of models.
TranslateGemma models are designed to handle translation tasks across 55 languages. Their relatively small size makes it possible to deploy them in environments with limited resources such as laptops, desktops or your own cloud infrastructure, democratizing access to state of the art translation models and helping foster innovation for everyone.
Inputs and outputs
Input:
Text string, representing the text to be translated
Images, normalized to 896 x 896 resolution and encoded to 256 tokens each
Total input context of 2K tokens
Output:
Text translated into the target language
Тех.репорт тут.
Ну крч вы поняли, да?) Тут и текст и картинки. Это не игра в поддавки, и те кто хочет сменить лидера, должны это понимать везде.
Please open Telegram to view this post
VIEW IN TELEGRAM
X (formerly Twitter)
Google DeepMind (@GoogleDeepMind) on X
We’re releasing TranslateGemma, a new family of open translation models with support for 55 languages. 🌐
Available in 4B, 12B, and 27B parameter sizes – they’re designed for efficiency without sacrificing quality.
Available in 4B, 12B, and 27B parameter sizes – they’re designed for efficiency without sacrificing quality.
🔥17❤10😁2
LocalDesk Релиз 0.0.5
Из интересного, я наконец переехал на CC полностью
На 80 процентов релиз подготовлен CC (между звонками я редко следил за процессом, и проверял в ручную запуская сервис)
Прошел с ним полноценный цикл планирования разработки фичи(sandbox), разработка, сборка, тесты, релиз)
https://github.com/vakovalskii/LocalDesk/releases/download/v0.0.5/LocalDesk-0.0.5-arm64.dmg
Допом:
Пофиксил много багов с тулами
Изменил юзер флоу
Встроил js sandbox
Стабилизировал память
Отображение ошибок
Репо: https://github.com/vakovalskii/LocalDesk
Из интересного, я наконец переехал на CC полностью
На 80 процентов релиз подготовлен CC (между звонками я редко следил за процессом, и проверял в ручную запуская сервис)
Прошел с ним полноценный цикл планирования разработки фичи(sandbox), разработка, сборка, тесты, релиз)
https://github.com/vakovalskii/LocalDesk/releases/download/v0.0.5/LocalDesk-0.0.5-arm64.dmg
Допом:
Пофиксил много багов с тулами
Изменил юзер флоу
Встроил js sandbox
Стабилизировал память
Отображение ошибок
Репо: https://github.com/vakovalskii/LocalDesk
GitHub
GitHub - vakovalskii/KVDesk: Versatile Almost Local, Eventually Reasonable Assistant 🔫
Versatile Almost Local, Eventually Reasonable Assistant 🔫 - vakovalskii/KVDesk
1👍47❤13 5😁3
Вот Валер есть же куча таких сервис чего ты страдаешь?
Я вам скажу, есть возможность и есть желание делать
А если оно есть я его реализую это позволяет мне учится самому (причем лучше любых курсов)
Пока я делаю такой продукт и выкладываю в OSS мы вместе с вами проходим путь граблей где все это решили крутые больше ребята!
За последние 3 дня я изучил очень много и это дает мне буст!
Я вам скажу, есть возможность и есть желание делать
А если оно есть я его реализую это позволяет мне учится самому (причем лучше любых курсов)
Пока я делаю такой продукт и выкладываю в OSS мы вместе с вами проходим путь граблей где все это решили крутые больше ребята!
За последние 3 дня я изучил очень много и это дает мне буст!
9❤51👍46🔥17💯15
Forwarded from Пресидский залив
OpenAI добавляет рекламу в ChatGPT 😐
16 января OpenAI анонсировали что в ближайшие недели в ChatGPT появится реклама для free и Go (который $8/месяц) пользователей в США. Подписки Plus, Pro и Enterprise останутся без ads. И не-US пользователей это не касается - по крайней мере пока что😎
Это важный момент, потому что даже самые идеологичные компании в итоге приходят к рекламе когда burn rate становится невыносимым💀
Но давайте по порядку😧
OpenAI потерял $11.5B только в Q3 2025, при этом у них $1.4 trillion commitments на AI инфраструктуру на следующие 8 лет. Это астрономические деньги которые нужно как-то окупать😠
При этом только ~5% пользователей (35M из 700M weekly users) платят за подпискиА вы кстати платите? 😂
Для сравнения Google делает $74B revenue от рекламы в квартал, Meta $50B - реклама это cash cow для примерно всего😮
Как это будет работать?🧠
Ads будут внизу ответов, контекст будет по диалогам - если спрашиваешь про кето-диету, увидишь рекламу авокадо масла, рецепт супа - доставку еды. На самом деле это отличный канал, потому что пользователь по сути сам говорит в чем он сейчас заинтересован. Информации пока мало, но потенциально для Aesty это интересная возможность, так как многие советуются про одежду😏
Конечно тут есть огромные риски для OpenAI, связанные с прайваси👋
Диалоги в ChatGPT бывают очень личные и hyper-targeting на основе этого может быть "uniquely unsettling" как говорил сам Альтман. Действительно, обсуждая например психологию последнее что я хочу увидеть в моменте - рекламу курсов по разрешению конфликтов или типа того😅
Я думаю, что это еще один прецедент в копилку историй, где даже самые передовые AI продукты будут искать способы монетизации через рекламу, потому что compute costs астрономические, а большинство пользователей не хотят платить😡
@neural_prosecco
16 января OpenAI анонсировали что в ближайшие недели в ChatGPT появится реклама для free и Go (который $8/месяц) пользователей в США. Подписки Plus, Pro и Enterprise останутся без ads. И не-US пользователей это не касается - по крайней мере пока что
Это важный момент, потому что даже самые идеологичные компании в итоге приходят к рекламе когда burn rate становится невыносимым
Но давайте по порядку
OpenAI потерял $11.5B только в Q3 2025, при этом у них $1.4 trillion commitments на AI инфраструктуру на следующие 8 лет. Это астрономические деньги которые нужно как-то окупать
При этом только ~5% пользователей (35M из 700M weekly users) платят за подписки
Для сравнения Google делает $74B revenue от рекламы в квартал, Meta $50B - реклама это cash cow для примерно всего
Как это будет работать?
Ads будут внизу ответов, контекст будет по диалогам - если спрашиваешь про кето-диету, увидишь рекламу авокадо масла, рецепт супа - доставку еды. На самом деле это отличный канал, потому что пользователь по сути сам говорит в чем он сейчас заинтересован. Информации пока мало, но потенциально для Aesty это интересная возможность, так как многие советуются про одежду
Конечно тут есть огромные риски для OpenAI, связанные с прайваси
Диалоги в ChatGPT бывают очень личные и hyper-targeting на основе этого может быть "uniquely unsettling" как говорил сам Альтман. Действительно, обсуждая например психологию последнее что я хочу увидеть в моменте - рекламу курсов по разрешению конфликтов или типа того
Я думаю, что это еще один прецедент в копилку историй, где даже самые передовые AI продукты будут искать способы монетизации через рекламу, потому что compute costs астрономические, а большинство пользователей не хотят платить
@neural_prosecco
Please open Telegram to view this post
VIEW IN TELEGRAM
😁13❤8🔥3🤔1
Валера Ковальский
LocalDesk Релиз 0.0.5 Из интересного, я наконец переехал на CC полностью На 80 процентов релиз подготовлен CC (между звонками я редко следил за процессом, и проверял в ручную запуская сервис) Прошел с ним полноценный цикл планирования разработки фичи(sandbox)…
Tool Name Pattern
Кто-то писал что надо работать с названиями тулов, и поднимать таким образом качество работы агента
Проанализировал 4 топ кодовых агента(Cursor/Codex/Kilo/OpenCode), скормил своей нейронке в голове, и опусу, пришел к такому выводу на предмет названий тулов
Вышло как-то так как паттерн (есть еще рекомендации?)
Такой подход кратно увеличил качество выполнения моих тестов в LocalDesk на qwen3-4b-instruct-2507
————————————————————-
В структурном анализе есть понятие (комментарий от @silent_ai_cto)
т.е. наименование бизнес процесса всегда подчиняется правилам
Кто-то писал что надо работать с названиями тулов, и поднимать таким образом качество работы агента
Проанализировал 4 топ кодовых агента(Cursor/Codex/Kilo/OpenCode), скормил своей нейронке в голове, и опусу, пришел к такому выводу на предмет названий тулов
Вышло как-то так как паттерн (есть еще рекомендации?)
Такой подход кратно увеличил качество выполнения моих тестов в LocalDesk на qwen3-4b-instruct-2507
————————————————————-
В структурном анализе есть понятие (комментарий от @silent_ai_cto)
Бизнес функция - деятельность, которую мы описываем. Название всегда будет глаголом или глагольным оборотом: «Подписать договор», «Проконтролировать качество упаковки», «Перевезти посылку»
т.е. наименование бизнес процесса всегда подчиняется правилам
Название = Действие + Объект + Уточнение(если они нужны)
1👍61💯5😁1
Forwarded from О чем молчит AI CTO
image_2026-01-19_09-03-37.png
444.3 KB
Агент == Бизнес-функция. Инженерный подход к проектированию
Рассмотрим проектирование агента поиска товаров в маркетплейсе по бенчмарку Store с ERC3. Попробуем подойти к проектированию агента с точки зрения структурного анализа.
Сначала посмотрим на схему #1 — из каких компонентов состоит Агент. Не буду их описывать, думаю вы и так понимаете, что они означают… НО что-то это напоминает… хм…
Да это вылитая схема
Если смотрели выступление Ильи у Валеры, то вспомните: он применил схему оркестратора с саб-агентами для решения бенчмарка store, и один из таких агентов был агент по поиску товаров, использующий ручку API
Давайте теперь опишем данного саб-агента с помощью методологии IDEF0:
1. Определим бизнес-функцию нашего агента как
2. На вход нашему агенту мы предоставляем
На этом этапе можно размышлять над краевыми случаями и собрать
3. Для функции «Подобрать товар» механизм представляет собой tool, назовем ее
4. В классическом менеджменте сверху находятся должностные инструкции, регламенты, ГОСТы и законы, но в нашем случае это будет Ролевая модель, Процедура поиска и Политики безопасности.
5. Ну и Вывод — это продукт или информация, полученная в результате работы функции. Это то, ради чего функция существует. В классическом чат-боте выводом считается текстовое сообщение пользователю. В инженерии автономных агентов выводом является структурированный ответ, передающий ответственность оркестратору.
Зачем это нужно?
Такая детализация позволяет еще до написания первой строки кода и промпта наглядно увидеть «дыры» в логике. Если вы не можете описать агента в этой схеме — значит, вы пока не знаете, что именно строите.
Хотите пример требований и кода по методологии? Поставьте реакцию, чтобы я знал, что вам это интересно 👇
Рассмотрим проектирование агента поиска товаров в маркетплейсе по бенчмарку Store с ERC3. Попробуем подойти к проектированию агента с точки зрения структурного анализа.
Сначала посмотрим на схему #1 — из каких компонентов состоит Агент. Не буду их описывать, думаю вы и так понимаете, что они означают… НО что-то это напоминает… хм…
Да это вылитая схема
IDEF0 (см. схему #2 для понимания) по описанию бизнес-функций! Слева вход — запрос пользователя или другого агента, сверху инструкции, правила поведения и навыки, снизу инструментарий для выполнения бизнес-функции, ну а справа выход.Если смотрели выступление Ильи у Валеры, то вспомните: он применил схему оркестратора с саб-агентами для решения бенчмарка store, и один из таких агентов был агент по поиску товаров, использующий ручку API
/products/list (см. схему #3).Давайте теперь опишем данного саб-агента с помощью методологии IDEF0:
1. Определим бизнес-функцию нашего агента как
«Подобрать товар» — анализ каталога товаров и выявление позиции, соответствующей запросу. Мы выбираем «Подобрать», а не просто «Найти» или «Сканировать», потому что агент выполняет сложную когнитивную работу: он не просто делает запрос в базу (как поисковик), а итеративно сканирует каталог, фильтрует результаты в памяти и валидирует их на соответствие нечетким критериям пользователя.
2. На вход нашему агенту мы предоставляем
«поисковый запрос с критериями фильтрации» — текстовая строка на естественном языке, содержащая как намерение («найди»), так и ограничения («дешевле 500», «красный»). Пример: «Нужна игровая видеокарта не дороже 60000 рублей, желательно Asus».
На этом этапе можно размышлять над краевыми случаями и собрать
Evaluation Dataset.3. Для функции «Подобрать товар» механизм представляет собой tool, назовем ее
get_product_list. В нашем случае это будет простая обертка вокруг API /products/list. Мы осознанно не упоминаем в механизмах LLM, так как это больше НФТ (нефункциональное требование), нежели бизнес-требование.
4. В классическом менеджменте сверху находятся должностные инструкции, регламенты, ГОСТы и законы, но в нашем случае это будет Ролевая модель, Процедура поиска и Политики безопасности.
Важно: мы не отбираем у исследователей работу с промптом, но указываем в требованиях общие рекомендации.
5. Ну и Вывод — это продукт или информация, полученная в результате работы функции. Это то, ради чего функция существует. В классическом чат-боте выводом считается текстовое сообщение пользователю. В инженерии автономных агентов выводом является структурированный ответ, передающий ответственность оркестратору.
Рекомендую сразу размышлять над негативными сценариями: как мы будем обрабатывать ошибки.
Зачем это нужно?
Такая детализация позволяет еще до написания первой строки кода и промпта наглядно увидеть «дыры» в логике. Если вы не можете описать агента в этой схеме — значит, вы пока не знаете, что именно строите.
Хотите пример требований и кода по методологии? Поставьте реакцию, чтобы я знал, что вам это интересно 👇
7🔥107💯23 10😁7
Forwarded from AI да парень! / Sergei Notevskii
Vibeworking для нетехнарей (и ideфобов/терминалфобов)
В продолжение поста по инструментам.
Сейчас идет большой тренд на использование изначально кодинг-инструментов(например Claude Code), в задачах, не связанных с программированием как таковым. Вот классная подборка из 50 задач собранных Lenny Rachitsky.
Но проблема в том, что большая часть новых пользователей таких инструментов - это не разработчики, а ребята привыкшие к «человеческим» интерфейсам. Терминалы, IDE и прочие атрибуты кодинга их пугают уже одним своим присутсвием (технари, вы можете смеяться, но судя по фидбеку от коллег это действительно отталкивающий фактор).
Anthropic вовремя подсуетился и выпустил Claude Cowork, который по факту является Desktop оберткой над Claude Code, и позволяет делать все тоже самое (в тч и vibe-кодить). Но судя по отзывам - вышло не очень: тратит много токенов, и не решает задачи до конца.
Опенсорс-альтернативасына маминой подруги
А еще быстрее подхватил тему Валера Ковальский, который пилит опенсорс аналог - LocalDesk.
Это фактически бесплатный десктоп-ассистент для vibe-кодинга (в случае с работой через локальную модель), решающий проблему интерфейса.
Из ключевого:
- Открытый код (+ нет жесткой завязки только на Claude)
- Поддержка локальных моделей
- Работа с файлами (в тч PDF/DOCX)
- Память между сессиями (в отличии от того же Cowork)
- Поиск в интернетах
- И тд
Хотя я приверженец терминала, но даже мне понравилось. Думаю если поработаю в нем пару недель, уже не захочу возвращаться (и клетчатые рубашки перестану носить, да).
Однозначно буду советовать коллегам-"не разработчикам" внутри компании.
А когда будет большая волшебная кнопка, чтобы настраивалось все само - цены ему не будет.
Попробовать можно:
- из исходников LocalDesk (попросить тот же Warp собрать)
- из dmg (активно разрабатывается, поэтому может быть не самая свежая версия)
П.с. вообще рекомендую канал Валеры, приятно читать hands-on руководителей.
Как говориться "был подписан, когда это еще не было мейнстримом".
В продолжение поста по инструментам.
Сейчас идет большой тренд на использование изначально кодинг-инструментов(например Claude Code), в задачах, не связанных с программированием как таковым. Вот классная подборка из 50 задач собранных Lenny Rachitsky.
Но проблема в том, что большая часть новых пользователей таких инструментов - это не разработчики, а ребята привыкшие к «человеческим» интерфейсам. Терминалы, IDE и прочие атрибуты кодинга их пугают уже одним своим присутсвием (технари, вы можете смеяться, но судя по фидбеку от коллег это действительно отталкивающий фактор).
Anthropic вовремя подсуетился и выпустил Claude Cowork, который по факту является Desktop оберткой над Claude Code, и позволяет делать все тоже самое (в тч и vibe-кодить). Но судя по отзывам - вышло не очень: тратит много токенов, и не решает задачи до конца.
Опенсорс-альтернатива
А еще быстрее подхватил тему Валера Ковальский, который пилит опенсорс аналог - LocalDesk.
Это фактически бесплатный десктоп-ассистент для vibe-кодинга (в случае с работой через локальную модель), решающий проблему интерфейса.
Из ключевого:
- Открытый код (+ нет жесткой завязки только на Claude)
- Поддержка локальных моделей
- Работа с файлами (в тч PDF/DOCX)
- Память между сессиями (в отличии от того же Cowork)
- Поиск в интернетах
- И тд
Хотя я приверженец терминала, но даже мне понравилось. Думаю если поработаю в нем пару недель, уже не захочу возвращаться (и клетчатые рубашки перестану носить, да).
Однозначно буду советовать коллегам-"не разработчикам" внутри компании.
А когда будет большая волшебная кнопка, чтобы настраивалось все само - цены ему не будет.
Попробовать можно:
- из исходников LocalDesk (попросить тот же Warp собрать)
- из dmg (активно разрабатывается, поэтому может быть не самая свежая версия)
П.с. вообще рекомендую канал Валеры, приятно читать hands-on руководителей.
Как говориться "был подписан, когда это еще не было мейнстримом".
GitHub
GitHub - vakovalskii/KVDesk: Versatile Almost Local, Eventually Reasonable Assistant 🔫
Versatile Almost Local, Eventually Reasonable Assistant 🔫 - vakovalskii/KVDesk
2👍33 17❤13🔥11
LocalDesk 0.0.6 — Полный контроль без API-ключей
Йоу! Неделя выдалась жаркой
70+ коммитов, первые серьезные контрибьюторы и куча киллер-фич которые меняют правила игры
Что произошло
Пока я чинил баги с Telegram парсингом и TodoPanel, @abhaymundhara https://github.com/abhaymundhara принёс подарок 25 новых тулов без API-ключей
А @ChernovDev https://tg-me.sbs/ChernovDev вообще красавчик допиливал софтину прямо внутри её же чата через Z.AI
Его вклад: интеграция Z.AI (reader + web search), рендеринг markdown таблиц, session-based todos, много-поточные задачи, отслеживание изменений через git, spell check, UI улучшения
Это именно то как должен развиваться опенсорс ребята приходят и делают то на что у тебя руки не дошли
Новые тулы
DuckDuckGo Search 3 тула для поиска без API ключей: search, search_news, search_images
Browser Automation 11 тулов: navigate, click, type, select, hover, scroll, press_key, wait_for, snapshot, screenshot, execute_script
Git Integration 11 тулов: status, log, diff, show, branch, checkout, add, commit, push, pull, reset
HTTP/Fetch 4 тула: fetch, fetch_json, download, fetch_html
Tool Groups включай только нужное
Все новые тулы по умолчанию выключены, в Settings появилась секция Tool Groups
Зачем? Меньше тулов в контексте = модель лучше выбирает нужный, экономия токенов, меньше галлюцинаций
Базовых тулов 14: файловые операции, execute_js, render_page, manage_todos, search_web
Tool Name Pattern
Проанализировал 4 топ кодовых агента (Cursor/Codex/Kilo/OpenCode), скормил опусу, пришел к паттерну именования
Название = Действие + Объект + Уточнение
Примеры: read_file, write_file, search_text, execute_js, manage_todos
Такой подход кратно увеличил качество выполнения тестов на qwen3-4b-instruct-2507
Комментарий от @silent_ai_cto: в структурном анализе бизнес функция всегда глагол или глагольный оборот "Подписать договор", "Проконтролировать качество"
Мои фиксы
Telegram: посты берутся с новейших, пофиксил fallthrough баг
Todos: не теряются между сессиями, dynamic system prompt — отключенные тулы скрыты от модели
Core: MIT лицензия, request timeout 5 минут, loop detector, broadcast статусов
Репо: https://github.com/vakovalskii/LocalDesk
Поиск без API-ключей для локального запуска, теперь можно поднять агента имея только vLLM/Ollama, ноль внешних зависимостей
Ставьте звёзды на репо если зашло!
(Скрины сервиса https://tg-me.sbs/neuraldeepchat/33421)
Just For Fun!
Йоу! Неделя выдалась жаркой
70+ коммитов, первые серьезные контрибьюторы и куча киллер-фич которые меняют правила игры
Что произошло
Пока я чинил баги с Telegram парсингом и TodoPanel, @abhaymundhara https://github.com/abhaymundhara принёс подарок 25 новых тулов без API-ключей
А @ChernovDev https://tg-me.sbs/ChernovDev вообще красавчик допиливал софтину прямо внутри её же чата через Z.AI
Его вклад: интеграция Z.AI (reader + web search), рендеринг markdown таблиц, session-based todos, много-поточные задачи, отслеживание изменений через git, spell check, UI улучшения
Это именно то как должен развиваться опенсорс ребята приходят и делают то на что у тебя руки не дошли
Новые тулы
DuckDuckGo Search 3 тула для поиска без API ключей: search, search_news, search_images
Browser Automation 11 тулов: navigate, click, type, select, hover, scroll, press_key, wait_for, snapshot, screenshot, execute_script
Git Integration 11 тулов: status, log, diff, show, branch, checkout, add, commit, push, pull, reset
HTTP/Fetch 4 тула: fetch, fetch_json, download, fetch_html
Tool Groups включай только нужное
Все новые тулы по умолчанию выключены, в Settings появилась секция Tool Groups
Зачем? Меньше тулов в контексте = модель лучше выбирает нужный, экономия токенов, меньше галлюцинаций
Базовых тулов 14: файловые операции, execute_js, render_page, manage_todos, search_web
Tool Name Pattern
Проанализировал 4 топ кодовых агента (Cursor/Codex/Kilo/OpenCode), скормил опусу, пришел к паттерну именования
Название = Действие + Объект + Уточнение
Примеры: read_file, write_file, search_text, execute_js, manage_todos
Такой подход кратно увеличил качество выполнения тестов на qwen3-4b-instruct-2507
Комментарий от @silent_ai_cto: в структурном анализе бизнес функция всегда глагол или глагольный оборот "Подписать договор", "Проконтролировать качество"
Мои фиксы
Telegram: посты берутся с новейших, пофиксил fallthrough баг
Todos: не теряются между сессиями, dynamic system prompt — отключенные тулы скрыты от модели
Core: MIT лицензия, request timeout 5 минут, loop detector, broadcast статусов
Репо: https://github.com/vakovalskii/LocalDesk
Поиск без API-ключей для локального запуска, теперь можно поднять агента имея только vLLM/Ollama, ноль внешних зависимостей
Ставьте звёзды на репо если зашло!
(Скрины сервиса https://tg-me.sbs/neuraldeepchat/33421)
Just For Fun!
8🔥81 5👏4🤔3