bishx devlog
Сутки с Codex – и понимаю, что пора делать мини-итоги работы с Claude, потому что пока не вижу причин возвращаться к нему) Пользоваться клодом я начал 31 января – с того момента у меня стрик ровно 3 месяца, 90 дней. За последний месяц я потратил более 200…
Интересно, что кодекс смог дойти до того же уровня исполнения задач, как и клод, только за гораздо меньшую стоимость. Без оверлоадинга и вечерних ускоренных лимитов
➡️ Насчет минусов:
- Контекстное окно на фронтир модели (gpt-5.5) всего 258к (маркетинговые 400к минус максимальный выход модели 128к минус 5 процентов)
- При сбоях хуков не выводит ошибки, тихо выходит в exit 0. Тяжело дебажить пайплайн
- Плагины не несут свои хуки в себе. Приходится инжектить в глобальный файл хуков
➡️ Незаметные минусы:
- Отсутствие Agent Teams
- Обновление текущего usage в cli – раз в XXX?? В клоде даже задумываться не приходилось об этом
Пока что принципиально не ставлю надстройки над кодексом а-ля oh my codex, тк надо понять, чего именно не хватает и что хочется вытащить оттуда
Несмотря на всеминусы (явно таковыми их не считаю) кодекс всё равно нравится своей исполнительностью и продолжительностью размышлений без влияния на него. В клода нужно тапком кидать, чтобы он продолжил работать без остановики. Кодексу – один раз писать "mandatory ALWAYS работай без остановки", и он улетает на 4-6 часов по любой таске в размышления и проверку гипотез. Если клод ваншотает 70% задач без особых усилий и промптов, то дотошный кодекс шотает 95%
А что там с клодом? Клод пока что остался под рисерчи для основных проектов(пока не кончилась подписка 😁 ) . И в свободное время по-тихоньку работает с трейдингом, изучает стратегии и рынок, выгружает метрики с бирж, настраивает автосбор с реалтайма. Проводит бэктесты, ставит гипотезы – показывает 80% годовой доходности, верим👎 . Пускай ещё работает
- Контекстное окно на фронтир модели (gpt-5.5) всего 258к (маркетинговые 400к минус максимальный выход модели 128к минус 5 процентов)
- При сбоях хуков не выводит ошибки, тихо выходит в exit 0. Тяжело дебажить пайплайн
- Плагины не несут свои хуки в себе. Приходится инжектить в глобальный файл хуков
- Отсутствие Agent Teams
- Обновление текущего usage в cli – раз в XXX?? В клоде даже задумываться не приходилось об этом
Пока что принципиально не ставлю надстройки над кодексом а-ля oh my codex, тк надо понять, чего именно не хватает и что хочется вытащить оттуда
Несмотря на все
А что там с клодом? Клод пока что остался под рисерчи для основных проектов
Please open Telegram to view this post
VIEW IN TELEGRAM
Немного цифр по AI-разработке за последние 7 дней:
По коду:
Для сравнения со средним пользователем:
Основной объем:
Думаю, это уже можно назвать полноценным AI-native workflow
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Хммм, не все погружены в фичи телеги, но многие точно задумывались, как сделать несколько никнеймов в тг для своего профиля/канала
Так вот, это довольно просто:
1. Регаем обычный ник через публичные тгк/группу
2. Ждем некоторое время пока ник станет вашим по меркам тг.Могу ошибаться, 1-3 недели
3. Регаем тон-кошелек (юзаю этот). Пополняем его доступным способом (например, через @wallet или @send)
4. Регаем Fragment, связываем его с телегой и нашим кошельком. Верифаем KYC
5. Выставляем ник на аукцион. Делаем цену 10 тон. Если дает поставить цену еще ниже — делаем ниже
6. Депаем минимальную ставку со своего тон-кошелька
7. Ждем неделю и молимся чтобы вас не перебила другая ставка
8. Никто не осмелился за 7 дней сделать ставку и забрать ваш ник? Поздравляю! Вам придет алерт от бота. Готово. Ник ваш. Фрагмент забрал себе 5 тон комиссии, а оставшиеся 5 отправил вам на кошелек как продавцу.Выходит скидка 50% на следующий ник
8.1. Если кто-то всё же осмелился сделать ставку выше — также придет алерт от бота. Пытаемся перебить её, если так хотим этот ник
8.2. Если не хотим — по окончании таймера ник достанется человеку с наивысшей ставкой. Тоны вернутся на ваш кошелек
9. Через фрагмент делаем assign со своим тг/тгк
– После первого аукциона для ника его можно выставлять на мгновенную продажу
– В первые полчаса (а могут и через полгода) после покупки вам будут писать скамеры и просить продать ник за любую цену. Не ведитесь! Любая «can I buy @elite_pizza?» — сразу в чс и без разговоров, лишь 1 из 100 человек будет настоящим покупателем
– Ни в коем случае не теряем доступ к основному тон-кошельку, потому что к нему привязаны никнеймы!
На основе моих покупок (более 15шт), такое удовольствие — от 700 до 1200 рублей за чужой ник и 1400-2000 за свой ник, в зависимости от курса тона
Так были куплены все ники для @bishx (кроме самого bishx) и @bishx_devlog
Так вот, это довольно просто:
1. Регаем обычный ник через публичные тгк/группу
2. Ждем некоторое время пока ник станет вашим по меркам тг.
3. Регаем тон-кошелек (юзаю этот). Пополняем его доступным способом (например, через @wallet или @send)
4. Регаем Fragment, связываем его с телегой и нашим кошельком. Верифаем KYC
5. Выставляем ник на аукцион. Делаем цену 10 тон. Если дает поставить цену еще ниже — делаем ниже
6. Депаем минимальную ставку со своего тон-кошелька
7. Ждем неделю и молимся чтобы вас не перебила другая ставка
8. Никто не осмелился за 7 дней сделать ставку и забрать ваш ник? Поздравляю! Вам придет алерт от бота. Готово. Ник ваш. Фрагмент забрал себе 5 тон комиссии, а оставшиеся 5 отправил вам на кошелек как продавцу.
8.1. Если кто-то всё же осмелился сделать ставку выше — также придет алерт от бота. Пытаемся перебить её, если так хотим этот ник
8.2. Если не хотим — по окончании таймера ник достанется человеку с наивысшей ставкой. Тоны вернутся на ваш кошелек
9. Через фрагмент делаем assign со своим тг/тгк
– После первого аукциона для ника его можно выставлять на мгновенную продажу
– В первые полчаса (а могут и через полгода) после покупки вам будут писать скамеры и просить продать ник за любую цену. Не ведитесь! Любая «can I buy @elite_pizza?» — сразу в чс и без разговоров, лишь 1 из 100 человек будет настоящим покупателем
– Ни в коем случае не теряем доступ к основному тон-кошельку, потому что к нему привязаны никнеймы!
На основе моих покупок (более 15шт), такое удовольствие — от 700 до 1200 рублей за чужой ник и 1400-2000 за свой ник, в зависимости от курса тона
Так были куплены все ники для @bishx (кроме самого bishx) и @bishx_devlog
А стоит ли вообще использовать сложные системы разработки?
Ранее писал публичный и приватный пайплайн. Но в последнюю неделю замечаю, что они слишком долгие и дорогие (да, к сожалению, я начал признавать стоимость разработки) для повседневных задач. Они хороши для трудоёмких, сложных задач, но для ad hoc-решений это перебор. А таких большинство, когда тяжелые пайплайны уже сделали свою работу и остаётся полировка
Я понял, что скучаю по обычному чатику, где ты пишешь "Сделай X" и через 10-15 минут получаешь результат
И cмотришь на этот результат, получаешь дофамин... приходит новая идея – сразу оцениваешь, как это выглядит. Дофаминовый цикл
Уже пора строить упрощенный пайплайн, где нужно просто сидеть в чатике, общаться, а агент по умолчанию будет делать правильные вещи – достаточно изучать таску, параллелить исполнение и самостоятельно предлагать идеи
Этот подход накапливает техдолг, но важно ли это в RAD-подходе, где ты сам выступаешь заказчиком и принимашь работу у нейросети? Нет. Абсолютно. Ты хочешь видеть результат, а не тысячу перепроверок и верификаций, правильности управления версиями, где хоть что-то увидишь в лучшем случае через час от последнего промпта
Хочется обычного человеческого – предлагать идеи, аппрувать предложения и смотреть результат
Как избавляться от техдолга?
Запускать те самые сложные пайплайны на ночь, ставя в цель – рефакторинг кода, его улучшения, но без потери бизнес-логики, которая весь день прорабатывалась
Или хотя бы использовать:
По сути – максимально прорабатываем happy path по типичным сценариям, лицевую часть фичи. На ночь ставим изучать edge/corner/negative cases и увеличивать покрытие тестами
Что получаем на выходе?
Готовую отличную фичу, а также уверенность, что эта фича реализована без багов и непокрытых сценариев
Ранее писал публичный и приватный пайплайн. Но в последнюю неделю замечаю, что они слишком долгие и дорогие (да, к сожалению, я начал признавать стоимость разработки) для повседневных задач. Они хороши для трудоёмких, сложных задач, но для ad hoc-решений это перебор. А таких большинство, когда тяжелые пайплайны уже сделали свою работу и остаётся полировка
Я понял, что скучаю по обычному чатику, где ты пишешь "Сделай X" и через 10-15 минут получаешь результат
И cмотришь на этот результат, получаешь дофамин... приходит новая идея – сразу оцениваешь, как это выглядит. Дофаминовый цикл
Уже пора строить упрощенный пайплайн, где нужно просто сидеть в чатике, общаться, а агент по умолчанию будет делать правильные вещи – достаточно изучать таску, параллелить исполнение и самостоятельно предлагать идеи
Этот подход накапливает техдолг, но важно ли это в RAD-подходе, где ты сам выступаешь заказчиком и принимашь работу у нейросети? Нет. Абсолютно. Ты хочешь видеть результат, а не тысячу перепроверок и верификаций, правильности управления версиями, где хоть что-то увидишь в лучшем случае через час от последнего промпта
Хочется обычного человеческого – предлагать идеи, аппрувать предложения и смотреть результат
Как избавляться от техдолга?
Запускать те самые сложные пайплайны на ночь, ставя в цель – рефакторинг кода, его улучшения, но без потери бизнес-логики, которая весь день прорабатывалась
Или хотя бы использовать:
/goal рефакторни X! MANDATORY: не останавливайся и не допусти ни одной ошибки
По сути – максимально прорабатываем happy path по типичным сценариям, лицевую часть фичи. На ночь ставим изучать edge/corner/negative cases и увеличивать покрытие тестами
Что получаем на выходе?
Готовую отличную фичу, а также уверенность, что эта фича реализована без багов и непокрытых сценариев
Бизнес, как и мы, ждёт решение, а не сжигание компьюта
Решил отдать честь окончанию работы с Claude Code – вдохновился идеей автотранскрибации голосовых в Telegram и навайбкодил с клодом последний петик за пару часов
Входящие гс до 5 минут и кружки прогоняются через нативное распознавание от Telegram API. Дальше текст уходит в нейронку – улучшает пунктуацию, абзацы и чистит слова-паразиты. Результат прилетает reply-to-message в исходный чат в виде свёрнутой цитаты
⏺ Где работает:
- по умолчанию во всех личных чатах, где с собеседником больше 100 сообщений (можно настроить черный список)
- опционально – для групп (через белый список)
⏺ Из приятного:
- при пересылке гс в течение часа после его распознавания – текст подтянется по хешу
- при пересылке гс нескольким людям, когда оно не было распознано – обрабатывается один раз, по ходу масштабируется на остальные чаты из кеша
- нецензурная лексика подсвечивается курсивом
Из нюансов – нужна премка в телеграмме и какая-нибудь подписка на нейросеть
Пару месяцев назад получил 2 года бесплатного пользования 10$ подписки github copilot через education pack, наконец-то пригодилась! К слову, за $10/месяц дают безлимит для gpt-5-mini, который можно использовать через "-p"-флаг. Чем не сказка?
Но из уважения к опенсорсу для совместимости подключил еще OpenAI и Anthropic API
🟩 Ставится в 2 секунды на мак и линукс (винду не признаём):
1.
2. Делам онбординг через
👩💻 Исходный код: GitHub
Входящие гс до 5 минут и кружки прогоняются через нативное распознавание от Telegram API. Дальше текст уходит в нейронку – улучшает пунктуацию, абзацы и чистит слова-паразиты. Результат прилетает reply-to-message в исходный чат в виде свёрнутой цитаты
- по умолчанию во всех личных чатах, где с собеседником больше 100 сообщений (можно настроить черный список)
- опционально – для групп (через белый список)
- при пересылке гс в течение часа после его распознавания – текст подтянется по хешу
- при пересылке гс нескольким людям, когда оно не было распознано – обрабатывается один раз, по ходу масштабируется на остальные чаты из кеша
- нецензурная лексика подсвечивается курсивом
Из нюансов – нужна премка в телеграмме и какая-нибудь подписка на нейросеть
Пару месяцев назад получил 2 года бесплатного пользования 10$ подписки github copilot через education pack, наконец-то пригодилась! К слову, за $10/месяц дают безлимит для gpt-5-mini, который можно использовать через "-p"-флаг. Чем не сказка?
Но из уважения к опенсорсу для совместимости подключил еще OpenAI и Anthropic API
1.
git clone https://github.com/bish-x/telepath.git2. Делам онбординг через
./scripts/setup.shPlease open Telegram to view this post
VIEW IN TELEGRAM
Морально дорос до сохранения контекста нейросети со всех сессий
Обычный контекст – 1 миллион токенов. А в codex gpt-5.5 вообще 258к. Но что если нейросеть будет помнить всё, что когда либо обсуждалось? При этом не будет тратить токены на фоновое поддержание памяти, как это происходит с жадной загрузкой skills/mcp в классическом подходе
Это – gbrain:
1. Хранение всей информации в собственной вики, в виде .md-файлов и их индексация через эмбеддинги с дальнейшим поиском через RAG
2. Автоматизированный ежедневный анализ новых диалогов – с автообновлением вики, переиндексацией diff'ов и многоакторной верификацией
Нравится сравнение: вечером отправляем нейросеть в dreams, она, как и человек, пару часов находится в глубоком сне, перекашеваривает всё, что было ею сделано за день, находит лучшие практики принятых решений, переосмысливает старое. Выходит из сна – и становится умнее. Постепенно перехожу к третьему этапу
Проанализировав все диалоги из claude/codex (которые по умолчанию сохраняются локально) и загрузив лучшие решения в вики – получаем свою цифровую копию с hard-skills
А загрузив и проиндексировав свои диалоги из мессенджера – получаем цифровую копию личности…
Юзаем полученные знания в повседневном общении с нейронкой. Именно общении. Не обязательно в разработке – в общении
Узнать, что произошло 15 мая 2026? – welcome!
Как мы в прошлый раз решали X? – без проблем!
Проведи SWOT-анализ по soft-скиллам, – отлично!
Всё бы супер, только подход gbrain использует не весь потенциал задумки и довольно много упускает. В моём представлении работы с RAG и дообучением памяти – из first-party gbrain многое переработано и некоторые вещи фундаментально изменены:
Как всё протестирую – выложу в опенсурс своё решение
Обычный контекст – 1 миллион токенов. А в codex gpt-5.5 вообще 258к. Но что если нейросеть будет помнить всё, что когда либо обсуждалось? При этом не будет тратить токены на фоновое поддержание памяти, как это происходит с жадной загрузкой skills/mcp в классическом подходе
Это – gbrain:
1. Хранение всей информации в собственной вики, в виде .md-файлов и их индексация через эмбеддинги с дальнейшим поиском через RAG
2. Автоматизированный ежедневный анализ новых диалогов – с автообновлением вики, переиндексацией diff'ов и многоакторной верификацией
Нравится сравнение: вечером отправляем нейросеть в dreams, она, как и человек, пару часов находится в глубоком сне, перекашеваривает всё, что было ею сделано за день, находит лучшие практики принятых решений, переосмысливает старое. Выходит из сна – и становится умнее. Постепенно перехожу к третьему этапу
Проанализировав все диалоги из claude/codex (которые по умолчанию сохраняются локально) и загрузив лучшие решения в вики – получаем свою цифровую копию с hard-skills
А загрузив и проиндексировав свои диалоги из мессенджера – получаем цифровую копию личности…
Юзаем полученные знания в повседневном общении с нейронкой. Именно общении. Не обязательно в разработке – в общении
Узнать, что произошло 15 мая 2026? – welcome!
Как мы в прошлый раз решали X? – без проблем!
Проведи SWOT-анализ по soft-скиллам, – отлично!
Всё бы супер, только подход gbrain использует не весь потенциал задумки и довольно много упускает. В моём представлении работы с RAG и дообучением памяти – из first-party gbrain многое переработано и некоторые вещи фундаментально изменены:
Мы не просто поставили gbrain, а допилили его в полноценную приватную память для Codex: перевели runtime на общий Postgres + HTTP MCP для параллельных агентов, подключили качественные OpenAI embeddings text-embedding-3-large на 3072 измерения, добавили temporal search по разным осям времени (formed_at, recorded_at, indexed_at), сделали строгий allowlist, чтобы в индекс попадали только curated заметки, а не сырые чаты/архивы, выстроили вечерний $review-drafts пайплайн для разборки auto-drafts в нормальные memory pages с commit/push, и прописали агентам правила: при затыках сначала искать в памяти, но не считать слабые semantic совпадения истиной.
Как всё протестирую – выложу в опенсурс своё решение
Уже более недели пассивно-активно занимаюсь настройкой gbrain. И сейчас неожиданно понял, что пришел к интересному инсайту по будущим разработкам
Итак, реальная проблема: Для индексации динамически меняющихся файлов памяти (обычный markdown) необходимо стандартизировать данные для записи в Postgres с возможностью последующей фильтрации по некоторым полям
Казалось бы — отдай задачу нейросети. Она стандартизирует и добавит. А если таких задач 200+ и они вызываются ежедневно? Кто даст гарантию, что ветер подует в правильном направлении и, как следствие, стохастика модели каждый раз сработает ровно так, как нужно? Гарантия лишь в том, что умная модель догадается, что мы хотим получить
Так вот, можно сделать стандартизацию через скрипты-чекапы. Дать модели доступ к вызову скриптов. Описать что модель должна подать на вход и что получит на выходе
Логика очень простая. Но в чем инсайт? Инсайт в том, что ровно по такой логике работают MCP (есть скрипт и есть его описание; объединили несколько скриптов в предметной области — получили MCP) и, как мне кажется, подкапотные вызовы first-party тулзов. Например, по записи/редактированию файлов, — модель не может изменить файл, не прочитав его, даже если на 100% уверена в его содержимом: скрипт просто выдаст ошибку редактирования файла. Тулзы нужны для создания возможностей – что именно модель может использовать. Но как это использовать – это уже наша задача ей объяснить
В случае с постгресом — мы пишем скрипт, какие [мета]данные обязательно должны быть отражены в md-файле (файле памяти), чтобы корректно распарсить и импортировать этот файл в бд
Рядом со скриптом пишем скилл. В скилле описываем как работать со скриптом и как обобщённо-правильно фиксить непройденные проверки. Получился очень упрощенный MCP. Можно сказать, аналог first-party тулзов:
После этого у меня сложился пазл. Ведь скрипты с дополнительными проверками относятся не только к нейросетям. К этому же относится и ruff и тестирования продуктов с предкоммитными/регрессионными проверками. По сути взяли тот же механизм. Возвели из него абстракцию. Перенесли на любую другую область – тем самым избавились от предполагаемой недетерминированности
Итак, реальная проблема: Для индексации динамически меняющихся файлов памяти (обычный markdown) необходимо стандартизировать данные для записи в Postgres с возможностью последующей фильтрации по некоторым полям
Казалось бы — отдай задачу нейросети. Она стандартизирует и добавит. А если таких задач 200+ и они вызываются ежедневно? Кто даст гарантию, что ветер подует в правильном направлении и, как следствие, стохастика модели каждый раз сработает ровно так, как нужно? Гарантия лишь в том, что умная модель догадается, что мы хотим получить
Так вот, можно сделать стандартизацию через скрипты-чекапы. Дать модели доступ к вызову скриптов. Описать что модель должна подать на вход и что получит на выходе
Логика очень простая. Но в чем инсайт? Инсайт в том, что ровно по такой логике работают MCP (есть скрипт и есть его описание; объединили несколько скриптов в предметной области — получили MCP) и, как мне кажется, подкапотные вызовы first-party тулзов. Например, по записи/редактированию файлов, — модель не может изменить файл, не прочитав его, даже если на 100% уверена в его содержимом: скрипт просто выдаст ошибку редактирования файла. Тулзы нужны для создания возможностей – что именно модель может использовать. Но как это использовать – это уже наша задача ей объяснить
В случае с постгресом — мы пишем скрипт, какие [мета]данные обязательно должны быть отражены в md-файле (файле памяти), чтобы корректно распарсить и импортировать этот файл в бд
Рядом со скриптом пишем скилл. В скилле описываем как работать со скриптом и как обобщённо-правильно фиксить непройденные проверки. Получился очень упрощенный MCP. Можно сказать, аналог first-party тулзов:
$dreams завершён и запушен.
Обработано и архивировано 24/24 draft из инвентаря: ...
Проверки прошли: proposal artifacts 5/5, ledger/proposal/diff/evidence validation, redaction, allowlist, Dreams helper tests, two gbrain sync passes, indexed timestamp stamping, target-slug get_evidence, semantic query with embedding_hnsw, query_scan, temporal searches, final staged guard
После этого у меня сложился пазл. Ведь скрипты с дополнительными проверками относятся не только к нейросетям. К этому же относится и ruff и тестирования продуктов с предкоммитными/регрессионными проверками. По сути взяли тот же механизм. Возвели из него абстракцию. Перенесли на любую другую область – тем самым избавились от предполагаемой недетерминированности
bishx devlog
Решил не спамить в основном канале и поэтому выложил свои awards в отдельный тгк
Можете глянуть мой бэкграунд😁 😁
📩 @bishx_awards
Это, скорее, мой личный архивчик, чтобы ничего не потерять со временем. Иногда будет пополняться – как буду находить старые кейсы или получать новые
Можете глянуть мой бэкграунд
Это, скорее, мой личный архивчик, чтобы ничего не потерять со временем. Иногда будет пополняться – как буду находить старые кейсы или получать новые
Please open Telegram to view this post
VIEW IN TELEGRAM
Пару недель назад я делал пост о том, что не всегда оптимально использовать сложные пайплайны для работы с нейросетями
Недавно была задача взять одну систему за основу и усовершенствовать её – кое-что выпилить, кое-что допилить, что-то оставить
Был выбор:
1. Использовать сложный пайплайн (публичный вариант) с трехчасовым планированием, 20+ часами исполнением плана, декомпозицией задач в YouTrack и ветками в системе контроля версий. Жесть, в общем
2. Использовать обычный чатик с ручными итерациями "перепиши и проверь"
3. Взять что-то между п.1 и п.2: адаптивный полуавтономный пайплайн под среднебытовую задачу с приоритизацией общения в чатике
По сложному названию и ссылке на гит можно догадаться, что я выбрал третий вариант. Мои два промпта кодексу звучали так:
1. "$bx-dev"
2. "/goal возьми из репы Х все python исходники. Перепиши весь проект на go в более сопровождаемый вид. В каждой итерации используй нужные скиллы из skill-library. Следуй протоколу $bx-dev. Критерий завершения – система полностью перенесена на go и проверена на отсутствие потерь бизнес-логики при миграции"
Отличный промпт? Да! Сейчас разберём
Написав $bx-dev, мы задали рабочий контур: исследование перед изменениями, реализация, проверки, ревью и DDD классификация там, где она действительно нужна
А написав "/goal ..." – мы зафиксировали задачу, критерий завершения и требования к процессу. Агенту сложнее закончить раньше времени: при попытке остановиться его возвращает к цели, проверкам и требованиям из $bx-dev и напоминанию использовать skill-library (буст +16 п.п. к эффективности)
Получается, что у нейронки нет нормального выхода из цикла, пока она не сверится с критерием завершения: полностью перенести систему и не потерять бизнес-логику. При каждой попытке останова её пинают и говорят следовать промпту из /goal, который отлично напоминает про задачу и требования к её исполнению
Отправили всё в кодекс и ушли заниматься своими делами, – спустя 8 часов имеем ваншотом полностью перенесенный проект на другой яп. Запустили, проверили – есть пара мелких недочетов, но фиксятся они за 5-10 минут
Суть в том, что $bx-dev сам по себе вполне автономен и хорошо справляется с большинством задач. А в связке с /goal мы это дополнительно усилили, исключив потерю контекста с течением времени
Теперь самое интересное... Я решил в паблик выложить свой bx-dev skill и встроенную skill-library с механизмом ленивой загрузки 105 скиллов, которые использую в повседневных задачах
В репе описал, как устроен скилл и как с ним работать в разных сценариях
Скилл самодостаточен и готов к работе из коробки, нужны лишь утилиты gh (для git репы проекта) и jq (для записи состояний)
☁️ Исходный код: GitHub
Недавно была задача взять одну систему за основу и усовершенствовать её – кое-что выпилить, кое-что допилить, что-то оставить
Был выбор:
1. Использовать сложный пайплайн (публичный вариант) с трехчасовым планированием, 20+ часами исполнением плана, декомпозицией задач в YouTrack и ветками в системе контроля версий. Жесть, в общем
2. Использовать обычный чатик с ручными итерациями "перепиши и проверь"
3. Взять что-то между п.1 и п.2: адаптивный полуавтономный пайплайн под среднебытовую задачу с приоритизацией общения в чатике
По сложному названию и ссылке на гит можно догадаться, что я выбрал третий вариант. Мои два промпта кодексу звучали так:
1. "$bx-dev"
2. "/goal возьми из репы Х все python исходники. Перепиши весь проект на go в более сопровождаемый вид. В каждой итерации используй нужные скиллы из skill-library. Следуй протоколу $bx-dev. Критерий завершения – система полностью перенесена на go и проверена на отсутствие потерь бизнес-логики при миграции"
Отличный промпт? Да! Сейчас разберём
Написав $bx-dev, мы задали рабочий контур: исследование перед изменениями, реализация, проверки, ревью и DDD классификация там, где она действительно нужна
А написав "/goal ..." – мы зафиксировали задачу, критерий завершения и требования к процессу. Агенту сложнее закончить раньше времени: при попытке остановиться его возвращает к цели, проверкам и требованиям из $bx-dev и напоминанию использовать skill-library (буст +16 п.п. к эффективности)
Получается, что у нейронки нет нормального выхода из цикла, пока она не сверится с критерием завершения: полностью перенести систему и не потерять бизнес-логику. При каждой попытке останова её пинают и говорят следовать промпту из /goal, который отлично напоминает про задачу и требования к её исполнению
Отправили всё в кодекс и ушли заниматься своими делами, – спустя 8 часов имеем ваншотом полностью перенесенный проект на другой яп. Запустили, проверили – есть пара мелких недочетов, но фиксятся они за 5-10 минут
Суть в том, что $bx-dev сам по себе вполне автономен и хорошо справляется с большинством задач. А в связке с /goal мы это дополнительно усилили, исключив потерю контекста с течением времени
Теперь самое интересное... Я решил в паблик выложить свой bx-dev skill и встроенную skill-library с механизмом ленивой загрузки 105 скиллов, которые использую в повседневных задачах
В репе описал, как устроен скилл и как с ним работать в разных сценариях
Скилл самодостаточен и готов к работе из коробки, нужны лишь утилиты gh (для git репы проекта) и jq (для записи состояний)
Please open Telegram to view this post
VIEW IN TELEGRAM
Аппрувнули заявку на четырехдневную трипу в Шерегеш. Даже отпуск взял на недельку ради такого события. Поедем с Мотей (он справа на фото, проходил стажку в Яндексе) жарить маршмелоу и баб сосиски на костре, по 3 штуки на каждого
Вообще суть мп — 300 человек хакатонят бота для мессенджера MAX, но со 2-го июня у меня овердрафт на сабку кодекса. Если овердрафт кончится прям перед поездкой — придетсяписать вручную только отдыхать (наконец-то) и повышать соц капитал
P.s — на фото те самые бабы, по 3 штуки на каждого, в правом нижнем углу
Вообще суть мп — 300 человек хакатонят бота для мессенджера MAX, но со 2-го июня у меня овердрафт на сабку кодекса. Если овердрафт кончится прям перед поездкой — придется
У кодекса есть интересная механика овердрафта, которая действует на любые виды подписок
Раньше брал сабку за $20 – пользовался месяц, не отвязывая карту с нулевым балансом, и потом в течение 1-4 недель вылазила табличка "оплатите пожалуйста, доступ скоро кончится", при этом доступ оставался на весь период овердрафта
Когда пересаживался на кодекс, вообще забыл об этом. И вот происходит то же самое, но на сабке $200. Квазислучайно овердрафчу уже ~2 недели
Когда опенаи поймёт, что продлевать вы не собираетесь, – подписку отзовутв самый неподходящий момент, но платить не заставят
Затем заново как обычно оформляем подписку – получается, платим $200 раз в 1.5-2 месяца?
Честно, я не абузер и готов послушно платить $200 раз в месяц (а на клоде было аж $400/месяц и без овердрафтов). Но когда дают месяц бесплатного доступа к фронтирным моделям просто так, без каких-либо действий с моей стороны, грех не воспользоваться. С барского плеча, так сказать
Раньше брал сабку за $20 – пользовался месяц, не отвязывая карту с нулевым балансом, и потом в течение 1-4 недель вылазила табличка "оплатите пожалуйста, доступ скоро кончится", при этом доступ оставался на весь период овердрафта
Когда пересаживался на кодекс, вообще забыл об этом. И вот происходит то же самое, но на сабке $200. Квазислучайно овердрафчу уже ~2 недели
Когда опенаи поймёт, что продлевать вы не собираетесь, – подписку отзовут
Затем заново как обычно оформляем подписку – получается, платим $200 раз в 1.5-2 месяца?
Честно, я не абузер и готов послушно платить $200 раз в месяц (а на клоде было аж $400/месяц и без овердрафтов). Но когда дают месяц бесплатного доступа к фронтирным моделям просто так, без каких-либо действий с моей стороны, грех не воспользоваться. С барского плеча, так сказать
Окончил 3й курс – наконец-то появилось время для петиков
Вообще, уже пора собраться с мыслями, перестать прокрастинировать во второстепенных проектах, выпустить[до конца июня] свою доработанную версию gbrain (капля в море). Отдохнуть в отпуске и двигаться дальше
А пока что допилил телеграмм-асистента: теперь доступна не только умная транскрибация голосовых, но и:
1. Выгрузка текстовых сообщений по чатам
2. Автолайк новых и старых постов в тг каналах с очень тонкой настройкой. Это моя самая любимая фича
В будущем добавлю возможность автопересылки постов (текст+медиа, старые+реалтайм) из групп и тгк, даже с отключенной пересылкой в них, например, в топик своей группы. Ну и до кучи будет еще экспорт по таким чатам с медиа-выгрузкой, почему бы нет
За подобные грабберы тг-постов люди раньше (да и сейчас) платили ох сколько денег, сейчас это делается буквально за один хороший промпт
А зачем это нужно? Мне комфортнее иметь эти функции в быстром доступе, чем их не иметь. Например, быстрый экспорт личных/публичных чатов для оцифровки личности или смотреть на эмоции людей от фидбека реакциями под их постами в личных тгк
😨 Обнова уже в гите: тык
Вообще, уже пора собраться с мыслями, перестать прокрастинировать во второстепенных проектах, выпустить
А пока что допилил телеграмм-асистента: теперь доступна не только умная транскрибация голосовых, но и:
1. Выгрузка текстовых сообщений по чатам
2. Автолайк новых и старых постов в тг каналах с очень тонкой настройкой. Это моя самая любимая фича
В будущем добавлю возможность автопересылки постов (текст+медиа, старые+реалтайм) из групп и тгк, даже с отключенной пересылкой в них, например, в топик своей группы. Ну и до кучи будет еще экспорт по таким чатам с медиа-выгрузкой, почему бы нет
За подобные грабберы тг-постов люди раньше (да и сейчас) платили ох сколько денег, сейчас это делается буквально за один хороший промпт
А зачем это нужно? Мне комфортнее иметь эти функции в быстром доступе, чем их не иметь. Например, быстрый экспорт личных/публичных чатов для оцифровки личности или смотреть на эмоции людей от фидбека реакциями под их постами в личных тгк
Please open Telegram to view this post
VIEW IN TELEGRAM
Хочу выучить тóкипóну и написать на ней пару постов
Самый добрый язык на свете. Всего 120 слов. На него даже майнкрафт переведён, казалось бы🥴
💫 toki li pona. mi lukin e ijo suli
Самый добрый язык на свете. Всего 120 слов. На него даже майнкрафт переведён, казалось бы
Речь простая. Я смотрю на важное
Please open Telegram to view this post
VIEW IN TELEGRAM
Как не потерять продуктивность?
Одна из лучших покупок для дома – анализатор воздуха. Очень важны температура и концентрация CO2 в воздухе
Моя рабочая атмосфера, в которой КПД мозга максимален: 22.5°C (при 45-50% RH) и 550 ppm CO2. Моё плато размышлений, так сказать
Помню, как в 11-м классе, в 2023-м году, решал задачки по химии при подготовке к ЕГЭ, это было 33-е задание. Апрель, на улице +2. Я открыл окно настежь и просидел так весь день. Это был один из самых продуктивных дней. Я сделал невероятно много, но потом заболел
При низкой температуре есть бафф к продуктивности, но есть и дебафф – организм быстрее истощается. При высокой температуре плюсов нет... мозг сильнее троттлит, а организм тратит много сил на охлаждение
При высокой концентрации CO2 появляется сонливость и затуманенность сознания. Мы чаще входим в режим, который я называю псевдопотоком. Кажется, вот ещё чуть-чуть, и всё закончишь. Но проходит час, два, время улетает мигом. Потом отходишь на полчаса подышать воздухом, возвращаешься и видишь, какую несуразицу делал всё это время. После этого за гораздо меньший промежуток времени делаешь больше и качественнее
Самое ужасное сочетание – CO2 выше 850 ppm и температура выше 26°C. Это точка, после которой мозг начинает реально тупить, и осознать это можно только с опытом. Кажется, что всё как обычно и ты контролируешь ситуацию, но процесс снижения КПД размышлений уже запущен. С этого момента каждое повышение ppm или температуры только ухудшает ситуацию
Своего плато по размышлениям я добиваюсь через мобильный кондиционер и небольшую щель в оконном уплотнителе. Включаю на часик режим dry, затем на постоянку cool. Получается, в комнате прохладно, а из-за щели и разницы давления от кондиционера свежий воздух заходит внутрь. Физика в чистом виде
А при сильной усталости, предвыгорании, мне отлично помогает этот магний. Принимаю 1табл по утрам на протяжении недели (иногда двух), и выгорание/длительная усталость снимаются как рукой. Вообще, магний имеет накопительный эффект (курс 30 дней), но у меня результат прослеживается уже через 4 дня
В критические дни, когда нужен максимальный фокус, принимаю ноотропы. Делаю это крайне редко, потому что однажды мне очень понравился эффект, и я пил их полгода, хотя по инструкции был месяц. Потом мозги стали ватными на 2-3 недели, я почти ничего не соображал. Не советую повторять :)
С тех пор пью только когда реально жесть по задачам и нужна продуктивность. Например, полный рабочий день, а вечером ещё подготовка к экзаменам. И там, и там нужно полное погружение с максимальной отдачей. Недавно я был в таком режиме около 3 недель
По ощущениям, бафф ноотропов в том, что КПД уставшего мозга почти не отличается от КПД отдохнувшего. Усталость, конечно, чувствуется, отдохнуть хочется. Но если продолжать что-то делать, на результате это почти не сказывается
В посте описал только свой опыт. Прежде чем пить магний или ноотропы, проконсультируйтесь с врачом
Одна из лучших покупок для дома – анализатор воздуха. Очень важны температура и концентрация CO2 в воздухе
Моя рабочая атмосфера, в которой КПД мозга максимален: 22.5°C (при 45-50% RH) и 550 ppm CO2. Моё плато размышлений, так сказать
Помню, как в 11-м классе, в 2023-м году, решал задачки по химии при подготовке к ЕГЭ, это было 33-е задание. Апрель, на улице +2. Я открыл окно настежь и просидел так весь день. Это был один из самых продуктивных дней. Я сделал невероятно много, но потом заболел
При низкой температуре есть бафф к продуктивности, но есть и дебафф – организм быстрее истощается. При высокой температуре плюсов нет... мозг сильнее троттлит, а организм тратит много сил на охлаждение
При высокой концентрации CO2 появляется сонливость и затуманенность сознания. Мы чаще входим в режим, который я называю псевдопотоком. Кажется, вот ещё чуть-чуть, и всё закончишь. Но проходит час, два, время улетает мигом. Потом отходишь на полчаса подышать воздухом, возвращаешься и видишь, какую несуразицу делал всё это время. После этого за гораздо меньший промежуток времени делаешь больше и качественнее
Самое ужасное сочетание – CO2 выше 850 ppm и температура выше 26°C. Это точка, после которой мозг начинает реально тупить, и осознать это можно только с опытом. Кажется, что всё как обычно и ты контролируешь ситуацию, но процесс снижения КПД размышлений уже запущен. С этого момента каждое повышение ppm или температуры только ухудшает ситуацию
Своего плато по размышлениям я добиваюсь через мобильный кондиционер и небольшую щель в оконном уплотнителе. Включаю на часик режим dry, затем на постоянку cool. Получается, в комнате прохладно, а из-за щели и разницы давления от кондиционера свежий воздух заходит внутрь. Физика в чистом виде
А при сильной усталости, предвыгорании, мне отлично помогает этот магний. Принимаю 1табл по утрам на протяжении недели (иногда двух), и выгорание/длительная усталость снимаются как рукой. Вообще, магний имеет накопительный эффект (курс 30 дней), но у меня результат прослеживается уже через 4 дня
В критические дни, когда нужен максимальный фокус, принимаю ноотропы. Делаю это крайне редко, потому что однажды мне очень понравился эффект, и я пил их полгода, хотя по инструкции был месяц. Потом мозги стали ватными на 2-3 недели, я почти ничего не соображал. Не советую повторять :)
С тех пор пью только когда реально жесть по задачам и нужна продуктивность. Например, полный рабочий день, а вечером ещё подготовка к экзаменам. И там, и там нужно полное погружение с максимальной отдачей. Недавно я был в таком режиме около 3 недель
По ощущениям, бафф ноотропов в том, что КПД уставшего мозга почти не отличается от КПД отдохнувшего. Усталость, конечно, чувствуется, отдохнуть хочется. Но если продолжать что-то делать, на результате это почти не сказывается
Пока готовлю публичную версию форка gbrain (раз, два), хочу рассказать про интересную механику тестирования, до которой дошёл совершенно случайно
В закрытом контуре делал систему распознавания речи (с разделением голосов) из монодорожки. Параллельно пришел проект по созданию речи из текста. И на второй день разработки меня осинило...
Как тестировать распознавание речи? Слушать человеку!
Как тестировать создание речи? Слушать человеку!
Человек становится узким местом, бутылочным горлышком. От этого нужно избавляться
Как исправляем? Генерируем несколько речей, объединяем в монофайл, немного накладываем голоса друг на друга, моделируя реальные перебивания. Отправляем файл распознаваться. Сверяем результаты по транскрибации и диаризации. Подкручиваем параметры
Получается, round-trip testing, циклическое тестирование TTS – ASR
Это открывает просто тонну возможностей. Проверка частных сценариев: наложения голосов, длительность их наложения; распознавание похожих голосов; распознавание островков. Тысячи вариантов
Мы смогли исключить человека из цепочки разработки. К этому всегда нужно стремиться! Теперь мы можем написать нейросети грамотный промпт и отправить на итеративное автоулучшение
В закрытом контуре делал систему распознавания речи (с разделением голосов) из монодорожки. Параллельно пришел проект по созданию речи из текста. И на второй день разработки меня осинило...
Как тестировать распознавание речи? Слушать человеку!
Как тестировать создание речи? Слушать человеку!
Человек становится узким местом, бутылочным горлышком. От этого нужно избавляться
Как исправляем? Генерируем несколько речей, объединяем в монофайл, немного накладываем голоса друг на друга, моделируя реальные перебивания. Отправляем файл распознаваться. Сверяем результаты по транскрибации и диаризации. Подкручиваем параметры
Получается, round-trip testing, циклическое тестирование TTS – ASR
Это открывает просто тонну возможностей. Проверка частных сценариев: наложения голосов, длительность их наложения; распознавание похожих голосов; распознавание островков. Тысячи вариантов
Мы смогли исключить человека из цепочки разработки. К этому всегда нужно стремиться! Теперь мы можем написать нейросети грамотный промпт и отправить на итеративное автоулучшение