Миша Малышев
619 subscribers
62 photos
9 videos
76 links
Download Telegram
Я LLM power user - пользуюсь Claude, Perplexity, ChatGPT, Grok и иногда Gemini. И это только в вебе/на мобилке

Ещё я работаю в Claude Code и Cursor - не только для кодинга, но ещё и для написания текстов, когда есть много контекста (создаю папку с маркдаун файлами и тэгаю её в чате)

У меня проблема фрагментации контекста: чатгпт хорошо знает лично меня (у меня там около 2500 чатов), но у меня ещё есть дип ресёрч из перплексити и клода, папка с кодом и перепска из телеграма

Каждый раз, когда я подключаю нужные MCP, скачиваю и складываю все эти тексты и артефакты в папку, и открываю её в курсоре, мне кажется, что я делаю что-то не так

Результаты таких context engineering сессий уходят в markdown файлики с саммари, которые сами по себе сложно переиспользовать, потому что в этом саммари теряются важные детали

Короче, хочется иметь какое-то центральное хранилище контекста. Как память в ChatGPT и папочка с маркдаунами, но только лучше
❤‍🔥2🤔1
Кстати, про память в ChatGPT. Когда она появилась, это был вау эффект. Один "нарисуй как ты меня видишь" чего стоит. До сих пор слышу как многие говорят "я на ChatGPT, он меня хорошо знает"

Но я вижу, что можно сделать сильно лучше. Какие сейчас есть проблемы с ChatGPT памятью?

Непонятно, насколько хорошо она работает. Реализация закрытая, сравнить с open source SOTA решениями на бенчмарках нельзя. И там точно не SOTA. Почему?

Экономия на масштабе. У OpenAI сотни миллионов пользователей, поэтому память должна быть дешёвой. Это означает трейд-офф между качеством и стоимостью

Закрытая экосистема. Да, есть Apps SDK. Но это walled garden. Память доступна только внутри ChatGPT. Для casual пользователей это ок, но не для таких, как я

Вот кстати как ChatGPT видит мой 2025 год
4
Миша Малышев
Я LLM power user - пользуюсь Claude, Perplexity, ChatGPT, Grok и иногда Gemini. И это только в вебе/на мобилке Ещё я работаю в Claude Code и Cursor - не только для кодинга, но ещё и для написания текстов, когда есть много контекста (создаю папку с маркдаун…
Я начал делать инструмент, который решает мою проблему фрагментацию контекста между AI-чатами

ownyour.chat - десктопное приложение, которое синхронизирует чаты из ChatGPT и Claude в локальную SQLite базу. Можно экспортировать в Markdown или JSON, есть MCP сервер

Уже пользуюсь сам: когда работаю в Claude Code, подключаю MCP и у агента есть доступ ко всем моим чатам, где я делал deep research или работал с текстом.

Много идей куда можно развивать. Память по чатам и чат-интерфейс с BYOK одни из них. Пока фокусируюсь на самой базе: синхронизация и надёжный экспорт.

НО

Честно: уже чувствую то состояние, при котором забрасывал прошлые проекты. Показывал знакомым и вижу мало энтузиазма. Много продуктово-бизнесовых вопросов, на которые у меня нет ответов. В вейтлист записался один человек. Не уверен, что эта проблема существует для кого-то кроме меня в таком виде. Тем не менее, хочу продолжать, пока нет иного понимания, что делать. Поэтому в этом твиттер аккаунте буду стараться build in public: https://x.com/OwnYourChat

Как думаете, где можно найти первых пользователей? Или всё-таки стоит забить?
🔥6🤔2❤‍🔥1👍1
Время билдить UI для Claude Code

В твиттере все сходят с ума по Claude Code. Люди используют его для совершенно разных задач, не только для кодинга. Почему? По ощущениям, Opus 4.5 это лучшая модель на сегодняшний день. А Claude Code это лучший способ ей пользоваться.

Тем временем, многие разработчики всё ещё игнорируют CC, во многом из-за ограничений терминала. Если уж разработчики скептически относятся к консоли, то у casual users ещё больше будет фрикшена. Это всего лишь моя гипотеза, конечно. Тем не менее, вижу большой тренд на продукты вокруг CC, в том числе UI.

Написал пост с примерами в твиттере: https://x.com/topcatnocap/status/2008880522861105286

А какие у вас мысли? Ещё сидите на курсоре? 🙂
🔥6🤔1
Миша Малышев
Время билдить UI для Claude Code В твиттере все сходят с ума по Claude Code. Люди используют его для совершенно разных задач, не только для кодинга. Почему? По ощущениям, Opus 4.5 это лучшая модель на сегодняшний день. А Claude Code это лучший способ ей пользоваться.…
Вдогонку к прошлом посту несколько интересных демо, которые запустили на днях

1. CallMe - Claude Code может звонить на телефон или часы, когда ему нужен human in the loop

https://x.com/boredgenius/status/2009035664860565525

2. Claude Canvas - вот это вообще сумасшествие, очень нравится. Прошлый пост был озаглавлен «Время билдить UI для Claude Code», но я не думал, что увижу такое - чел буквально сделал UI, прямо в консоли! Посмотрите видео, там email клиент, календарь, и бронирование авиабилетов. Выглядит очень ретро-футуристично

https://x.com/dvdsgl/status/2008685488107139313

3. Kanban как интерфейс для AI кодинг агента - создаёшь таски, а агент делает их и двигает по доске. В комментариях к таскам можно давать пояснения

https://x.com/geoffreylitt/status/2008735715195318397
🤯6🔥3🤔2
Миша Малышев
Вдогонку к прошлом посту несколько интересных демо, которые запустили на днях 1. CallMe - Claude Code может звонить на телефон или часы, когда ему нужен human in the loop https://x.com/boredgenius/status/2009035664860565525 2. Claude Canvas - вот это вообще…
Я сделал плагин для Claude Code

Сегодня ресёрчил что есть для памяти в Claude Code. Есть несколько популярных решений, но они все странные:

claude-mem - 12к+ звёзд на гитхабе. Выглядит монструзно: большой рантайм, работает нестабильно и тратит много токенов. Реально много, люди жалуются что у них моментально высаживается квота в Claude Max. Я попробовал, но он не видит старые чаты, индексирует только новые.

Continuous Claude. Требует установки каких-то питоновых зависимостей, есть разные варианты установки. Глобальный режим перезаписывает ВСЁ что лежит в ~/.claude, даже settings.json. Я не рискнул пробовать.

Ещё есть Ensue, но это в облаке, нужно регистрировать аккаунт.

В общем я решил сделать свой dead-simple плагин, который позволяет агенту искать по истории чатов. Это так просто и работает так хорошо, что мне кажется, что эту фичу добавят в следующей версии Claude Code.

О плагине и как установить: https://x.com/topcatnocap/status/2009704770760839448
🔥13👍4🤔1
Подписчики, помогайте
🤔3
Human-in-the-Loop → Human-on-the-Loop

Недавно посмотрел фильм No Other Choice. В нём корейский работяга с бумажной фабрики пытается найти работу в индустрии, где идут массовые сокращения и всё автоматизируется. Теперь на производстве не нужны люди - всё делают роботы. Задача человека - следить за конвейером. Требования растут, рабочих мест меньше. Чтобы получить работу, главный герой решает убить конкурентов. Дальше спойлерить не буду - советую посмотреть, фильм хороший.

В моей индустрии происходит похожее: в непосредственной разработке человек больше не нужен.

Software engineering меняется. Теперь мы выстраиваем производственные линии. Мой воркфлоу это отражает: я чувствую себя Генри Фордом, который оптимизирует процессы под конвейер, где человек по максимуму выносится из цикла разработки и занимает позицию над ним.

Главная инженерная задача сегодня - убрать человеческий боттлнек. Кайф в том, что это не конкретная проблема с одним решением, а именно инженерная задача. Context engineering - это не про промпты, это про выстраивание production line, где AI-агенты планируют, разрабатывают, тестируют, деплоят и мониторят. Наша задача как инженеров - правильно дать агентам задачи, дать нужные инструменты и выставить правильные ограничения.

Я думаю, работы у программистов не станет меньше. Но она будет сильно другой и потребует перепрошивки майндсета: с "я контролирую систему" на "я контролирую систему, которая строит систему".
👍5💅2🤔1
Как я делаю Ralph Wiggum Loop

Даня запостил воркфлоу для Ralph Wiggum Loop - простой техники для автономной разработки в Claude Code (и не только), по которой сходит с ума вайб-кодинг твиттер. Попробовал на своих проектах, делюсь сетапом.

Проблема: автор предлагает два варианта - интерактивный (сидишь in-the-loop) или полностью автономный (`--dangerously-skip-permissions`). Первый неудобный, второй опасный - агент может случайно сделать непоправимое. Рекомендуемое решение - песочница/VPS, но я работаю над десктопом и мобилкой, которые нормально запускаются только локально.

Мой сетап:
1. Скрипт .claude/loop.js - запускает CC в non-interactive режиме с явными пермишенами через --allowedTools
2. На вход - файл с промптом и файл с планом.
3. Условие выхода: последняя строка плана STATUS: NOT STARTED → агент меняет на STATUS: DONE → скрипт останавливается. Важно, чтобы в промпте была про это инструкция.

Минус: если агенту не хватает прав, цикл не завершится и STATUS: DONE не проставится.

Что буду пробовать:
--permission-prompt-tool - агент просит разрешения через MCP, можно интегрировать прямо в терминале или например в телегу.
• Всё-таки настроить песочницу для React Native/Electron (например через докер) - сложно, но может быть worth it.

Код скрипта и примеры prompt.md и plan.md
3🔥2🤔1
Миша Малышев
Я сделал плагин для Claude Code Сегодня ресёрчил что есть для памяти в Claude Code. Есть несколько популярных решений, но они все странные: claude-mem - 12к+ звёзд на гитхабе. Выглядит монструзно: большой рантайм, работает нестабильно и тратит много токенов.…
Мой плагин для Claude Code стал бесполезным практически сразу

...потому что из-за ральфа моя история чатов стала выглядеть вот так (скрин)

Я сделал плагин для поиска контекста по истории чатов. Потом начал работать через ralph loop, и смысл поиска пропал: каждая итерация это новый чат со старым промптом. Чатов стало слишком много.

НО! На днях я нашёл идеальный инструмент в пару: beads.

Beads это CLI таск-трекер с dependency-aware graph, синхронизируется с git. Идеально для оркестрации: один агент декомпозирует запрос на таски, другой выполняет их в ральф лупе. Одна таска на один проход.

Ещё погрузился в Gas Town от автора Beads - это движок для оркестрации параллельных CC инстансов (автор говорит 10-20 - комфортно). Проект в относительном андеграунде, выглядит шизово, растёт быстро (меньше чем за месяц 60+ контрибьюторов). Скоро сделаю про него отдельный пост - он того стоит
🔥8
А вот как выглядит ответ от оркестратора, который пишет таски

Декомпозиция на эпики, критерии приёмки, простановка блокеров и приоритетов

Кто бы мог подумать, что ПМов заменят раньше, чем инженеров 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
🦄6
Миша Малышев
Как я делаю Ralph Wiggum Loop Даня запостил воркфлоу для Ralph Wiggum Loop - простой техники для автономной разработки в Claude Code (и не только), по которой сходит с ума вайб-кодинг твиттер. Попробовал на своих проектах, делюсь сетапом. Проблема: автор…
И конечно же я обновил свой loop.js скрипт, который теперь работает с beads и стримит вывод claude code в прямом эфире (прошлый loop.js так не мог, потому что с флагом -p CC выдаёт результат только в конце всех шагов)

Оставил его на всю ночь, забрал готовый и протестированный результат

Пока что не хватает механизма для эскалации до пользователя (например, когда не хватает каких-то кредов), но кроме этого всё работает очень гладко
🔥1🦄1
Вчера с Максом участвовали в хакатоне от Cerebras

Сделали первую итерацию над buildsomething.fun - платформы для создания приложений с платежами и мультиплеером из текстового промпта.

У нас было всего 24 часа, поэтому мы сфокусировались на простой идее: запуск приложений из твита, без авторизации, без платежей, но с мультиплеером.

Из крутого: давно не хакатонил и было очень здорово снова поиграть в эту игру. Получился прямо классический вариант: целый день полный фокус (нет времени даже нормально поесть), ничего не работает до последнего момента, за час до сабмишена начинает получаться и кое-как с дрожащими руками на последней минуте сабмитим.

Что можно было сделать лучше: использовать знакомый стек. Очень много времени ушло на то, чтобы разобраться в технологиях, которые раньше не юзал. Для такого короткого хакатона нужно было сразу пофлексить техничку и сфокусироваться на демках.

Как оно должно было работать:
• меншеним бота в твите с промптом
• агент кодит идею в e2b песочнице
• там же тестит и собирает
• деплоит бэк на SpacetimeDB и фронт на S3
• отвечает на твит ссылкой

Как оно на самом деле работало:
• на моём макбуке
• claude code с хром-расширением мониторит ленту (у твиттера нет апишки)
• видит твит с меншеном, проверяет базу данных (mentions.txt 🙂)
• дёргает скрипт, где non-interactive opencode кодит и тестит проект, который затем заливается на S3 и SpacetimeDB
• делает реплай со ссылкой

Кстати, ещё один минус работы с незнакомым стеком - большие сложности с делегированием работы агентам. Много времени ушло на вещи, которые я просто не знал как запромптить.

You are a senior engineer. Build this project. Make no mistakes
Please open Telegram to view this post
VIEW IN TELEGRAM
🦄7👍32🔥2🤔1
Show Me Your AI Setup


Сегодня в 19:00 по Москве (через ~1.5 часа) будет стрим с @og_mishgun

Я буду задавать вопросы: что пробовал, что реально работает, что дальше.

Будем импровизировать, будет лампово.
Накидывайте вопросы в комменты

🐳
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🐳3
Посмотрел интервью с Peter Steinberger, создателем Clawdbot/OpenClaw

Отличный пример инженера, который реально поднял свою продуктивность с помощью coding agents.

Почему я ему доверяю: он решал сложные задачи задолго до LLM (сделал PSPDFKit, в интервью про это много рассказывает), много шиппит и делает это качественно. Просто посмотрите его гитхаб: github.com/steipete

Что мне показалось интересным:

• Про ralph wiggum loop говорил закатывая глаза. Называет это попыткой обойти ограничения Opus 4.5, которые не возникают с Codex. У меня был похожий тейк на стриме: я назвал ральф костылём для context management, который в будущем не понадобится. И если верить Питеру, с Codex он не нужен уже сейчас. Интересно!

• В целом он сильно топит за GPT 5.2 Codex High и Codex CLI на сложных проектах против Claude Code, потому что GPT дольше читает код и планирует перед тем как начать работать. И за счёт этого получается качественно, хоть и не так дофаминово.

• Про найм: если будет делать компанию, будет искать тех, кто билдит for fun, high agency сеньоров, которым комфортно делегировать. Я слышу похожие тейки от знакомых фаундеров тоже, поэтому если это вы - вы в хорошем положении.

• Проехался по Gas Town: говорит оркестрация агентов не нужна, потому что узкое место не в них, а в голове инженера, который проектирует. У меня похожие ощущения от GT, но я не уверен, что agent swarms это тупик. Возможно его просто нужно нормально приготовить.

Ключевые тейки: perplexity.ai/search/key-takeaways-from-https-youtu-jW3h5VK_T1inV8j8vCyXZA
Полное интервью: youtu.be/8lF7HmQ_RgY
Ещё рекомендую статью про его воркфлоу, Shipping at Inference-Speed: steipete.me/posts/2025/shipping-at-inference-speed
🔥213💅2
This media is not supported in your browser
VIEW IN TELEGRAM
Далаем AI агента стримера поверх OpenClaw. Получается прикольно! Он уже может реагировать на сообщения из чата, ходить по интернету и щитпостить в твиттере

Пока это единичный экземпляр, но мы готовим skill, который позволит любому OpenClaw агенту делать так же

Как вам идея? Зашли бы на AI стрим?

crawd.bot
x.com/crawdbot
🤯12🦄75😁1
🤔4💅3😁1