MDA - Malakhov Dmitry’s channel
709 subscribers
32 photos
2 videos
41 links
Строю продукты руками AI-агентов и показываю как: воркфлоу, скиллы для Claude Code, фейлы с цифрами. Инструменты отдаю, новости не пересказываю. Дима, full-stack, Белград.
Download Telegram
ну пока это как-то так и ощущается 😁

тогда вопрос со звездочкой: если условный клиент на апворке платит почасовку через трекер - трекать только то, что ты печатаешь в клауде и когда тестируешь? или пока он там прогает тоже держим включенным? но тогда ты как будто бы не можешь делать ничего кроме (а тут тебе нефиг делать пока клод работает и в итоге только в потолок плевать остается)

если второе - то оно там еще скрины делает, и можно сделать вид, что ты работаешь над его проектом, но на самом деле - над другим (то есть над несколькими параллельно и кто там разберет что у тебя в клауде написано со скрина)

—-

или просто делать как чувствуешь, а трекер потом включать отдельно на ночь в паре с каким-нибудь софтом который активность имитирует (через usb flipper zero подключить, например и пусть спамит)

—-

в общем, современная этика работы и философия как она есть 😁
😁63
Forwarded from Евгений
так что целься в небо и стреляй на рандоме, как чувствуешь)
💯4
Цели в Codex это имба
2
делаю себе транскрибировалку звонков - первую версию сделал на электроне

А на днях увидел что Vercel выкатили ZeroNative для нативных аппок

Из минусов:
• очень молодая штука и много чего не хватает (always-on-top, hidden mode, прозрачность окна и кастомные попапы - и это только из того что сильно попалось сразу)
• zig вместо JS/TS для нативного слоя, UI на реакте или еще чем угодно ( но это и не минус если писать не мне :)

но из плюсов:
• у меня получилось сделать главные 90% функционала гораздо проще и быстрее
• оно весит 1.7mb vs 630mb для электрона и 28mb ram vs 200mb

Я вообще не мастер декстопа, но опыт весьма интересный (учитывая что я не написал ни строчки кода ни в той ни в другой версии)

ИИ агенты и тут дают очень интересные возможности, как можно выбрать стек уже не только по компетенции команды, но и по тому, что по факту лучше подходит для конкретного проекта
7
btw, новый гемини ничего себе быстрый
по бенчмаркам сопоставим клодом 4,7 и гпт 5,5, но кратно быстрее и даже дешевле

дал простейшую задачу проверить, есть ли доступ к Cooloify - гемини пошуршал и нашел все за 29 секунд, жпт за 1 минуту 41 секунду

буду держать вас в курсе
👍51
в комментах к посту Давида про "технологическую толерастию" была хорошая мысль:

типа если хочешь, чтобы AI не размазывал "все инструменты по-своему хороши", дай ему флейвор (ака вкус/предпочтение)

представь, что он злой уставший эксперт, который ненавидит когда у него отнимают время. задай ценности. получишь нормальную линзу.

и я сначала такой: да, вроде норм, я кажется тоже так делал когда-то

а потом пошел смотреть свою историю с Codex/Claude.

–––

нашел места, где агент реально говорил не "ну тут зависит", а примерно человеческое:

TanStack Start подходит этому CRM лучше, чем голый Vite + Router, но Hono как отдельный backend может оказаться лишним, если нет отдельного публичного API.

или:

идея с Telegram fork норм, но не как "просто заменить все на iframe", а как thin-adapter model. потому что обычный iframe начнет делить storage/shared workers и ловить новые гонки между аккаунтами.

или:

для канала работает "я сжег $100, вот вывод", а для Хабра лучше "разбор продакшен-граблей voice agents: latency, state machine, interruptions, tool calls, regression tests".


–––

и вот что меня зацепило.

это не появилось от промпта "будь жестким".

там не было магического флейвора "ты злобный техлид, которого заебали".

там была довольно скучная бытовуха, живущая в контексте чата, документах проекта и тд:

• какой проект/стек
• какие ограничения тут и там
• что уже когда-то сломалось
• где есть тесты и какие
• что стоит денег и каких
• что трогать опасно/нельзя, а что беспросветное легаси, на которое нельзя смотреть
• какой следующий шаг реально можно проверить и как

то есть у ответа появился риск быть неверным, и четкие рамки, в том числе и того, что ответ который будет дан можно проверить через соседнего агента, который тоже даст свое мнение и они посрутся придут к консенсусу

–––

при этом у меня это происходит довольно органично, потому что я буквально всю работу делаю через агентов, и все шаги, решения, результаты всегда записаны в истории и в доках, к ним можно вернуться (как я и сделал тут для поиска примеров выше), поэтому это накапливаемое знание постоянно и активно участвует в процессе

и вот без всего этого "будь резким" превращается просто в хамоватую версию той же каши.

AI начнет увереннее говорить "Го - говно", но это все еще не ответ.

ответ начинается там, где он говорит:

"Go норм для X, но в вашем случае Y будет дешевле, потому что вот этот runtime, вот этот deploy, вот эта команда, вот этот риск".

–––

короче, сейчас я бы разделял две штуки

флейвор помогает тону - это правда

но вкус появляется не из тона, а из ограничений и контекста

если не дать агенту реальный контекст, он будет молиться всем технологиям сразу. если дать код, историю решений, продакшен-факты, бюджет, тесты и право сказать "это не тащим" - у него внезапно появляется маленькое "фи".

не душа, конечно.
но уже и не техно-гороскоп
3👍2👌1
У меня давно крутится вопрос: где должен жить общий опыт AI-агентов?

Сейчас знание размазано по чатам, README, claude.md, личным заметкам, Slack-тредам и случайным локальным файлам. Каждый новый агент или участник команды часто заново раскапывает то, что кто-то уже понял до него.

Для одного человека это еще терпимо. Для команды или комьюнити — уже странно. Люди работают над разными проектами, но постоянно находят похожие паттерны, ограничения, грабли и решения. Хочется, чтобы этот переваренный опыт не пропадал.

При этом идея "давайте просто загрузим все чаты в облако" кажется плохой. Сырая память должна оставаться локально: там много мусора, приватного контекста и секретов.

А вот переваренное знание можно складывать в общую базу knowledge nodes: решения, рабочие практики, ограничения, инструкции, выводы. С доступами по ролям, командам, департаментам, воркспейсам — условно Postgres + RLS, но поверх этого нормальная модель доверия.

Главная сложность тут не хранение. Главная сложность — не дать базе заслопиться.

Каждый новый узел должен проходить проверку: не тащит ли он секреты, не дублирует ли существующее, не вредоносный ли он, не является ли уверенно написанной ерундой.

И нужна репутация источников. Если твое знание реально используется и помогает другим — доверие растет. Если ты льешь мусор, спам или опасные инструкции — доверие падает, вплоть до бана.

В итоге получается не "общая история чатов", а общий слой проверенного опыта, к которому могут подключаться люди и агенты.

Мне кажется, это может стать чем-то вроде нового типа сообществ, где люди не просто общаются, а их агенты обмениваются знаниями и помогают друг другу решать уникальные задачи

Что думаете?
8👍2
Давид @run_davids_sh выкатил методичку WSD — архитектуру фронта, которой не нужен рефакторинг. Прочитал, и сразу триггернуло одну штуку, которая давно крутилась.

WSD работает, потому что у фронта один энтрипоинт — UI. Все слои выстраиваются от него вниз. Но как только проект перерастает одну морду — появляется бот, воркер, публичное API, MCP-тул, скрипт ретраев — модель размещения начинает плыть. Бизнес-логику в shared класть нельзя, там примитивы. В роут нельзя, он не один. В "ещё один widget" не вяжется, widget про UI.

Особеннно если мы говорим про фулстек сетапы на Next.js/Tanstack Start/монорепо и тд

Сел и упаковал это в что-то вроде методички:
Capability Core + Adapters.

Не Clean Architecture, не FSD-для-фулстека. Словарь и правила размещения, отвечающие на один вопрос: кто владеет поведением, когда энтрипоинтов много.

- framework routes за энтрипоинтами
- capabilities за поведением
- domain за правдой
- contracts за границами
- platform за инфрой
- shared за примитивами

Отдельно прописал кусок про работу с кодинг-агентами. У них без явных правил размещения дефолт разрушительный: видят роут — пишут логику туда, видят shared — пихают продуктовый хелпер, падает джоба — патчат только её путь. Репо даёт им ретривал-процедуру и куда что класть.

На серебряную пулю не претендую. Но как дефолтный подход, когда никакого подхода нет - думаю самое то. shadcn для архитектуры, так сказать)

А если у вас уже есть своя и работает — оставляйте ее)

https://github.com/malakhov-dmitrii/capability-core-adapters
❤‍🔥4👍2💋2🔥1🤝1
Сегодня в 20.00 МСК @danokhlopkov позвал на стрим, где мы обсудим:

👨‍💻 Последний год я практически полностью живу в терминале/кодексе, и делаю там всё, что раньше делал руками - от написания кода до авто-раскапывания архивов слака и глубин джиры в поисках подробностей по задачам, исследований для своих продуктов и даже полной автоматизации линкедина и Х

🤖 Там будет и про агентов, как перестроить свое мышление, чтобы рулить армиями агентов, получать от них максимальную пользу, найти новые источники дохода, вовремя заметить проблемы и не сойти с ума от обилия информации из всех щелей

Заходите, подписывайтесь, задавайте вопросы - будет интересно!)
🔥5
Отдельно сильно люблю кодекс за Computer Use, что его можно отправить сделать полный UAT на новую фичу, натыкать всякого муторного внутри бездонных google cloud/cloudflare/aws и прочего, без необходимости гуглить каждый шаг, утыкаясь в устаревшую документацию 🫰
1
Стрим прошел (по ссылке есть и запись), и мы затронули много прелюбопытных тем:

• прямо перед началом вышел Opus 4.8 и мы глянули что обещают
• я рассказал про то, чем же я занял кодекс, что он работал аж 47 часов кряду
• как агентами автоматизировать SMM и браузеры, и как это можно масштабировать
• как заработать на баунти программах в опенсорсе, где всю работу за тебя сделают агенты
• как поймать агентов на вранье и лени, и что с этим делать
• как разные модели отличаются друг от друга и что для чего подходит
• как я собрал свою транскрибировалку чтобы записывать встречи и потом кормить ими "второй мозг"

Еще я обещал что эту транскрибировалку я выложу в открытый доступ, а вот и она - https://github.com/malakhov-dmitrii/meeting-companion

Для работы вам будет нужен только Deepgram API ключ, который вы можете получить, зарегистрировавшись у них на сайте - они дают 200$ бесплатных API кредитов на каждую регистрацию - этого должно хватить очень надолго

—-

Ну а еще я провожу консультации по AI-адопшену для себя или для вашей компании, разработке агентов, обвязок к ним и всякого "как бы нам прикрутить AI вот сюда" - пишите в @hennessy81
🔥5
это просто жопа

опус 4.8 думает конечно вроде неплохо, но такие приколы за 1 день на одной лишь задаче это реально жопа
😁6🔥3😨1
Неожиданный факт, но оказывается кодекс умеет координировать несколько чатов, в том числе - стартовать новые
Не субагентов (которые постоянно тупят и теряются), а именно отдельные чаты, которые он может сам вести, докидывать туда инструкции и тд

Мне кажется, это очень интересный вариант оркестрации, в тч потому, что можно их делать очень гибко, задать им иерархию, роли, hearbeat и тд

Надо попробовать, буду держать в курсе 🫡
🔥7
я почти не пишу код руками. весь день сижу и допрашиваю своих же агентов: «откуда ты это взял, покажи в коде».

думал, автоматизация разгрузит голову. ни хрена — навалила сверху.

написал на хабр, как у меня агент за двое суток снёс базу и потом два дня полировал тупик, и почему даже мои агенты-проверяльщики врут мне в лицо. дар это или лоботомия — сам пока не понял 😁

читать тут 👉
🔥5👍3👏1🤣1
ой кто бы мог подумать, да?
Ловцы покемонов невольно собирали данные для системы навигации военных БПЛА — компания Niantic Spatial, созданная на базе разработчика Pokemon Go, могла использовать снимки, которые на протяжении многих лет делали миллионы игроков — Trouw

#PokemonGo #gaming
😁7
кто я: тут. Дима, full-stack из Белграда, строю продукты руками AI-агентов и показываю как. с чего начать:

🛠 применить себе:
- beast-forge, скилл для Claude Code, который планирует сложные фичи, апдейт
- performance review и резюме из git-истории за 15 минут

💻 как агенты поменяли мой воркфлоу:
- почему я перестал открывать IDE
- я перестал думать про реализацию

🔥 серия про вайбкодинг, за которую меня минусили на Хабре: раз, два, три, и чем всё кончилось

💰 сколько стоит разработка, когда код пишет агент

вопросы в комменты или в чат @malakhov_dm_chat. из ваших вопросов рождаются лучшие посты 😁
😎5🔥32
блин, только вчера выяснил что xiaomi mimo v2 flash самая охуенная моделька для браузера (очень дешёвая, очень быстрая, и работает лучше более свежих моделей)

как сегодня они объявляют ее депрекейтед и через неделю отрубают 🌚
1🙏1😘1
вот вам и устанавливайте что попало из опенсорса

все-таки не зря я все такие штуки ставлю и проверяю через агентов
🫡3😱1🍾1💘1