MDA - Malakhov Dmitry’s channel
709 subscribers
32 photos
2 videos
41 links
Строю продукты руками AI-агентов и показываю как: воркфлоу, скиллы для Claude Code, фейлы с цифрами. Инструменты отдаю, новости не пересказываю. Дима, full-stack, Белград.
Download Telegram
Отдельно сильно люблю кодекс за Computer Use, что его можно отправить сделать полный UAT на новую фичу, натыкать всякого муторного внутри бездонных google cloud/cloudflare/aws и прочего, без необходимости гуглить каждый шаг, утыкаясь в устаревшую документацию 🫰
1
Стрим прошел (по ссылке есть и запись), и мы затронули много прелюбопытных тем:

• прямо перед началом вышел Opus 4.8 и мы глянули что обещают
• я рассказал про то, чем же я занял кодекс, что он работал аж 47 часов кряду
• как агентами автоматизировать SMM и браузеры, и как это можно масштабировать
• как заработать на баунти программах в опенсорсе, где всю работу за тебя сделают агенты
• как поймать агентов на вранье и лени, и что с этим делать
• как разные модели отличаются друг от друга и что для чего подходит
• как я собрал свою транскрибировалку чтобы записывать встречи и потом кормить ими "второй мозг"

Еще я обещал что эту транскрибировалку я выложу в открытый доступ, а вот и она - https://github.com/malakhov-dmitrii/meeting-companion

Для работы вам будет нужен только Deepgram API ключ, который вы можете получить, зарегистрировавшись у них на сайте - они дают 200$ бесплатных API кредитов на каждую регистрацию - этого должно хватить очень надолго

—-

Ну а еще я провожу консультации по AI-адопшену для себя или для вашей компании, разработке агентов, обвязок к ним и всякого "как бы нам прикрутить AI вот сюда" - пишите в @hennessy81
🔥5
это просто жопа

опус 4.8 думает конечно вроде неплохо, но такие приколы за 1 день на одной лишь задаче это реально жопа
😁6🔥3😨1
Неожиданный факт, но оказывается кодекс умеет координировать несколько чатов, в том числе - стартовать новые
Не субагентов (которые постоянно тупят и теряются), а именно отдельные чаты, которые он может сам вести, докидывать туда инструкции и тд

Мне кажется, это очень интересный вариант оркестрации, в тч потому, что можно их делать очень гибко, задать им иерархию, роли, hearbeat и тд

Надо попробовать, буду держать в курсе 🫡
🔥7
я почти не пишу код руками. весь день сижу и допрашиваю своих же агентов: «откуда ты это взял, покажи в коде».

думал, автоматизация разгрузит голову. ни хрена — навалила сверху.

написал на хабр, как у меня агент за двое суток снёс базу и потом два дня полировал тупик, и почему даже мои агенты-проверяльщики врут мне в лицо. дар это или лоботомия — сам пока не понял 😁

читать тут 👉
🔥5👍3👏1🤣1
ой кто бы мог подумать, да?
Ловцы покемонов невольно собирали данные для системы навигации военных БПЛА — компания Niantic Spatial, созданная на базе разработчика Pokemon Go, могла использовать снимки, которые на протяжении многих лет делали миллионы игроков — Trouw

#PokemonGo #gaming
😁7
кто я: тут. Дима, full-stack из Белграда, строю продукты руками AI-агентов и показываю как. с чего начать:

🛠 применить себе:
- beast-forge, скилл для Claude Code, который планирует сложные фичи, апдейт
- performance review и резюме из git-истории за 15 минут

💻 как агенты поменяли мой воркфлоу:
- почему я перестал открывать IDE
- я перестал думать про реализацию

🔥 серия про вайбкодинг, за которую меня минусили на Хабре: раз, два, три, и чем всё кончилось

💰 сколько стоит разработка, когда код пишет агент

вопросы в комменты или в чат @malakhov_dm_chat. из ваших вопросов рождаются лучшие посты 😁
😎5🔥32
блин, только вчера выяснил что xiaomi mimo v2 flash самая охуенная моделька для браузера (очень дешёвая, очень быстрая, и работает лучше более свежих моделей)

как сегодня они объявляют ее депрекейтед и через неделю отрубают 🌚
1🙏1😘1
вот вам и устанавливайте что попало из опенсорса

все-таки не зря я все такие штуки ставлю и проверяю через агентов
🫡3😱1🍾1💘1
Тут OpenRouter выкатил Fusion - по сути, этакая “метамодель”, в которая прогонит запрос через несколько моделей, чтобы они вернули лучший ответ

А я уже проверил, и не могу сказать, что это прям такой классный вариант, как они пишут.

Вернее, сам подход - отличный, что-то такое уже давно применяется, когда для ревью работы одного агента используется другой агент - claude -> codex, и наоборот, пока не придут к консенсусу. И по качеству оно заметно лучше, чем просто соло агент (любой)

—-

Так вот, как этим пользоваться в реальной работе - вопрос. У многих есть подписки Claude Code/Codex (а то и все сразу), и платить полноценный usage - не имеет смысла (особенно, если есть и то и другое)

Более того, оказалось, что для работы с таким пока не поддерживается особо нормальный вызов тулов, контекст ограничен наименьшей моделью (если у кими 128к, то хоть у вас опус и гпт на 1м - запросто может начать компактить еще до начала работы)

—-

Короче, я пошел и сделал свой fusion, который работает с вашим Claude Code/Codex/OpenCode - пишет план, который со всех сторон проверяется N агентами X раундов, пока они не придут к единому мнению по ключевым вопросам. Каждый получает сырую задачу и самостоятельно изучает вопрос, готовит план, потом они все смотрят на планы друг друга, получают фидбек по "тесту на дебила" по каждому плану от отдельного агента, обсуждают, если надо возвращаются к юзеру по спорным моментам, и так до тех пор, пока план не будет принят

То есть получается, что все ошибки, которые агенты могли бы поймать сами - они поймают и учтут. А исполнение можно поручить уже любым удобным способом

По дефолту себе сделал Opus 4.8 vs GPT 5.5 vs DeepSeek V4 Pro
Даже план самой этой штуки делался именно в этом подходе

Вуаля - FUSION
🍓41😇1