AI и грабли

html vs md

В последний месяц много использовал html там, где раньше – md

- репорты клиентам
- лендосы
- объяснение LLMкой мне сложных штук
- иллюстрации для воркшопов

Короче, там где читать портянку текста не хочется, html дает интерактив, визуальное разделение и нормальную графику

Только вот редачить html не удобно. codex desktop дает писать комменты к конкретным элементам, но это извращение, если нужно просто формулировки покрутить

Вдохновившись постом Глеба, сделал и себе мини-фигму. И задеплоил для всех желающих

Юзает модный браузерный file system access api, чтобы сохранять в тот же файл на диске, а не скачивать в Downloads каждый раз новый

Ссылочка (работает в вашем браузере, данные никуда не улетают)

@ai_grably

🔥55👍16❤5🤣3😱2🤔1

6.98K views07:42

AI и грабли

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Codex в телефоне

Я уже писал как настроить OpenCode на VPS, чтобы не отвлекаться от контакта человек-ии даже на унитазе

Но там все как-то затухло из-за трех проблем:

1. OpenCode все-таки посасывает в сравнении с Codex. Родная упряжка лучше, писал об этом тут
2. Часто хочется работать с локальными файлами и браузером. И если файлы кидать еще можно, то проброс CDP порта браузера – совсем извращение
3. Мне очень нравится гуи Codex Desktop (с тех пор как они завезли fork и edit). Тут писал почему

Claude Code решил это через диспатч – мол, давайте просто синхронизовать сессию с десктопа на телефон

Ждать диспатч от OpenAI мне было лень, так что сделал свой. С 4го раза 😅

Первая попытка – цеплялся к фронтенду кодекс десткопа (т.к. это Electron) – манипулировать DOM оказалось невероятно хрупко (а gpt предупреждала)

Вторая попытка – вместо фронта – напрямую к codex app server, а интерфейс в тг. Задолбался переизобретать агентный UX в тг

Третья – сделал свой веб UI. Оказалось, что идея подсосаться к app server – не такая гладкая и риалтайм синхронизация с пол-пинка не заводится

Четвертая – пока дебажил синхронизацию, полез реверсить расширение Codex в VSCode – оно точно успешно синхронизуется с десктопом. Пока реверсил, понял, что могу просто взять расширение и заставить его работать без vscode. Бонусом получу готовый UI

Вуаля!

Запускаем codex-dispatcher и подключаемся с любого браузера в локальной сети

Если хочется через интернет, то

codex-dispatcher login  # через гитхаб
codex-dispatcher --relay  # тоннель, через мой VPS

Создает тоннель и уникальную ссылку вида https://<github-username>.codex-dispatcher.app

Т.к. это PWA со стабильной ссылкой – можно сохранить себе как приложение из браузера

С большим количеством сессий работать не супер удобно, но менеджерить 2-3 пока ждешь еду в кафешке – самое то

Установка

curl -fsSL https://raw.githubusercontent.com/toolittlecakes/codex-dispatcher/main/scripts/install.sh | sh

Репо

UPD: написал пост в отложку неделю назад, а он устарел еще до публикации – openai завезли свой codex dispatcher

Удалять пост не буду – мб сам подход кому-то окажется полезным – не видел, чтобы кто-то так делал

@ai_grably

1🔥25❤10👍7🤯3🥱3😁1

6.38K viewsedited 04:19

AI и грабли

Все новостные каналы пишут про нативный диспатчер от openai, но никто не пишет про другую фичу – теперь можно подключаться не только к десктопу, но и к VPS

Codex теперь полностью впитал в себя все функции OpenClaw. Ожидаемо.

P.s. В идеале, осталось дождаться, когда в мобилку завезут password-less подключение – на десктопе уже есть

UPD: завезли, нужно просто на десктопе включить синхронизацию всех удаленных подключений – они автоматически появятся на мобилке

🔥22❤9👍3🤔1😢1

6.75K views06:39

AI и грабли

This media is not supported in your browser

VIEW IN TELEGRAM

Как дать агенту "руки": 4 типа подключения внешних сервисов

Заметил, что стал объяснять эту штуку на воркшопах даже не технарям — с тех пор как Claude Code и Сodex перестали быть инструментами для разработчиков и превратились в агентные среды общего назначения.

Почему это важно?

Ну вот хотите вы посмотреть анализ рынка ИИ вакансий (скоро выложу) – просите агента сходить на hh и собрать инфу. Он открывает ваш хром и идет вручную кликать по вакансиям, выжирая лимиты за 10 минут.

Или наоборот, парсите телеграм-каналы, а он пытается написать юзербота, который залогинится под вашим аккаунтом (что в какой-то момент приведет к его блокировке).

Короче: в мире, где возможности агента ограничены набором его коннекторов к внешнему миру – понимать типы этих коннекторов и области их применения – база.

———

Начну с двух противоположностей (на видео выше именно они)

———

Тип 1: Ручное управление браузером (aka browser use)

Место подключения: Фронтенд

Поведение: агент ведет себя как пользователь – смотрит на страницу (через текстовый снэпшот или скриншот) и "думает" перед каждым следующим действием.

Плюсы:
⦁ Можно подстраиваться под неожиданные изменения UI, не нужен детерминизм.
⦁ Почти не распознается бот-детекторами, потому что агент между действиями "тупит" так же, как живой человек.

Минусы:
⦁ Долго и дорого: модель жрет токены на размышления перед каждым кликом.
⦁ В UI часто есть не все функции, которые спрятаны в коде.

Тип 2: скрипт, вызывающий API (сюда же идут все mcp/cli – это просто доп. обертка над API)

Место подключения: Бэкенд

Поведение: агент пишет скрипт, который стучится напрямую к бэкенду. Скорее всего, скрипт за раз делает сразу несколько действий. Часто в цикле.

Ему не нужно думать на каждом шаге, потому что в документации API уже есть все нужные методы и не нужно смотреть на страницу, чтобы понять куда дальше кликать.

Плюсы:
- Очень быстро
- Надежно, не зависит от фронта

Минусы:
- Не все функции есть в публичном API: в GetCourse нельзя управлять домашками студентов через API
- Ценник: инвесторские api для доступа к биржевым метрикам могут стоить несколько тысяч долларов в месяц

———

Это по сути два "официальных" способа.

В реальности, это часто не работает – В реальности мы часто не хотим ждать часы, пока агент кликает страницы, или не готовы платить за API. Или в нем просто нет того, что нужно

Тогда переходим к двум промежуточным типам ("злые братья-близнецы" предыдущих методов):

Тип 1.2: браузерная автоматизация

Место подключения: все еще фронтенд, как в Типе 1

Поведение: но теперь, вместо того, чтобы "думать" на каждом шаге, он пишет playwright скрипт, который за один прогон проходит в цикле по всем действиям. Нужно заранее знать, какие есть селекторы, как обходить пагинацию и т.д.

Плюсы:
- Быстро (но медленнее API)
- Можно сделать все, что может сделать пользователь через браузер

Минусы:
- Легко детектится антифродом — поведение скрипта не похоже на человека
- Хрупкость – обновились селекторы на фронтенде → скрипт не работает

———

Тип 2.2: Неофициальный API (притворяемся фронтендом)

Место подключения: все еще бэкенд, как в типе 2

Поведение: агент притворяется фронтендом и дергает внутренний API, который мы нашли через "Network" в консоли разработчика. Аутентификация тут обычно по кукиз, либо вообще отсутствует, если страница доступна без логина (привет, api.hh.ru/search)

Плюсы:
- Есть все, что есть в UI, но быстро
- Часто бесплатно или по стоимости личного аккаунта

Минусы:
- Почти всегда нарушение ToS
- Иногда нужны приседания с обновлением кукиз

——————

tl;dr на примере HR:

- Добавить 100 HRD в коннекты на линкедине – 1
- Легально обрабатывать заявки кандидатов – 2
- Разово спарсить 1000 вакансий – 1.2
- Парсить 10 000 вакансий в день – 2.2

«Домашка»: привести примеры каждого типа для – обработки входящих заявок в тг (задачи кучи малых бизнесов в РФ)

Правильные ответы будут в следующем посте

@ai_grably

🔥25❤10👍9🤡3💩2🤔1

6.07K viewsedited 07:34

AI и грабли

Может показаться, что я весь такой ИИ-эвангелист. Но большинство моих консультаций – это я 40 минут отговариваю делать ту ИИ штуку, с которой ко мне пришли (так себе реклама моих консультаций, ага)

Я хз почему так происходит. Всм, почему так много слабых идей

Кажется, у людей просто не набралось насмотренности и шишек, а FOMO гонит делать хоть что-то. Вот и автоматизируют не те процессы и не теми технологиями, а в особо запущенных случаях еще и в продукт это пытаются превратить (я знаю, я тоже тут был)

Но парочку успешных паттернов я начал замечать. Расскажу про них на эфире, куда меня недавно позвали: "Что строить, когда все используют AI"

Из забавного, там будет Саша Абрамов и Данила Симонов, с которыми мы уже встречались на панельке AI Dev Live. Оба – с неочевидными инсайтами из индустрии, но у нас с ними скорее вайб с технарским уклоном

В этот раз его разбавят Даша Васянина (ex-CPO LIME | Дашич, беги) и Андрей Резинкин (ангел-инвестор | Money For Startup).

Интересно, насколько у нас всех окажутся разными картины мира. Приходите смотреть, если вы тоже не только про технологии, но и про продукты и бизнес.

P.s. Если есть хот-топики на обсудить – кидайте в комменты, я понакидываю на вентилятор

Когда: 27 мая, среда, 19:00 мск
Где: онлайн
Стоимость: подписка на каналы спикеров

Записи эфира не будет

👉 Зарегистрироваться

❤14🔥13🤡5👍3😁2🤔1

5.86K viewsedited 10:59

AI и грабли

«Домашка»: привести примеры каждого типа для – обработки входящих заявок в тг (задачи кучи малых бизнесов в РФ)

Ответы к домашке:

Обрабатываем входящие заявки в тг для малого бизнеса

Тип 1: агент через браузер

Вешаем автоматизацию, на каждые 5 минут. Агент заходит в веб версию телеги и вручную разбирает все входящие диалоги

Тип 2: официальное API

Просто используем ТГ бота. Дальше он сам обрабатывает заявки, дергая LLMку.

Проблема: многим не нравится вариант с ботом - либо сами юзеры не любят, либо владелец бизнеса хочет простой способ влезть в переписку.

Есть вариант, про который мало кто знает!

Бота можно подключить "поверх" любого премиум аккаунта – он сможет перехватывать все входящие сообщения и сам отвечать на них

Тип 1.2 автоматизация фронта

Как первый вариант, но не обязательно прям вручную все делать – можно дергать скрипт, который в цикле пройдет по всем непрочитанным диалогам

Тип 2.2 неофициальный API

Неумирающая классика - использовать User API чтобы полностью автоматизировать юзер аккаунт.

Это не то, чтобы совсем не по правилам, но это серая зона. Целевое использование – это не автоматизация аккаунтов, а разработка сторонних тг клиентов. Поэтому легко случайно улететь в бан, нарушив какое-то неочевидное правило

Советы:

1. Осторожно использовать популярные либы – создатель telethon писал, что тг распознает паттерны этой либы, которой пользуются многие спамеры и скамеры, что повышает вероятность блокировки

2. Не использовать на личном аккаунте (хотя, если любите адреналин, то можно – интересные ощущения, когда вас выкидывает со всех устройств и не дает войти обратно)

@ai_grably

🔥14👍5❤3🤔1

6.62K views06:18

AI и грабли

Благодаря каналу, у меня сейчас много общения и с компаниями, и с отдельными экспертами в разных областях. И все чаще вижу одну штуку, которая беспокоит:

Как будто, все быстрее растет разрыв между теми, кто освоил ИИ, и теми, кто нет. Мы уже видели такое в разработке в прошлом году, а сейчас это перекатилось и на остальные профессии. Кажется, с еще большим эффектом

Одни ребята сами настраивают себе ИИ-агентов – для анализа конкурентов, сбора саммари из кучи рабочих чатов, верстки през и брони билетов. И все без технических знаний

Другие – сидят на бесплатных моделях, используют ИИ как поисковик, мучаются с галлюцинациями. И все равно делают почти все рукам

И в целом понятно почему – большинство бросают попытки внедрить ИИ в работу, когда вместо помощи получают еще одну проблему, которую надо контролировать. А понятных практик нет. Или просто нет примера перед глазами, а что вообще уже реально работает

Для таких ребят мы с моей давней подругой Сашей решили провести эфир в формате "разрушения мифов" – покажем на реальных не-технических задачах из моего и ее бизнеса, где уже можно разгрузить себе голову и время за счет ии-агентов, а где еще нет

Чисто одним инструментом – от анализа конкурентов до монтирования видео

ЦА: продакты, проджекты, маркетологи, сейлз, эйчар, руководители
(и вообще все, кого бесит рутина за компом)

Вторник 26 мая, 19:00-20:30 по мск
Бесплатно

Регистрация в боте – там будет ссылка на эфир + записи и материалы с лайфхаками после

P.s. подписываться ни на кого не надо 😁

🔥26😁15❤10🤮8🤔3👍1

7.77K viewsedited 10:23

AI и грабли

Сегодня буду на панельке про "Что строить, когда все используют AI"

(как отличать хайп от реальных трендов и прагматики)

Будет про защиту от AI слопа в коде и работе и юнит-экономику внедрения ИИ при росте цен на токены. Я отдельно хочу попушить тему SaaS → AI-агенство. А поспрашивать про сдвиги в управление командами в новом мире

Будет честный опыт и практика от крутых спикеров. Ссылка на регистрацию ниже - ещё можно занять место:

👉 Зарегистрироваться

19:00 МСК

👍14❤1🤔1

5.76K viewsedited 11:25

AI и грабли

Реальные кейсы внедрений, ошибки и подходы, которые можно унести в свою команду

Здорово, когда в ру-пространстве есть ивенты, которые не стыдно рекомендовать

Иду на ежегодную конфу Conversations от Just AI, про которых я уже как-то писал

25 и 26 июня в Питере (и онлайн)

2 дня, 65+ спикеров, 700+ участников, 300+ компаний, а еще афтерпати (вот уж где обычно самые важные инсайты). Всего будет 4 трека:

Бизнес / AI-Native / Продукты / Технологии

Если коротко сформулировать суть конфы – тут про то, чем отличаются ИИ-инициативы, которые не умирают на этапе пилота, а реально начинают приносить деньги. А главное – про грабли на этом пути – такое любим. Лично мне отдельно интересно посмотреть, чем подводные камни в энтерпрайзе отличаются от проблем, с которыми сталкиваются мои SMB клиенты

Выбрал доклады, которые мне ближе всего (значит, вероятно, и вам, раз вы меня читаете) + пару слов от себя, почему их

AI-powered департаменты: новая операционная модель бизнеса – Наталья Артамонова, директор по внедрению genAI, Норникель (так как эту штуку я сам во всю наблюдаю и распространяю, буду запоминать энтерпрайзные аргументы и кейсы)

Почему между прототипом за 2 недели и работающим AI-продуктом — ещё 6 месяцев инженерии, фидбека и интеграций – парный доклад, один из докладчиков – Станислав Округ, техдир в R77 (это супер крутые инженеры с топовыми кейсами внедрения ИИ – от анализа поведения свиноматок до сегментации сосудов в мозге. их точно стоит послушать)

Опыт перехода от maas к selfhosted/on-premise моделям: проблемы, боли, решения – Сергей Нотевский, AI platform lead, Битрикс24 (Сережу читаю лично, у него – лучшие русскоязычные материалы по промт-кэшингу, искренне рекомендую)

В лайнапе еще Lenta Tech, VK, Лаборатория Касперского, X5, Северсталь, BIOCAD, MWS AI, hh и другой крупняк. Ну и со мной можно на чашечку пива или кофе словиться – не так часто я где-то оффлайн бываю, а тут как раз в Питере в эти даты

Промокод на скидку для подписчиков: CVS26sGiA

Подробности на сайте

Conversations-Ai

Conversations – конференция по генеративному AI в бизнесе, продуктах и разработке.

Кейсы и стратегии, ROI и масштабирование GenAI-решений, AI-агенты и MAS, AI-инфраструктура и безопасность, SLM, экономика и жизненный цикл AI-продуктов, UX и метрики GenAI.

👍14❤9🔥6💩3🤔2

4.37K viewsedited 11:54

AI и грабли

This media is not supported in your browser

VIEW IN TELEGRAM

Все обсуждают opus-4.8, но почти никто не обсуждает гораздо более важную штуку, которую выпустили антропики – workflows

Может быть не совсем очевидно, почему я считаю это реально важным. Давайте откатимся чуть назад и посмотрим на типичный путь AI инженера в последние годы:

1. Пилит детерминированные форкфлоу на последовательных вызовах модели. Вдруг:

"Вау, есть structured output и можно на нем делать SGR – схлопывать несколько сложных шагов, где в один запрос последовательно заполняем output схему"

2. Пилит детерминированные воркфлоу, использует SGR, делает нормальные эвалы. Считает агентов чем-то плохо валидируемы (хотя даже не пробовал 😅). Но в какой-то момент:

"Вау, оказывается можно не расписывать логику на все edge-кейсы. Агент сам разбирается с ними в процессе. Агенты – это круто!!!"

3. Во всю пользует агентов. в половине случаев вообще встраивает готовые codex/opencode/pi вместо того, чтобы писать свои велосипеды. Тысячи строчек кода сложных переходов схлопываются в один AGENTS.md или пару скиллов. Но просыпаясь в один из дождливых четвергов, обнаруживает:

"Так, всю последнюю неделю я писал субагентов, которые должны вызываться в строго определенном порядке, и только при выполнении вот этого условия. А еще у меня есть файлик state.json, куда оркестратор заносит текущее состояние, чтобы все двигалось по конкретной стейт машине, хм-хм-хм"

———

И начинает пилить свой фреймворк для оркестрации агентов

———

Короче, самые прошаренные уже написали себе собственные оркестраторы для ведения недетерменированных ИИ-рабочих по вполне детерминированным рельсам процесса. И это нормально – почти любой процесс со времен устаканивается и там не нужно много свободы. Даже наоборот.

И теперь антропики дали возможность не костылить свои рельсы, а брать готовые. Уже встраиваю это в два клиентских проекта, столкнулся с первыми подводными камнями, но в целом доволен. Поделюсь на следующей неделе

Если еще не смотрели – советую глянуть. Ставлю, что это скоро станет стандартом

💯28🔥20👍8❤5🤔1

4.56K views12:05

AI и грабли

Forwarded from Entropy Talk: AI и разработка

На рынке разработки ПО в последние пару месяцев происходит любопытный сдвиг, про который пока мало говорят в РФ

В четверг 4 июня пройдет панельная дискуссия с иностранным гостем – о том, как агенты становятся "рантаймом" для нового типа ПО. И про сопутствующие проблемы:

- Почему попытки сделать компании AI-native проваливаются
- Как тестировать и мониторить системы автоматизации на основе ии-агентов
- Как меняться роль разработчика и требования работодателя

Все спикеры работают с иностранными компаниями, где этот тренд начался раньше:

- Konstantinos Poulinakis - Co-Founder & CEO at ClaimsEvidence
- Nikolay Sheyko - AI Solutions Architect, Founder of Grably Tech
- Refat Ametov - Co-Founder & CEO at Devstark,
- Maxim Romanovsky - Head of AI & Product Engineering at Deutsche Bank

Эфир пройдет на английском

Регистрация тут

Эфир бесплатный, подписываться ни на кого не нужно

Luma

AI agents - the runtime of new software · Zoom · Luma

We will discuss:
how agents are eating Software,
what is the difference between agentic software and classical software,
how to evaluate and test agents,
how…

👍12❤10🔥3🤡3🥴1🤣1

4.4K views15:33

AI и грабли

Эээээксперимент

Писал выше про идею сделать курс по ИИ для людей. Галяяяя, отмена

Мы решили сделать одну штуку, которую давно хотелось попробовать – марафон ~~желаний~~ заданий

1 день = 1 задание на пол часа (кроме выходных)

Не сделал = выбываешь

Заработал ачивки (например, помог кому-то в чате) = получаешь доп.жизни

Задания проводят за ручку по пути приручения ИИ агентов для помощи в обычной жизни

От выбора тапочек на озоне до заполнения душных табличек и документов и личных дайджестов в телеге

Начальных требований нет. Ок, если вы новичок, ок – если нет

Участие: 10к = месячный марафон
(цена одного дня хорошей онлайн конфы)

Старт сегодня

Группа уже набрана, но все еще можно залететь

Если вам или вашим близким актуально – пишите Саше

🤡 + 🔃

🤡48😁15❤4🔥42

5.06K viewsedited 13:59

AI и грабли

Леша Остриков недавно запостил спонтанный краудсорсинг по самому горячему вопросу последних месяцев:

Как дать экспертам (не технарям) доступ к агентам. И дать им возможность обновлять этих агентов через командные скиллы. Да еще и так, чтобы они могли коннектиться к инфре компании с правильными доступами

Я накатал там в комментах ответ исходя из горького опыта экспериментов во время внедрений.

Заметил, что пересылаю его уже третий раз кому-то, решил запостить – думаю, кому-то из вас сэкономит нервы:

—————————

Я бы вообще абстрагировал бота (у Леши в вопросе речь шла про тг бот) от агентной части. Сделать сначала бэк + простой веб фронтенд (будет быстрее для итераций, чем трахаться с телегой как только выйдете за базовую функциональность)

И отдельно решать вопрос именно настроек агента (скиллы, AGENTS.md и т.д.). Так же отдельно вопрос per-user доступов к корпоративным тулам. Код агента ничего про это не должен знать – это авторизация либо поверх MCP, либо поверх CLI (см. gh как пример)

———

По агентному бэку: к сожалению, я не знаю хорошего агента, который дефолтно умеет в мультиюзер, т.к. все они делались изначально под локальный запуск одним пользователем.

Поэтому:

1. либо писать свой на базе какого-нибудь pi sdk;
2. либо изолированно запускать готовые (тот же pi или opencode) под каждого пользователя в сэндбоксе (в порядке увеличения изоляции: unix user → docker → microVM), а из своей тонкой мультитенантной прокладки просто роутить запросы в эти сэндбоксы

Заведение нового пользователя = создание нового сэндбокса. А новый чат в рамках пользователя – просто новая сессия внутри его агента

———

По расширениям (MCP, CLI, SKILLS). Я бы забил на MCP (особенно, если нужно быстро). Оставил бы только CLI и SKILLS. Если не использовать git для хранения, то вы с нуля будете изобретать версионирование, диффы, RBAC, разрешение конфликтов и т.д

Если хотим быстро и без боли – нам такое не подходит. Проще создать репо со скиллами на гитхабе, включая скиллы для работы с ним. можно даже сразу копировать весь репо в папочку /srv/company_skills_marketplace и подлинковывать ее содержимое в ~/.agents/skills

1. Даем скиллы для загрузки на гитхаб, обновления с гитхаба и т.д.

2. В какой-то момент разделяем роли, кто какие скиллы можем менять.

3. Потом запрещаем пушить в main и назначаем ревьюеров.

4* В идеале – разносим каждый скилл в отдельный репо, чтобы можно было обновлять независимо. Тогда в самом скилле можно даже зашить проверку версии по хэшу коммита и делать автообновление (или запрос пользователю на апдейт)

———

По коннекторам:

Тут все по старинке – даем пользователям разные доступы на уровне самих инструментов, куда коннектимся, пусть агент просто логинится под аккаунтом пользователя через cli (см. gh, gcloud, etc)

——————

Короче, все сводится к тому, чтобы разбить одну задачу на 4 независимых задачи изоляции:

1. Изоляция истории сессий (не могу посмотреть чужие сообщения)
2. Изоляция execution environment (не могу залезть в чужие файлы через shell)
3. Изоляция прав на обновление shared логики (не могу менять скиллы чужой команды)
4. Изоляция доступов (не могу залезть в гугл таблички фин.дира и посмотреть зп команды)

1 решается своим кодом, 2 – docker/microVM, 3 – гитхабом со скиллами-обертками для нормальных людей, 4 – давно решено

4🔥19👍14❤10🦄2🤔1🤯1

6.02K viewsedited 09:12

AI и грабли

Недооцененная фишка кодекса (или воркфлоу для бедных) ↑

По сути тупо насовываем сообщений в очередь на будущее

Про фичу знал давно, но не особо раньше пользовался. А последние пару месяцев часто накидываю сразу по три-четыре задачи в ряд – справляется на порядок лучше, чем если кидать сразу все. Видимо, как обычно – focus is a key

По сути на этом и подстроены все агентные воркфлоу, да и в целом идея оркестрации. Но там чет нужно думать, разбираться, тюнить

А часто это не нужно – ты сам точно знаешь, что нужно сделать после текущей задачи – вот и формулируешь

P.s. это очень тупо, но самое частое мое такое сообщение:

что мы еще упустили? нужно ли что-то проверить/поправить?

И работает!

Если не пробовали – советую. Когда в клоде работаю – стабильно страдаю, что нет такого

@ai_grably

🔥32😁18❤6👍6😱3🙏3💯2👀1

5.88K views12:56

AI и грабли

В ту же тему ↑ заметил новый любимый паттерн

/goal делай задачи из папочки .tasks
ВАЖНО: читай и делай по одной за раз!

🔥34🤔8👍6❤‍🔥1🙈1

5.21K views10:03

AI и грабли

This media is not supported in your browser

VIEW IN TELEGRAM

Транскрибация на телефоне своими руками

Казалось бы, что сложного: запись аудио → транскрибация → копирование в буфер обмена

Но ни одно из приложений, которое пробовал, не дает нормального UX

В итоге с подачи друга (спасибо, Паша), настроил себе нативный shortcut и повесил на Action Button / Double Tap

Инструкция, как сделать в домашних условиях

Создаем новый Shortcut (Команда). Добавляем:

1. Record Audio:
- start: Immediately
- finish: On Tap

2. Get Contents of URL:
- URL: https://api.openai.com/v1/audio/transcriptions
- method: POST
- headers:
Authorization = Bearer <сюда вставляем OPENAI_API_KEY с platform.openai.com>
- body: Form
- file = Recorded Audio, тип File
- model = gpt-4o-mini-transcribe
- response_format = text

3. Copy to clipboard

4. (Опционально) Show notification

———

Можно любой другой api использовать. Можно парсить json из ответа через Get Dictionary from Input. Можно поднять свою проксю на vps чтобы работало в рф без квн

@ai_grably

🔥31❤13👍5😱3💊3✍1❤‍🔥1🤣1😐1

4.96K views22:04

AI и грабли

Вы тоже успели подсесть на Fable?

Что ж, ждем фронтир модели, которые будут сосать на бенчмарках, чтобы их не заблочили

Раньше был "бенчмаксинг", теперь будет "бенчмининг"

😭30🤣15❤3🥱2

4.94K views05:47

AI и грабли

Удивляют люди, который ухмыляются над Антропиками. Мол, довыпендривались, теперь расхлебывайте

Кмк, Антропики на данный момент получили топовый пиар – признание государства о том, что их модель слишком опасна из-за своей крутости. То есть, буквально валидация их собственной позиции

Я думаю, закончится все тем, что они поправят джейлбрейки, отыграют публично послушание перед правительством, за что с них в какой-то момент снимут экспортные ограничения. И вот тогда то адопш мифоса/фэйбл взлетит до небес – все кому не лень захотят потыкать, что это тут у нас было под запретом

Где я не прав?

👍98🤣9💯8🤨3❤1

3.77K views13:45

AI и грабли

This media is not supported in your browser

VIEW IN TELEGRAM

Вчера жестко прокрастинировал делать рабочие задачи. А что делает человек в 2026ом, когда отлынивает от работы?

Я вот увидел картинку, где fable помог разобраться с NSEvent.pressure в MacOS 26 и использует тачпад для взвешивания порошка (картинка в комментах). Короче, картинка оказалась сгенерированная, нет там публичной апишки, которая граммы возвращает

Но оказалось, что есть приватная😉

Спустя час дебага и экспериментов, мы находим правильное поле в структурке

там буквально был момент, когда агент пишет скрипт, который выводит разные значения, я давлю на тачпад с разной силой, а агент по 16 графикам – пытается понять, какое из этих 16 чисел отвечает за давление

В целом, на этом бы и остановиться – весы готовы. Но в процессе дебага я случайно решил вывести на экран все касания с учетом силы нажатия в реальном времени. Получилась красота на видео выше. Сразу стал думать, для чего можно было бы такое применить – это же супер детализированный инпут

Первая мысль, что можно в геймдеве прикольные механики делать. А вторая – midi контроллер – играть музыку. руками. на тачпаде

Проходит еще два часа

Добавлены отображение волны и спектра, триггер на улавливание фазы (чтобы она стоячая была по возможности), пространственный звук, кучу настроек и пресеты. Ну и блокировка тачпада до кучи – чтобы пока музицируешь случайно не кликать куда ни попадя

Скинул нескольким друзьям – оказалось жестко залипательной штукой

Ощущения от обратной связи визуала на нажатие – офигенное. Наверное, самая крутая моя экспериментальная поделка за очень долго

Залипнуть самому (только на Mac):

brew trust toolittlecakes/tremor
brew install toolittlecakes/tremor/tremor
tremor

@ai_grably

❤40🔥28🤣7🥱5👍4❤‍🔥1

2.64K views20:23

About

Blog

Apps

Platform