AI и грабли
12.6K subscribers
177 photos
21 videos
4 files
234 links
Строил HR продукты для американского бигтеха. Внедряю AI в бизнес, пишу про свои ошибки и находки

Co-founder https://entropy.talk и https://grably.tech

@nikolay_sheyko
Download Telegram
Реальные кейсы внедрений, ошибки и подходы, которые можно унести в свою команду

Здорово, когда в ру-пространстве есть ивенты, которые не стыдно рекомендовать

Иду на ежегодную конфу Conversations от Just AI, про которых я уже как-то писал

25 и 26 июня в Питере (и онлайн)

2 дня, 65+ спикеров, 700+ участников, 300+ компаний, а еще афтерпати (вот уж где обычно самые важные инсайты). Всего будет 4 трека:

Бизнес / AI-Native / Продукты / Технологии

Если коротко сформулировать суть конфы – тут про то, чем отличаются ИИ-инициативы, которые не умирают на этапе пилота, а реально начинают приносить деньги. А главное – про грабли на этом пути – такое любим. Лично мне отдельно интересно посмотреть, чем подводные камни в энтерпрайзе отличаются от проблем, с которыми сталкиваются мои SMB клиенты

Выбрал доклады, которые мне ближе всего (значит, вероятно, и вам, раз вы меня читаете) + пару слов от себя, почему их

AI-powered департаменты: новая операционная модель бизнеса – Наталья Артамонова, директор по внедрению genAI, Норникель (так как эту штуку я сам во всю наблюдаю и распространяю, буду запоминать энтерпрайзные аргументы и кейсы)

Почему между прототипом за 2 недели и работающим AI-продуктом — ещё 6 месяцев инженерии, фидбека и интеграций – парный доклад, один из докладчиков – Станислав Округ, техдир в R77 (это супер крутые инженеры с топовыми кейсами внедрения ИИ – от анализа поведения свиноматок до сегментации сосудов в мозге. их точно стоит послушать)

Опыт перехода от maas к selfhosted/on-premise моделям: проблемы, боли, решения – Сергей Нотевский, AI platform lead, Битрикс24 (Сережу читаю лично, у него – лучшие русскоязычные материалы по промт-кэшингу, искренне рекомендую)

В лайнапе еще Lenta Tech, VK, Лаборатория Касперского, X5, Северсталь, BIOCAD, MWS AI, hh и другой крупняк. Ну и со мной можно на чашечку пива или кофе словиться – не так часто я где-то оффлайн бываю, а тут как раз в Питере в эти даты

Промокод на скидку для подписчиков: CVS26sGiA

Подробности на сайте
👍149🔥6💩3🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
Все обсуждают opus-4.8, но почти никто не обсуждает гораздо более важную штуку, которую выпустили антропики – workflows

Может быть не совсем очевидно, почему я считаю это реально важным. Давайте откатимся чуть назад и посмотрим на типичный путь AI инженера в последние годы:

1. Пилит детерминированные форкфлоу на последовательных вызовах модели. Вдруг:

"Вау, есть structured output и можно на нем делать SGR – схлопывать несколько сложных шагов, где в один запрос последовательно заполняем output схему"


2. Пилит детерминированные воркфлоу, использует SGR, делает нормальные эвалы. Считает агентов чем-то плохо валидируемы (хотя даже не пробовал 😅). Но в какой-то момент:

"Вау, оказывается можно не расписывать логику на все edge-кейсы. Агент сам разбирается с ними в процессе. Агенты – это круто!!!"


3. Во всю пользует агентов. в половине случаев вообще встраивает готовые codex/opencode/pi вместо того, чтобы писать свои велосипеды. Тысячи строчек кода сложных переходов схлопываются в один AGENTS.md или пару скиллов. Но просыпаясь в один из дождливых четвергов, обнаруживает:

"Так, всю последнюю неделю я писал субагентов, которые должны вызываться в строго определенном порядке, и только при выполнении вот этого условия. А еще у меня есть файлик state.json, куда оркестратор заносит текущее состояние, чтобы все двигалось по конкретной стейт машине, хм-хм-хм"


———

И начинает пилить свой фреймворк для оркестрации агентов

———

Короче, самые прошаренные уже написали себе собственные оркестраторы для ведения недетерменированных ИИ-рабочих по вполне детерминированным рельсам процесса. И это нормально – почти любой процесс со времен устаканивается и там не нужно много свободы. Даже наоборот.

И теперь антропики дали возможность не костылить свои рельсы, а брать готовые. Уже встраиваю это в два клиентских проекта, столкнулся с первыми подводными камнями, но в целом доволен. Поделюсь на следующей неделе

Если еще не смотрели – советую глянуть. Ставлю, что это скоро станет стандартом
💯28🔥20👍85🤔1
На рынке разработки ПО в последние пару месяцев происходит любопытный сдвиг, про который пока мало говорят в РФ

В четверг 4 июня пройдет панельная дискуссия с иностранным гостем – о том, как агенты становятся "рантаймом" для нового типа ПО. И про сопутствующие проблемы:

- Почему попытки сделать компании AI-native проваливаются
- Как тестировать и мониторить системы автоматизации на основе ии-агентов
- Как меняться роль разработчика и требования работодателя

Все спикеры работают с иностранными компаниями, где этот тренд начался раньше:

- Konstantinos Poulinakis - Co-Founder & CEO at ClaimsEvidence
- Nikolay Sheyko - AI Solutions Architect, Founder of Grably Tech
- Refat Ametov - Co-Founder & CEO at Devstark,
- Maxim Romanovsky - Head of AI & Product Engineering at Deutsche Bank

Эфир пройдет на английском

Регистрация тут

Эфир бесплатный
, подписываться ни на кого не нужно
👍1210🔥3🤡3🥴1🤣1
Эээээксперимент

Писал выше про идею сделать курс по ИИ для людей. Галяяяя, отмена

Мы решили сделать одну штуку, которую давно хотелось попробовать – марафон желаний заданий

1 день = 1 задание на пол часа (кроме выходных)

Не сделал = выбываешь

Заработал ачивки (например, помог кому-то в чате) = получаешь доп.жизни

Задания проводят за ручку по пути приручения ИИ агентов для помощи в обычной жизни

От выбора тапочек на озоне до заполнения душных табличек и документов и личных дайджестов в телеге

Начальных требований нет. Ок, если вы новичок, ок – если нет

Участие: 10к = месячный марафон
(цена одного дня хорошей онлайн конфы)

Старт сегодня

Группа уже набрана, но все еще можно залететь

Если вам или вашим близким актуально – пишите Саше

🤡 + 🔃
🤡48😁154🔥42
Леша Остриков недавно запостил спонтанный краудсорсинг по самому горячему вопросу последних месяцев:

Как дать экспертам (не технарям) доступ к агентам. И дать им возможность обновлять этих агентов через командные скиллы. Да еще и так, чтобы они могли коннектиться к инфре компании с правильными доступами

Я накатал там в комментах ответ исходя из горького опыта экспериментов во время внедрений.

Заметил, что пересылаю его уже третий раз кому-то, решил запостить – думаю, кому-то из вас сэкономит нервы:

—————————

Я бы вообще абстрагировал бота (у Леши в вопросе речь шла про тг бот) от агентной части. Сделать сначала бэк + простой веб фронтенд (будет быстрее для итераций, чем трахаться с телегой как только выйдете за базовую функциональность)

И отдельно решать вопрос именно настроек агента (скиллы, AGENTS.md и т.д.). Так же отдельно вопрос per-user доступов к корпоративным тулам. Код агента ничего про это не должен знать – это авторизация либо поверх MCP, либо поверх CLI (см. gh как пример)

———

По агентному бэку: к сожалению, я не знаю хорошего агента, который дефолтно умеет в мультиюзер, т.к. все они делались изначально под локальный запуск одним пользователем.

Поэтому:

1. либо писать свой на базе какого-нибудь pi sdk;
2. либо изолированно запускать готовые (тот же pi или opencode) под каждого пользователя в сэндбоксе (в порядке увеличения изоляции: unix user → docker → microVM), а из своей тонкой мультитенантной прокладки просто роутить запросы в эти сэндбоксы

Заведение нового пользователя = создание нового сэндбокса. А новый чат в рамках пользователя – просто новая сессия внутри его агента

———

По расширениям (MCP, CLI, SKILLS). Я бы забил на MCP (особенно, если нужно быстро). Оставил бы только CLI и SKILLS. Если не использовать git для хранения, то вы с нуля будете изобретать версионирование, диффы, RBAC, разрешение конфликтов и т.д

Если хотим быстро и без боли – нам такое не подходит. Проще создать репо со скиллами на гитхабе, включая скиллы для работы с ним. можно даже сразу копировать весь репо в папочку /srv/company_skills_marketplace и подлинковывать ее содержимое в ~/.agents/skills

1. Даем скиллы для загрузки на гитхаб, обновления с гитхаба и т.д.

2. В какой-то момент разделяем роли, кто какие скиллы можем менять.

3. Потом запрещаем пушить в main и назначаем ревьюеров.

4* В идеале – разносим каждый скилл в отдельный репо, чтобы можно было обновлять независимо. Тогда в самом скилле можно даже зашить проверку версии по хэшу коммита и делать автообновление (или запрос пользователю на апдейт)

———

По коннекторам:

Тут все по старинке – даем пользователям разные доступы на уровне самих инструментов, куда коннектимся, пусть агент просто логинится под аккаунтом пользователя через cli (см. gh, gcloud, etc)

——————

Короче, все сводится к тому, чтобы разбить одну задачу на 4 независимых задачи изоляции:

1. Изоляция истории сессий (не могу посмотреть чужие сообщения)
2. Изоляция execution environment (не могу залезть в чужие файлы через shell)
3. Изоляция прав на обновление shared логики (не могу менять скиллы чужой команды)
4. Изоляция доступов (не могу залезть в гугл таблички фин.дира и посмотреть зп команды)

1 решается своим кодом, 2 – docker/microVM, 3 – гитхабом со скиллами-обертками для нормальных людей, 4 – давно решено
4🔥19👍1410🦄2🤔1🤯1
Недооцененная фишка кодекса (или воркфлоу для бедных) ↑

По сути тупо насовываем сообщений в очередь на будущее

Про фичу знал давно, но не особо раньше пользовался. А последние пару месяцев часто накидываю сразу по три-четыре задачи в ряд – справляется на порядок лучше, чем если кидать сразу все. Видимо, как обычно – focus is a key

По сути на этом и подстроены все агентные воркфлоу, да и в целом идея оркестрации. Но там чет нужно думать, разбираться, тюнить

А часто это не нужно – ты сам точно знаешь, что нужно сделать после текущей задачи – вот и формулируешь

P.s. это очень тупо, но самое частое мое такое сообщение:

что мы еще упустили? нужно ли что-то проверить/поправить?


И работает!

Если не пробовали – советую. Когда в клоде работаю – стабильно страдаю, что нет такого

@ai_grably
🔥32😁186👍6😱3🙏3💯2👀1
В ту же тему ↑ заметил новый любимый паттерн

/goal делай задачи из папочки .tasks
ВАЖНО: читай и делай по одной за раз!
🔥34🤔8👍6❤‍🔥1🙈1
This media is not supported in your browser
VIEW IN TELEGRAM
Транскрибация на телефоне своими руками

Казалось бы, что сложного: запись аудио → транскрибация → копирование в буфер обмена

Но ни одно из приложений, которое пробовал, не дает нормального UX

В итоге с подачи друга (спасибо, Паша), настроил себе нативный shortcut и повесил на Action Button / Double Tap

Инструкция, как сделать в домашних условиях

Создаем новый Shortcut (Команда). Добавляем:

1. Record Audio:
- start: Immediately
- finish: On Tap

2. Get Contents of URL:
- URL: https://api.openai.com/v1/audio/transcriptions
- method: POST
- headers:
Authorization = Bearer <сюда вставляем OPENAI_API_KEY с platform.openai.com>
- body: Form
- file = Recorded Audio, тип File
- model = gpt-4o-mini-transcribe
- response_format = text

3. Copy to clipboard

4. (Опционально) Show notification

———

Можно любой другой api использовать. Можно парсить json из ответа через Get Dictionary from Input. Можно поднять свою проксю на vps чтобы работало в рф без квн

@ai_grably
🔥3113👍5😱3💊31❤‍🔥1🤣1😐1
Вы тоже успели подсесть на Fable?

Что ж, ждем фронтир модели, которые будут сосать на бенчмарках, чтобы их не заблочили

Раньше был "бенчмаксинг", теперь будет "бенчмининг"
😭30🤣153🥱2
Удивляют люди, который ухмыляются над Антропиками. Мол, довыпендривались, теперь расхлебывайте

Кмк, Антропики на данный момент получили топовый пиар – признание государства о том, что их модель слишком опасна из-за своей крутости. То есть, буквально валидация их собственной позиции

Я думаю, закончится все тем, что они поправят джейлбрейки, отыграют публично послушание перед правительством, за что с них в какой-то момент снимут экспортные ограничения. И вот тогда то адопш мифоса/фэйбл взлетит до небес – все кому не лень захотят потыкать, что это тут у нас было под запретом

Где я не прав?
👍98🤣9💯8🤨31
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера жестко прокрастинировал делать рабочие задачи. А что делает человек в 2026ом, когда отлынивает от работы?

Я вот увидел картинку, где fable помог разобраться с NSEvent.pressure в MacOS 26 и использует тачпад для взвешивания порошка (картинка в комментах). Короче, картинка оказалась сгенерированная, нет там публичной апишки, которая граммы возвращает

Но оказалось, что есть приватная😉

Спустя час дебага и экспериментов, мы находим правильное поле в структурке

там буквально был момент, когда агент пишет скрипт, который выводит разные значения, я давлю на тачпад с разной силой, а агент по 16 графикам – пытается понять, какое из этих 16 чисел отвечает за давление


В целом, на этом бы и остановиться – весы готовы. Но в процессе дебага я случайно решил вывести на экран все касания с учетом силы нажатия в реальном времени. Получилась красота на видео выше. Сразу стал думать, для чего можно было бы такое применить – это же супер детализированный инпут

Первая мысль, что можно в геймдеве прикольные механики делать. А вторая – midi контроллер – играть музыку. руками. на тачпаде

Проходит еще два часа

Добавлены отображение волны и спектра, триггер на улавливание фазы (чтобы она стоячая была по возможности), пространственный звук, кучу настроек и пресеты. Ну и блокировка тачпада до кучи – чтобы пока музицируешь случайно не кликать куда ни попадя

Скинул нескольким друзьям – оказалось жестко залипательной штукой

Ощущения от обратной связи визуала на нажатие – офигенное. Наверное, самая крутая моя экспериментальная поделка за очень долго

Залипнуть самому (только на Mac):

brew trust toolittlecakes/tremor
brew install toolittlecakes/tremor/tremor
tremor


@ai_grably
41🔥29🤣8👍5🥱5❤‍🔥1