Алексей Цыкарев | ИТ, ИИ и бизнес
1.27K subscribers
130 photos
18 videos
155 links
Сложная разработка, управление, процессы, архитектура и применение ИИ в бизнесе

Автор: Алексей Цыкарев, основатель https://spectr.dev и https://udwe.ru

Сотрудничество: @aleks_tsykarev
Download Telegram
Вчера Open AI выкатили новые «дешевые» и умные модельки gpt-5.4-mini и gpt-5.4-nano и все вокруг пишут, как же круто, какие же они дешевые, а я решил сделать быстрый замер на реальной нашей задаче. Вот результаты

Контекст
Есть задача в одной из внутренних систем - метчить кандидатов на запросы при помощи LLM. Сейчас там используется моделька gpt-5-mini с low effort

Методика эксперимента
При тех же самых входных данных и промптах - меняем модельки и effort для них и смотрим на результаты

Замеры
На скриншоте

Итоги
1) Конкретно в нашей ситуации чуть лучший результат по качеству результата выдает gpt-5.4-mini с medium effort. Но по цене получается в ±3.5 раз дороже
2) gpt-5.4-mini с low effort выдает результат стабильно хуже, чем gpt-5-mini (незначительно, но хуже). Стоимость при этом примерно в 2 раза дороже
3) gpt-5.4-nano стабильно выдает в нашей задаче худшие результаты
4) Все модельки gpt-5.4 работают в 3+ раза быстрей
Про ИИ, разработку, будущее

Сумбурный пост, захотел поделиться

Последний ±год мы очень круто научились применять ИИшку для генерации кода. Для генерации большого кол-ва кода. Хорошего кода. Для сложных и комплексных задач в довольно сложных проектах. Результаты для нас это дает потрясающие — объем сделанного и реально работающего одним человеком (иногда лично мной) в несколько раз (±3-5) превышает объемы сделанного полноценными командами за аналогичные периоды ранее. Пока это все — для наших внутренних продуктов и продуктов, которые готовим к выводу на рынок (почему так — кратко писал тут). В том числе, для большой платформы, которая медленно и долго росла и развивалась внутри Спектра, а теперь благодаря ИИ получила сильный буст

Когда я говорю про про сложные задачи и проекты - в моем понимании это продукты, где есть разные микросервисы, разные репозитории, много интеграционных механизмов между ними и большое кол-во взаимосвязей. А типичная задача — это какая-то e2e-фича, которая покрывает полноценный юзеркейс и при этом затрагивает несколько механик и сервисов.
Мы уже умеем организовывать архитектуру, код и документацию в проектах так, чтобы с этим могли эффективно работать кодинг-генты. Уже сформировались довольно устойчивые воркфлоу, набор применяемых тулов, Skill's, Spec-Driven подход. Мы более-менее научились тиражировать эти знания и навыки благодаря нашим курсам.

Но это лишь фундамент того, к чему мы идем. Сейчас это прекрасно работает, но держится на супер-квалифайд людях и отсутствии организационных барьеров на пилотных продуктах.

Сейчас мы сосредоточены на том, чтобы использовать наш опыт для построение предсказуемого, системного и масштабируемого процесса разработки. Процесса разработки, где ИИшка имплементирована во все этапы SDLC - прямо вот начиная с дизайна. И это прямо огромный челлендж с большим количеством неопределенностей и точек приложения усилий.

Например, чисто инструментально много вопросов.
— Как организовать документацию, чтобы и людям было с ней удобно работать и чтобы был вменяемый пайплайн ее доставки до ИИ-агентов?
— На базе чего построить таск-трекинг и как лучше всего дать доступ к проектному контексту агентам (при том, что хайповые облачно-зарубежные штуки аля Linear нам не подходят — нам нужен только standalone в нашем контуре)?
— Как организовать работу с UI проекта, чтобы был полноценный пайплайн от дизайн-системы до финальных макетов и чтобы ко всему этому: были нормальные официальные MCP для агентов и что важней - чтобы условные продакты могли промптами быстро собирать новые макеты (вроде как-то идет в этом направлении Skitch от Гугла, но пока простоват) ?
— ... и такого еще много. В целом, тут речь про существенную пересборку всей ИТ-инфраструктуры для разработки

Но еще больше (которые мне кажутся более сложными) вопросов в части управления новой системой.
— Как должна быть организована ролевая модель в новых командах? Супер-квалифайды, которе могут сделать все — это красиво, но сложно масштабируемо. Узкие атомарные роли (фронт-разработчик, бэк-разработчик и пр) — понятно, но уже очень неэффективно и неуправляемо со скоростями генерации кода ИИшкой.
— Применимы ли привычные нам фреймворки для управления? Agile, Waterfall? Ванугю, скоро появится AIgile :))
— Как организовать версионирование/актуализацию документации, когда кода генерируется столько, что все устаревает за час?
— Как все это чудо прогнозировать и оценивать, чтобы этим управлять? Часы — кажется, точно нет. Стори-поинты — сомнительно. Токены — звучит логично, но как такие оценки подружить с бизнесом (которому нужны сроки, например)

Ответу на эти и многие другие вопросы будет посвящен ближайший год.

Если вы уже набили шишек по какому-то из вопросов и хотите послушать про наши шишки — пишите мне, давайте общаться, обмениваться опытом и двигаться быстрей

#ИИиБизнес
🔥8👍3😱1
Кстати, насчет РФных облачных сервисов управления проектами и AI-native разработки

Я посмотрел все известные мне сервисы, искал какой-то, который можно попробовать для пилотирования ai-native процесса разработки. Мне было важно найти сервис, который хотя бы смотрит в этом направлении. И НЕ НАШЕЛ :(

Первая, фундаментальная штука, которая мне нужна в этом плане — это официальный MCP-сервер, который можно подключить к кодинг-агенту и дать ему доступ ко всему контексту и данным проекта (таски, база знаний и пр). Примеры: у Linear , у Plane, у Atlassian

Ни у кого сейчас нет такой фичи. Встроенные ИИ-агенты, встроенные ИИ-помощники, какая-то ИИ-аналитика и другие ИИ-фичи — есть. А вот MCP-сервера для доступа к данным для внешних ИИ-агентов нет.

Если меня читают разработчики таких сервисов — прислушайтесь. За AI-native разработкой будущее и, видимо, у вас есть очень крутая возможность выделиться среди конкурентов.

Кстати, мы в Спектр можем вам помочь с разработкой этого MCP-сервера и заодно вместе попилотировать AI-native подход 😊

Spectr | Курс по AI для разработчиков
Решил поделиться одним из главных организационных изменений, которое будет во втором потоке курса по ИИ в разработке

У нас есть Групповой тариф, который подразумевает, что студенты добавляются в чат ПОТОКА, могут там консультироваться с преподавателями и могут ходить на еженедельные встречи

Дак вот мы решили превратить этот закрытый чат в комьюнити. Это будет один чат на все потоки (состоявшиеся и грядущие) и даже те, кто уже закончил обучение — будут иметь возможность ходить на ВСЕ еженедельные встречи. Без ограничений по сроку.

Первый поток показал, что еженедельные встречи — это не просто история про разбор домашек и ответы на вопросы, а место где реально заинтересованные люди делятся своими наблюдениями, опытом, болями и рабочими кейсами. Это очень круто, потому что опыт и специфика работы у ребят очень разные: были люди из быстрых стартапов, где всем по-умолчанию оплачивают подписку на Cursor; а были люди из банков, где за одно упоминание ИИ вызывают на ковер к СБ — это очень расширяет кругозор и позволяет обстучать свое представление о мире об чужой опыт :)

В общем, теперь наш Групповой тариф — это не про возможность получать обратную связь в рамках потока, а еще и про пожизненный доступ к закрытому комьюнити

🔥 Следующий поток стартует 20 апреля — не пропустите!

Курс по AI для разработчиков
🔥62❤‍🔥1
Как бороться с тем, что разработчики (и не только) используют ИИ для прохождения тех собеседований?

Очень просто — НЕ НАДО С ЭТИМ БОРОТЬСЯ, ПУСТЬ ИСПОЛЬЗУЮТ!

ИИ-шка сама по себе никак не усиливает компетентность человека. Более того, на коротком промежутке времени может наглядно продемонстрировать его некомпетентность.

Саня позвал меня поучаствовать экспертом в экспериментальном собеседовании, где нет никаких ограничений по применяемым инструментам:
— 1.5 часа
— Человек на старте получает большую задачу, которую сделать руками почти невозможно, а с ИИ-тулами можно
— В процессе реализации человек защищает и аргументирует выбранные им решения
— Нужно показать РЕЗУЛЬТАТ

Какой смысл проверять на собеседовании узкие синтетические знания, если теперь мы можем проверить реальный перформанс человека? Думаю, что за таким форматом собеседования разработчиков будущее!

Смотреть тут: https://www.youtube.com/watch?v=YOxMBvX3pj4

Spectr | Курс по AI для разработчиков
🔥7👍1
🕶 Исторический момент — сегодня у нас в PnL появилась отдельная строка с расходами на ИИ-инфраструктуру и сервисы (раньше все было спрятано в ИТ)

И в честь этого, по секрету делюсь с вами ссылкой на запись нашего недавнего вебинара про ИИ-инфраструктуру и ее стоимость — https://kspct.ru/llm-webinar-record

Spectr | Курс по AI для разработчиков
1👍41
Channel name was changed to «Алексей Цыкарев | ИТ, ИИ и бизнес»
Как дать ИИ-агентам доступ к Jira и Confluence в своем контуре

Я писал, что одна из важных задач в AI-native разработке - дать агентам нормальный доступ к проектному контексту.

У нас развернуты серверные Jira/Confluence в своем контуре и после ряда экспериментов и изысканий остановились на вот этом решении — https://mcp-atlassian.soomiles.com, которое очень рекомендую.

Почему в итоге выбрали его
• работает с Atlassian в своем контуре, а не только с облаком
• отдает агенту не только задачи, но и связанный контекст (вложения, комментарии, ссылки и пр.)
• совместимо с большинством кодинг-агентов и легко цепляется к продуктам Atlassian через штатный механизм внешних API-ключей

Например, когда я тестировал даже официальный MCP для Plane (https://developers.plane.so/dev-tools/mcp-server) — я там уперся в то, что агент с этим MCP не мог вытащить приложенные скриншоты из задачи и это сразу ломало часть сценариев использования. А тут все работает без дополнителных танцев с бубнами и получает доступ действительно ко всему контексту сущностей: задачи, вложения к ним, связанные ссылки и страницы конфлюенса со всеми комментариями и все остальное — и это просто божественно.

Если используете продукты Atlassian, рекомендую!

Spectr | Курс по AI для разработчиков
👍2
Вышел новый Opus 4.7

Официальное — https://www.anthropic.com/news/claude-opus-4-7

Краткий обзор от меня:

1) Лучше предыдущей версии по большинству метрик. Наиболее существенный прирост по Visual reasoning (если проще, то модель стала заметно лучше понимать, что происходит на картинках)

2) Говорят, что поменяли токенизатор и теперь моделька на те же самые задачи может тратить на ±30% больше токенов и рекомендуют проверить старые промпты, т.к. новая моделька более буквально понимает инструкции. Есть небольшое руководство по миграции с Opus 4.6

3) Стоимость осталось на уровне Opus 4.6, стоимость Opus 4.6 тоже оставили без изменений

4) В официальном релизе и приводимых бенч-марках упоминается Claude Mythos Preview — моделька следующего поколения, которая лучше текущего поколения и которую они пока держат в ограниченном доступе из-за кибер-рисков 🤔

Будем пробовать
👍5
В эти выходные угольный гриль прошел ежегодное тех обслуживание и тем самым официально открыл новый гриль-сезон. Сезон был открыт потрясающими сочными бургерами!

Всем продуктивной недели!
4🔥3❤‍🔥2
ИИ в дизайне

По недавним релизам я вижу, что «инженеризация» дизайна идет очень активно и тот же дизайн интерфейсов становится все меньше творческой и все больше инженерной дисциплиной.

Вот Гугл релизнул DESIGN.md, open-source стандарт для описаний дизайн-систем для агентов.

Антропики релизнули Claude Design, который умеет работать с дизайн-системами и уже сейчас выдает довольно хорошие интерфейсы и презентации (я прямо был удивлен уровнем результата).

А еще помним про Google Stitch, который не так давно тоже сильно прокачали.

В общем, на горизонте вырисовывается полноценный ИИ-пайплайн работы с интерфейсами и дизайн постепенно выходит из модели "нарисовали в Figma, дальше как-нибудь перенесем" в модель, где интерфейс описывается как система ограничений, компонентов и сценариев, с которыми могут работать и люди, и агенты
🔥5
Что нового в ИИ за неделю

По пятницам постараюсь каждую неделю делать небольшой дайджест со своими комментариями главных новостей про ИИ, которые считаю важными.

Вышел новый GPT-5.5
Как обычно, метрики подросли (не кардинально). Заявляют, что лучше работает с длинным контекстом и более эффективно расходует токены (в противовес Opus 4.7, к слову). При этом, цена на новую модель выросла в 2 раза по сравнению с GPT-5.4.
Я уже попробовал погонять модель для планирования — как будто, правда лучше ориентируется в архитектуре и делает меньше проходов по коду для планирования, но это очень субъективные наблюдения. Пока каких-то супер-преимуществ перед GPT-5.4 не увидел, чтобы платить х2 🤔

Вышли новые модели DeepSeek 4
А вот это прямо интересно, т.к. больших релизов от дипсика не было уже больше года. Контекст стал 1M (у 3.2 был 128к). Цены остались прежними (напомню, что цену на дипсик в разы меньше, чем у OpenAI/Антропиков).

Интересно, что сразу раскатали новые модели на API, при чем старые названия моделей в API-вызовах продолжили работать, но физически все вызовы ведут уже на модели нового поколения. А у нас используется ооооочень-много автоматизацией на базе дипсика по API как раз — утром в статистике уже увидел, что пошел расход по новым моделям и боялся, что что-то отвалится из-за этого — но нет, все работает прекрасно и стабильно. Получается, что ночью наши автоматизации без нашего ведома переехали на модели нового поколения и бесшовно продолжили работать за прежние деньги, но с более высоким качеством — мне нравится такое.

P.S. По поводу обратной совместимости в API DeepSeek — она не бесконечная и согласно документации, вызовы моделей в старом формате перестанут работать 24 июля. Так что код все-таки придется обновить
👍3
Как начинается ваша неделя? Сколько «давайте после праздников» уже услышали?

Хочу поделиться анонсом спонтанного вебинара, который мы хотим провести в перерывах между праздниками.

🗓 5 мая, 13:00 мск, вторник
💻 ОНЛАЙН

Позвали в гости Олега Пендрак (Tech Lead QA Automation в СберЗдоровье и лидера
Thread QA), чтобы поговорить про применение ИИ в автотестировании. Ведущий — наш CTO, Олег Казаков.

Олег (угадайте, который) расскажет AI уже помогает в работе автотестировщика: искать информацию, писать и чинить тесты, работать с локаторами, разбирать JSON, писать SQL-запросы и рефакторить код.

Вебинар будет полезен для QA Automation инженеров, тестировщиков, разработчиков и техлидов, которым важны реальные сценарии применения AI в инженерной работе.

ПОДРОБНОСТИ И РЕГИСТРАЦИЯ
🔥2
Тут крутые новости подоспели!

Jume, IBP-платформа нового поколения, ключевым интегратором которой является Спектр, заключила партнерское соглашение с компанией «Технологии Доверия» (ТеДо) 🔥

Для Спектра это важная новость: мы работаем с Jume как ключевой интегратор и видим потенциал платформы в реальных проектах. Нам ценно быть частью экосистемы сильного российского вендора, который развивает современный продукт для задач крупного бизнеса.

Партнерство Jume и ТеДо показывает, что рынок IBP в России переходит к более зрелой стадии. Компании все чаще рассматривают такие платформы не как инструмент для автоматизации отдельных процессов, а как основу для сквозного управления планированием, цепями поставок, финансами и данными.

Если у вас планирование до сих пор живет в Excel, разрозненных системах или ручных согласованиях между отделами, приходите обсудить. В Спектре можем помочь разобраться, как подойти к внедрению IBP-платформы и где в этом процессе будет бизнес-польза
🔥3
Ура, наконец-то работать! 🎉
😁5🤔2😱2
Кайфую от разницы часовых поясов, Перми, хорошей погоды и хорошей погоды в Перми

Вот сегодня, например. Развез с утра детей и час пешком и с кофейком гулял по парку в центре. Солнечно, тепло — красота.

А еще — несколько тысяч шагов, хорошая альтернатива утренней тренировке. А еще из-за разницы часовых поясов (у меня +2 мск) никто не отвлекает, а до начала рабочих активностей еще уйма времени.

Всем продуктивного дня! 🔥
🔥63
Применение ИИ у застройщиков, опыт «Ак Барс Дом»

21 мая проведем эфир с ИТ-директором девелоперской компании и поговорим, как внедряется ИИ: какие задачи с его помощью пытаются решать, что работает, а что — нет

Гость — Сергей Михеев, ИТ-директор в «Ак Барс Дом»

🗓 21 мая, 12:00 мск, Четверг
💻 ОНЛАЙН

На примере опыта девелопера «Ак Барс Дом» разберём, как AI внедряется в компании: где он уже применяется, есть ли отраслевая специфика и какой эффект это даёт бизнесу. Поговорим о том, как искусственный интеллект используется в разных бизнес-процессах — где он даёт результат, а где нет. Затронем применение AI в прогнозировании, работе с платежами, клиентских сценариях и повседневной работе команд.

Эфир пройдет в формате живого разговора, с возможностью задавать вопросы и уточнять детали по ходу обсуждения.

Обсудим ключевые ограничения и риски внедрения ИИ, а также отдельно — влияние качества данных внутри компании на результаты внедрений

РЕГИСТРАЦИЯ
🔥52
Динамика рынка ИТ-аутстаффинга за май 2025 - апрель 2026

У нас есть внутренний сервис, который ежедневно мониторит и классифицирует данные из 100+ источников с запросами на ИТ-аутстаффинг. Для внутренних целей я подготовил большой интерактивный аналитический отчет в разных срезах, а общей динамикой рынка решил поделиться публично.

Кол-во запросов за каждый месяц — на графике

Данные на основе выборки, где:
— 14к запросов (это после удаления дублей)
— только 30+ каналов, которые систематически публикуют запросы на протяжении срока наблюдения
— публикации, которые явно классифицированы, как запросы на конкретные позиции с указанием требований
— удалены дублирующиеся по каналам запросы (более 5к)

Буду в этом году по итогам каждого месяца публиковать обновленный отчет с наложением новых данных - будем вместе следить на Y2Y динамикой

Кстати, активно расширяем партнерскую есть, чтобы быстрей закрывать прямые запросы клиентов — пишите Кате, если хотите вступить
👍4🔥2