6 сценариев внедрения ИИ в девелопмент
Собрали решения, которые можно быстро встроить в работу и получить измеримый результат: снизить количество ошибок, увеличить производительность команд и оптимизировать расходы.
▪️AI-ассистент менеджера по продажам
Чат-бот подключается к привычным каналам: CRM, сайту, Telegram. Помогает найти ответы на вопросы клиентов и даёт подсказки по документам.
▪️Консультант по недвижимости
Обрабатывает запросы на естественном языке, точнее выявляет потребности и подбирает персональные объекты. Может работать как плагин на сайте, в мессенджере или личном кабинете.
▪️Голосовой помощник для колл-центра или шоурума
Работает как дополнение к телефонии или робот-консультант. Воспринимает вопросы клиентов, отвечает по базе знаний и формирует персонализированные подборки решений.
▪️Анализ диалогов операторов колл-центра
Выявляет ошибки и отклонения от сценариев, классифицирует причины отказа и помогает оценить качество работы сотрудников. ИИ-ассистент может анализировать диалоги как в реальном времени, так и в ретроспективе.
▪️ИИ-помощник для управляющей компании
Чат-бот или голосовой робот отвечает на частые вопросы жителей, фиксирует обращения и снижает нагрузку на операторов.
▪️Компьютерное зрение на стройке
Программно-аппаратный комплекс, веб- и мобильное приложение для мониторинга целевых событий. Фиксирует передвижение техники и персонала, контролирует опасные зоны и выявляет простои.
Подробнее о том, какие AI-решения можно внедрить в девелопмент уже сейчас, смотрите в презентации коммерческого директора KTS Александра Баталова.
Собрали решения, которые можно быстро встроить в работу и получить измеримый результат: снизить количество ошибок, увеличить производительность команд и оптимизировать расходы.
▪️AI-ассистент менеджера по продажам
Чат-бот подключается к привычным каналам: CRM, сайту, Telegram. Помогает найти ответы на вопросы клиентов и даёт подсказки по документам.
▪️Консультант по недвижимости
Обрабатывает запросы на естественном языке, точнее выявляет потребности и подбирает персональные объекты. Может работать как плагин на сайте, в мессенджере или личном кабинете.
▪️Голосовой помощник для колл-центра или шоурума
Работает как дополнение к телефонии или робот-консультант. Воспринимает вопросы клиентов, отвечает по базе знаний и формирует персонализированные подборки решений.
▪️Анализ диалогов операторов колл-центра
Выявляет ошибки и отклонения от сценариев, классифицирует причины отказа и помогает оценить качество работы сотрудников. ИИ-ассистент может анализировать диалоги как в реальном времени, так и в ретроспективе.
▪️ИИ-помощник для управляющей компании
Чат-бот или голосовой робот отвечает на частые вопросы жителей, фиксирует обращения и снижает нагрузку на операторов.
▪️Компьютерное зрение на стройке
Программно-аппаратный комплекс, веб- и мобильное приложение для мониторинга целевых событий. Фиксирует передвижение техники и персонала, контролирует опасные зоны и выявляет простои.
Подробнее о том, какие AI-решения можно внедрить в девелопмент уже сейчас, смотрите в презентации коммерческого директора KTS Александра Баталова.
👍6❤5🤝2🔥1
Managed Agents от Anthropic: зачем агентам своя операционная система
Anthropic опубликовал инженерный разбор Managed Agents — своего сервиса для запуска агентов. Это интересное объяснение того, как стоит проектировать инфраструктуру агентов в 2026.
Проблема. Агент — это не один вызов LLM, а длинный цикл: модель думает → вызывает инструмент → получает результат → думает дальше. Если жёстко зашить этот цикл под текущее поколение моделей, через полгода придётся переписывать инфраструктуру. Авторы формулируют это одной фразой, которую уже растащили на цитаты: «Harnesses encode assumptions that go stale as models improve».
Идея. Решение не новое — так операционные системы в своё время справились с «программами, которых ещё не существует». Они не пытались угадать будущие приложения, а виртуализировали железо в стабильные абстракции: процесс, файл, сокет. Приложения менялись, абстракции оставались.
Anthropic применяет этот приём к агентам — раскладывает их на три независимые сущности:
▪️Session — append-only лог всего, что произошло. Живёт отдельно от модели и её контекстного окна. Это «память» агента, к которой можно обращаться произвольно.
▪️Harness — цикл, который крутит модель и маршрутизирует tool calls. Stateless, одноразовый, заменяемый.
▪️Sandbox — среда, где исполняются инструменты. Тоже одноразовая: упала — подняли новую.
Подробный разбор можно прочитать по ссылке.
#александр_опрышко
Anthropic опубликовал инженерный разбор Managed Agents — своего сервиса для запуска агентов. Это интересное объяснение того, как стоит проектировать инфраструктуру агентов в 2026.
Проблема. Агент — это не один вызов LLM, а длинный цикл: модель думает → вызывает инструмент → получает результат → думает дальше. Если жёстко зашить этот цикл под текущее поколение моделей, через полгода придётся переписывать инфраструктуру. Авторы формулируют это одной фразой, которую уже растащили на цитаты: «Harnesses encode assumptions that go stale as models improve».
Идея. Решение не новое — так операционные системы в своё время справились с «программами, которых ещё не существует». Они не пытались угадать будущие приложения, а виртуализировали железо в стабильные абстракции: процесс, файл, сокет. Приложения менялись, абстракции оставались.
Anthropic применяет этот приём к агентам — раскладывает их на три независимые сущности:
▪️Session — append-only лог всего, что произошло. Живёт отдельно от модели и её контекстного окна. Это «память» агента, к которой можно обращаться произвольно.
▪️Harness — цикл, который крутит модель и маршрутизирует tool calls. Stateless, одноразовый, заменяемый.
▪️Sandbox — среда, где исполняются инструменты. Тоже одноразовая: упала — подняли новую.
Подробный разбор можно прочитать по ссылке.
#александр_опрышко
🔥6👍1
Мой MCP-стек для Claude Code
Сам по себе Claude Code — просто CLI. Реальную пользу ему даёт обвязка из MCP-серверов: они подключают агента к твоим данным и workflow.
Делюсь стеком, который использую ежедневно. Разбил его на три контура:
▫️ Автоматизация рутины (менеджерская часть)
workbook — самописный MCP, который постепенно наращиваю под свои задачи. Сейчас в нём: работа с Твиттером, Контур.Толк, календарём, почтой, to-do list.
yandex-tracker — управляю загрузкой, создаю задачи на основе транскрибации.
excel-mcp-server и mcp-google-sheets — читаю локальные xlsx и Google Sheets. Удобно для работы со сметами.
▫️ Исследования
arXiv — для поиска и чтения свежих статей, чтобы понимать, как устроены SoTA-подходы.
reddit-mcp-buddy — быстро снять пульс сообщества: что обсуждают, какие инструменты хвалят, на что жалуются. Хороший сигнал для продуктовых решений.
playwright/computer-use — когда WebSearch и WebFetch не справляются (авторизация, JS-рендеринг, закрытый контент) или нужна автоматизация без API.
▫️ Программирование
context7, deepwiki — инструменты, которые дают актуальную документацию для агента. Подробно рассказывал об этом в посте.
everything-claude-code (affaan-m) — готовый набор из 47 агентов, 181 скилла и 79 команд: code-review, TDD, planner, build-fix, мультиагентная оркестрация. Беру как стартер и выкидываю лишнее.
spec-kit от GitHub — тулкит для spec-driven development. Вместо вайб-кодинга выстраивает пайплайн: constitution → specify → clarify → plan → tasks → implement → verify. Спеки становятся исполняемыми артефактами, агент работает с чёткими входами вместо расплывчатых промптов.
#александр_опрышко
Сам по себе Claude Code — просто CLI. Реальную пользу ему даёт обвязка из MCP-серверов: они подключают агента к твоим данным и workflow.
Делюсь стеком, который использую ежедневно. Разбил его на три контура:
▫️ Автоматизация рутины (менеджерская часть)
workbook — самописный MCP, который постепенно наращиваю под свои задачи. Сейчас в нём: работа с Твиттером, Контур.Толк, календарём, почтой, to-do list.
yandex-tracker — управляю загрузкой, создаю задачи на основе транскрибации.
excel-mcp-server и mcp-google-sheets — читаю локальные xlsx и Google Sheets. Удобно для работы со сметами.
▫️ Исследования
arXiv — для поиска и чтения свежих статей, чтобы понимать, как устроены SoTA-подходы.
reddit-mcp-buddy — быстро снять пульс сообщества: что обсуждают, какие инструменты хвалят, на что жалуются. Хороший сигнал для продуктовых решений.
playwright/computer-use — когда WebSearch и WebFetch не справляются (авторизация, JS-рендеринг, закрытый контент) или нужна автоматизация без API.
▫️ Программирование
context7, deepwiki — инструменты, которые дают актуальную документацию для агента. Подробно рассказывал об этом в посте.
everything-claude-code (affaan-m) — готовый набор из 47 агентов, 181 скилла и 79 команд: code-review, TDD, planner, build-fix, мультиагентная оркестрация. Беру как стартер и выкидываю лишнее.
spec-kit от GitHub — тулкит для spec-driven development. Вместо вайб-кодинга выстраивает пайплайн: constitution → specify → clarify → plan → tasks → implement → verify. Спеки становятся исполняемыми артефактами, агент работает с чёткими входами вместо расплывчатых промптов.
#александр_опрышко
🔥13👍7❤1
AI — только для enterprise. Доказываем, что это не так
Средний и малый бизнес отказывается от внедрения AI, потому что считает его дорогим инструментом для крупных корпораций с миллионными бюджетами.
На самом деле ИИ-решения подходят любому бизнесу, в котором есть повторяющиеся процессы.
В новой статье разбираем:
▫️ почему проекты остаются на уровне вечного пилота
▫️ процессы, которые стоит автоматизировать в первую очередь
▫️ какие метрики использовать, чтобы оценить результат
▫️ как платформенный подход меняет экономику AI-проектов
▫️ сроки и этапы запуска кастомного решения
Статья будет интересна малому и среднему бизнесу, который думает о внедрении AI, но не знает, с чего начать. Заходите в блог, чтобы узнать, как за 1-2 месяца сделать AI прикладным инструментом с измеримым эффектом.
Средний и малый бизнес отказывается от внедрения AI, потому что считает его дорогим инструментом для крупных корпораций с миллионными бюджетами.
На самом деле ИИ-решения подходят любому бизнесу, в котором есть повторяющиеся процессы.
В новой статье разбираем:
▫️ почему проекты остаются на уровне вечного пилота
▫️ процессы, которые стоит автоматизировать в первую очередь
▫️ какие метрики использовать, чтобы оценить результат
▫️ как платформенный подход меняет экономику AI-проектов
▫️ сроки и этапы запуска кастомного решения
Статья будет интересна малому и среднему бизнесу, который думает о внедрении AI, но не знает, с чего начать. Заходите в блог, чтобы узнать, как за 1-2 месяца сделать AI прикладным инструментом с измеримым эффектом.
🔥8👏2
Этика AI в продаже недвижимости: можно ли прослушивать разговоры с клиентами?
Застройщики часто приходят к нам с запросом записывать встречи и прогонять их через LLM: хочется контролировать качество консультаций, собирать все возражения и автоматизировать работу с ними.
Технологически это несложно, но на практике подход может сыграть против девелопера.
При покупке квартиры люди обсуждают с агентом чувствительные темы: финансовые возможности, семейные обстоятельства, размер первоначального взноса. Если человек понимает, что разговор записывается и анализируется AI, доверие рушится. Прослушка и контроль со стороны искусственного интеллекта пугают клиентов, поэтому сделка может сорваться.
Эффективнее внедрить AI-ассистента для продавцов. Он помогает со сложными вопросами в реальном времени: за секунды находит информацию в базе знаний и формулирует точный ответ. Это сохраняет динамику сделки, показывает экспертность и не нарушает приватность клиента.
Застройщики часто приходят к нам с запросом записывать встречи и прогонять их через LLM: хочется контролировать качество консультаций, собирать все возражения и автоматизировать работу с ними.
Технологически это несложно, но на практике подход может сыграть против девелопера.
При покупке квартиры люди обсуждают с агентом чувствительные темы: финансовые возможности, семейные обстоятельства, размер первоначального взноса. Если человек понимает, что разговор записывается и анализируется AI, доверие рушится. Прослушка и контроль со стороны искусственного интеллекта пугают клиентов, поэтому сделка может сорваться.
Эффективнее внедрить AI-ассистента для продавцов. Он помогает со сложными вопросами в реальном времени: за секунды находит информацию в базе знаний и формулирует точный ответ. Это сохраняет динамику сделки, показывает экспертность и не нарушает приватность клиента.
❤5🔥4👍2
Поговорим, как AI влияет на OKR: от горизонтов планирования до управленческого мышления
12 мая в 11:30 приглашаем на подкаст с Иваном Лавровым, Head of AI в KTS и основателем OKRsana — платформы для управления OKR с интегрированными AI-агентами.
В прямом эфире обсудим:
— каковы актуальные горизонты планирования
— помогает ли AI формулировать более сильные цели или, наоборот, упрощает мышление
— можно ли уйти от таблиц в OKR и не потерять управляемость
— какие инструменты реально работают, а какие остаются модными практиками
Регистрируйтесь по ссылке, приходите за инсайтами и задавайте вопросы — обещаем, будет интересно!
12 мая в 11:30 приглашаем на подкаст с Иваном Лавровым, Head of AI в KTS и основателем OKRsana — платформы для управления OKR с интегрированными AI-агентами.
В прямом эфире обсудим:
— каковы актуальные горизонты планирования
— помогает ли AI формулировать более сильные цели или, наоборот, упрощает мышление
— можно ли уйти от таблиц в OKR и не потерять управляемость
— какие инструменты реально работают, а какие остаются модными практиками
Регистрируйтесь по ссылке, приходите за инсайтами и задавайте вопросы — обещаем, будет интересно!
🔥8✍4
Знаем, как найти лишние расходы на инфраструктуру и сократить их без риска ↗️
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Программисты делают бизнес
Вы всё ещё переплачиваете за инфраструктуру? Тогда мы идём к вам.
Расходы на облако часто растут незаметно. Тестовые среды работают ночью и в выходные. Неиспользуемые ресурсы продолжают списывать деньги. У команд нет общего правила, кто следит за потреблением и где проходит граница между «нужно» и «просто осталось включенным».
В итоге счета растут, а ясности, за что платит бизнес, становится меньше.
Мы поможем найти, где инфраструктура расходует лишнее, и сократить затраты без риска для продукта и команды.
Что делаем:
— проводим аудит расходов на облако;
— оптимизируем инфраструктуру;
— настраиваем мониторинг потребления и уведомления;
— выделяем центры затрат;
— прогнозируем бюджет;
— считаем TCO и ROI.
Если есть ощущение, что можно сэкономить на инфраструктуре, начните с бесплатного аудита. За 5 рабочих дней покажем, где вы теряете деньги. Сначала доведем до результата и только потом возьмем оплату. Гонорар KTS = подтвержденная экономия за 6 месяцев.
Расходы на облако часто растут незаметно. Тестовые среды работают ночью и в выходные. Неиспользуемые ресурсы продолжают списывать деньги. У команд нет общего правила, кто следит за потреблением и где проходит граница между «нужно» и «просто осталось включенным».
В итоге счета растут, а ясности, за что платит бизнес, становится меньше.
Мы поможем найти, где инфраструктура расходует лишнее, и сократить затраты без риска для продукта и команды.
Что делаем:
— проводим аудит расходов на облако;
— оптимизируем инфраструктуру;
— настраиваем мониторинг потребления и уведомления;
— выделяем центры затрат;
— прогнозируем бюджет;
— считаем TCO и ROI.
Если есть ощущение, что можно сэкономить на инфраструктуре, начните с бесплатного аудита. За 5 рабочих дней покажем, где вы теряете деньги. Сначала доведем до результата и только потом возьмем оплату. Гонорар KTS = подтвержденная экономия за 6 месяцев.
🔥4👍3👌2
RAG-платформа для 12 000 операторов Альфа-Банка: ускорили поиск данных в 20 раз
Раньше операторы контакт-центра вручную искали информацию в базе знаний, чтобы ответить клиенту. На обработку одного запроса в среднем уходило 5 минут.
Чтобы ускорить работу операторов, Альфа-Банк решил внедрить RAG-платформу. За помощью обратились к команде KTS.
За 4 месяца мы вместе вывели проект в production и настроили систему так, чтобы данные всегда были актуальны, и каждый оператор получал ответ с учётом его уровня доступа.
Платформу развернули внутри контура банка и запустили на двух GPU H100. Это позволило уложиться в экономику проекта и при этом обеспечить запас по производительности.
В результате RAG-платформа ускорила и упростила работу операторов:
▪️ среднее время обработки запроса уменьшилось на 40 секунд: с 5 минут до 4 минут 20 секунд
▪️ поиск данных стал в 20 раз быстрее: 3 секунды вместо 60
93% операторов положительно оценили работу платформы, и решение масштабировали на всех сотрудников Альфа-Банка. Сегодня система обрабатывает 85 000 запросов в сутки.
Больше деталей про настройку и работу RAG-системы показали в кейсе
Раньше операторы контакт-центра вручную искали информацию в базе знаний, чтобы ответить клиенту. На обработку одного запроса в среднем уходило 5 минут.
Чтобы ускорить работу операторов, Альфа-Банк решил внедрить RAG-платформу. За помощью обратились к команде KTS.
За 4 месяца мы вместе вывели проект в production и настроили систему так, чтобы данные всегда были актуальны, и каждый оператор получал ответ с учётом его уровня доступа.
Платформу развернули внутри контура банка и запустили на двух GPU H100. Это позволило уложиться в экономику проекта и при этом обеспечить запас по производительности.
В результате RAG-платформа ускорила и упростила работу операторов:
▪️ среднее время обработки запроса уменьшилось на 40 секунд: с 5 минут до 4 минут 20 секунд
▪️ поиск данных стал в 20 раз быстрее: 3 секунды вместо 60
93% операторов положительно оценили работу платформы, и решение масштабировали на всех сотрудников Альфа-Банка. Сегодня система обрабатывает 85 000 запросов в сутки.
Больше деталей про настройку и работу RAG-системы показали в кейсе
🔥16👍8
ИИ застрял в «одиночном режиме»
За неделю несколько ведущих ресерчеров независимо высказались об одном: следующий рубеж развития ИИ — не интеллект, а интерактивность. Не «насколько умна модель», а «насколько хорошо она работает вместе с человеком».
В чём проблема: сегодня модели воспринимают реальность одним потоком. Пока не дописали запрос — LLM ждёт и не видит, что вы делаете. Это узкий канал: до модели доходит лишь часть вашего знания, намерения и оценки.
Thinking Machines сравнивает текущий формат взаимодействия с попыткой решить важный спор по почте вместо личной встречи. Они вводят новую концепцию — interaction models. Ключевая идея: интерактивность не «обвязка» вокруг модели, а часть самой архитектуры. Сегодня системы имитируют перебивания и многоканальность через harness (внешнюю «обвязку» — готовые компоненты, склеенные вокруг модели) и VAD (voice activity detection — отдельный модуль, который определяет, говорит человек или молчит) для распознавания границ реплик.
Аргумент от Bitter Lesson: рукотворные надстройки проиграют общим масштабируемым методам. Если интерактивность встроена в модель — масштабирование одновременно делает её умнее и улучшает качество взаимодействия с человеком.
Гонка за «интеллектом» упёрлась в то, как этот интеллект передать человеку и принять обратно правки.
#александр_опрышко #развитие_ИИ
За неделю несколько ведущих ресерчеров независимо высказались об одном: следующий рубеж развития ИИ — не интеллект, а интерактивность. Не «насколько умна модель», а «насколько хорошо она работает вместе с человеком».
В чём проблема: сегодня модели воспринимают реальность одним потоком. Пока не дописали запрос — LLM ждёт и не видит, что вы делаете. Это узкий канал: до модели доходит лишь часть вашего знания, намерения и оценки.
Thinking Machines сравнивает текущий формат взаимодействия с попыткой решить важный спор по почте вместо личной встречи. Они вводят новую концепцию — interaction models. Ключевая идея: интерактивность не «обвязка» вокруг модели, а часть самой архитектуры. Сегодня системы имитируют перебивания и многоканальность через harness (внешнюю «обвязку» — готовые компоненты, склеенные вокруг модели) и VAD (voice activity detection — отдельный модуль, который определяет, говорит человек или молчит) для распознавания границ реплик.
Аргумент от Bitter Lesson: рукотворные надстройки проиграют общим масштабируемым методам. Если интерактивность встроена в модель — масштабирование одновременно делает её умнее и улучшает качество взаимодействия с человеком.
Гонка за «интеллектом» упёрлась в то, как этот интеллект передать человеку и принять обратно правки.
#александр_опрышко #развитие_ИИ
🔥7👍4👏3❤1
Как я нахожу инсайты и отслеживаю личный прогресс с помощью скиллов в Claude
Каждый день я работаю в Claude Code с разными задачами: бизнес- и продуктовые исследования, настройка агентов, проверка новых идей.
В процессе столкнулся с двумя проблемами:
1) При параллельной работе в нескольких окнах с включённым auto-mode часть решений проходит мимо — можно пропустить интересные и полезные инсайты в выборе тактики.
2) Когда фоном ведёшь несколько задач, иногда в порыве теряешь фокус. При этом хочется фиксировать, что ежедневная работа действительно ведёт к поставленным целям.
Чтобы закрыть эти боли, я настроил скиллы /insight и /progress.
/insight. В конце сессии смотрит, было ли в ней то, что стоит запомнить. Если да — пишет короткую запись в журнал (.md) в фиксированном формате. Если нет — молчит. Встроил фильтр по критериям интересного, адаптировал под свою роль (например, исключил решения про кодинг — для меня они мало применимы) и установил запрет выдумывать инсайты в рутинный день.
/progress. Запускается ежедневно, читает все сессии Claude Code, сжимает их и прогоняет через агента. Тот выбирает факты: над какими проектами шла работа, что решили, какие коммиты сделаны. Затем сверяет с указанными целями (.md) и фиксирует, где есть движение, а где нет.
Раз в неделю вижу полную картину через призму работы в Claude Code: где продвинулся, что запустил, какие инсайты нашёл. Получается такая внутренняя ретроспектива.
#иван_лавров
Каждый день я работаю в Claude Code с разными задачами: бизнес- и продуктовые исследования, настройка агентов, проверка новых идей.
В процессе столкнулся с двумя проблемами:
1) При параллельной работе в нескольких окнах с включённым auto-mode часть решений проходит мимо — можно пропустить интересные и полезные инсайты в выборе тактики.
2) Когда фоном ведёшь несколько задач, иногда в порыве теряешь фокус. При этом хочется фиксировать, что ежедневная работа действительно ведёт к поставленным целям.
Чтобы закрыть эти боли, я настроил скиллы /insight и /progress.
/insight. В конце сессии смотрит, было ли в ней то, что стоит запомнить. Если да — пишет короткую запись в журнал (.md) в фиксированном формате. Если нет — молчит. Встроил фильтр по критериям интересного, адаптировал под свою роль (например, исключил решения про кодинг — для меня они мало применимы) и установил запрет выдумывать инсайты в рутинный день.
/progress. Запускается ежедневно, читает все сессии Claude Code, сжимает их и прогоняет через агента. Тот выбирает факты: над какими проектами шла работа, что решили, какие коммиты сделаны. Затем сверяет с указанными целями (.md) и фиксирует, где есть движение, а где нет.
Раз в неделю вижу полную картину через призму работы в Claude Code: где продвинулся, что запустил, какие инсайты нашёл. Получается такая внутренняя ретроспектива.
#иван_лавров
🔥14❤6
Продолжаем вместе с вами улучшать Agent Platform
Ценим обратную связь и стараемся оперативно добавлять функции по вашим пожеланиям на платформу. Один из частых запросов — детализация расходов и запросов.
▪️ Мониторинг активности: просматривайте расход токенов и количество запросов по разным параметрам — модели, времени и ключам. В личном кабинете доступна история списаний и пополнений, чтобы вам было удобнее контролировать расходы.
▪️ LLM-логи: смотрите историю запросов за последние 30 дней — без содержимого промптов и ответов. Вы увидите, какая модель использовалась, статус запроса и его стоимость.
Обновление открывает возможность добавлять новых топовых провайдеров LLM, а также модели для изображений и видео. Пишите, каких ещё функций вам не хватает — обязательно учтём пожелания в будущих релизах.
Ценим обратную связь и стараемся оперативно добавлять функции по вашим пожеланиям на платформу. Один из частых запросов — детализация расходов и запросов.
▪️ Мониторинг активности: просматривайте расход токенов и количество запросов по разным параметрам — модели, времени и ключам. В личном кабинете доступна история списаний и пополнений, чтобы вам было удобнее контролировать расходы.
▪️ LLM-логи: смотрите историю запросов за последние 30 дней — без содержимого промптов и ответов. Вы увидите, какая модель использовалась, статус запроса и его стоимость.
Обновление открывает возможность добавлять новых топовых провайдеров LLM, а также модели для изображений и видео. Пишите, каких ещё функций вам не хватает — обязательно учтём пожелания в будущих релизах.
🔥10👍3
Forwarded from Программисты делают бизнес
От RAG до агентов: что бизнес ждет от AI?
В подкасте «Большой разговор про AI» Александр Опрышко, сооснователь KTS, рассказал, как AI уже меняет разработку и digital-рынок: от оцифровки базы знаний к агентам конкретных действий, от отдельных ассистентов к AI-центричному подходу в SDLC.
Обсудили:
▫️почему компании так активно смотрят в сторону RAG, ассистентов проектировщиков и аналитики?
▫️как бизнес оценивает эффективность AI-проектов?
▫️почему многие хотят on-premise решения?
▫️куда перестраивается рынок?
▫️какой тренд показывает наш кейс ассистента Альфа-Банка с ROI 6 месяцев?
🔴 Посмотреть выпуск
В подкасте «Большой разговор про AI» Александр Опрышко, сооснователь KTS, рассказал, как AI уже меняет разработку и digital-рынок: от оцифровки базы знаний к агентам конкретных действий, от отдельных ассистентов к AI-центричному подходу в SDLC.
Обсудили:
▫️почему компании так активно смотрят в сторону RAG, ассистентов проектировщиков и аналитики?
▫️как бизнес оценивает эффективность AI-проектов?
▫️почему многие хотят on-premise решения?
▫️куда перестраивается рынок?
▫️какой тренд показывает наш кейс ассистента Альфа-Банка с ROI 6 месяцев?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥3
AI-платформа для закрытого контура: агенты, данные, LLM — в одном стеке
Каждая AI-инициатива в enterprise вызывает одни и те же задачи: где взять модель, как её безопасно вызвать, подключить корпоративные данные и развернуть агента в продакшене. Новые AI-решения требует отдельной инфраструктуры и контроля качества, безопасности и бюджета. В результате запуск пилотов растягивается на несколько месяцев.
Для быстрой сборки агентов в закрытом контуре мы разработали решение — AI Platform. Это три платформы в одном стеке, которые работают самостоятельно и предоставляют API соседним слоям.
Агентская платформа. Обеспечивает быстрый деплой нового агента по коммиту из GitLab CI. Доступны мультиагентная оркестрация, точки подтверждения оператора, трассировка всей цепочки: промпты, инструменты, стоимость, латентность по каждому шагу.
Платформа данных. Превращает корпоративные документы в инструменты для агентов: классический RAG, графовый поиск для многосвязанных данных, табличный доступ через MCP без галлюцинирования чисел. При каждом запросе AI-агент видит только те данные, которые доступны конкретному пользователю.
LLM-платформа. Единый OpenAI-совместимый шлюз для on-premise моделей, российских облаков и внешних SOTA. Входит в реестр российского ПО и соответствует 152-ФЗ. Есть учёт расходов в реальном времени, разделение GPU-ресурсов между несколькими LLM на одной карте, наблюдаемость и аудит требований безопасности.
С помощью AI Platform компании быстро тестируют гипотезы и сокращают затраты: агенты разворачиваются на одной инфраструктуре, и маржинальная стоимость каждого снижается с новой итерацией.
Подробнее о том, как работает платформа, рассказали на сайте
Каждая AI-инициатива в enterprise вызывает одни и те же задачи: где взять модель, как её безопасно вызвать, подключить корпоративные данные и развернуть агента в продакшене. Новые AI-решения требует отдельной инфраструктуры и контроля качества, безопасности и бюджета. В результате запуск пилотов растягивается на несколько месяцев.
Для быстрой сборки агентов в закрытом контуре мы разработали решение — AI Platform. Это три платформы в одном стеке, которые работают самостоятельно и предоставляют API соседним слоям.
Агентская платформа. Обеспечивает быстрый деплой нового агента по коммиту из GitLab CI. Доступны мультиагентная оркестрация, точки подтверждения оператора, трассировка всей цепочки: промпты, инструменты, стоимость, латентность по каждому шагу.
Платформа данных. Превращает корпоративные документы в инструменты для агентов: классический RAG, графовый поиск для многосвязанных данных, табличный доступ через MCP без галлюцинирования чисел. При каждом запросе AI-агент видит только те данные, которые доступны конкретному пользователю.
LLM-платформа. Единый OpenAI-совместимый шлюз для on-premise моделей, российских облаков и внешних SOTA. Входит в реестр российского ПО и соответствует 152-ФЗ. Есть учёт расходов в реальном времени, разделение GPU-ресурсов между несколькими LLM на одной карте, наблюдаемость и аудит требований безопасности.
С помощью AI Platform компании быстро тестируют гипотезы и сокращают затраты: агенты разворачиваются на одной инфраструктуре, и маржинальная стоимость каждого снижается с новой итерацией.
Подробнее о том, как работает платформа, рассказали на сайте
🔥5❤3🏆3