Внутри AI | Кейсы ИИ Агентов в бизнесе
3.81K subscribers
36 photos
1 video
3 files
92 links
Внедрение AI в компании от анализа до запуска - https://kts.tech/ai.

AI Агенты и их применение в бизнесе
Обзоры, кейсы, практика
Download Telegram
Три инструмента, которые дают актуальную документацию — и чем они отличаются.

Andrew Ng выпустил Context Hub — open-source CLI, который подтягивает актуальную API-документацию прямо в контекст кодинг-агента. Проблема знакомая: LLM уверенно пишет код под устаревший API, потому что его training data отстаёт на месяцы. Агент не знает, что endpoint переименовали или параметр убрали — и генерирует код, который компилируется, но падает в проде.

Инструменты для решения этой проблемы уже существуют. Я пользовался двумя из них: Context7 и DeepWiki. И у каждого свой подход.

▫️Context7 MCP-сервер от Upstash. 73 000+ библиотек, автоматическая индексация документации. Подключается к Cursor, Claude и другим AI-редакторам. Агент вызывает два инструмента: resolve-library-id и query-docs — и получает version-specific документацию с code snippets. Плюс — огромное покрытие. Минус — документация иногда устаревает, а механизма обратной связи нет.

▫️DeepWiki AI-генерация документации по любому GitHub-репозиторию. Не индексирует готовые доки, а анализирует исходный код и создаёт wiki на лету. Полезен, когда нужно быстро разобраться в чужом репозитории: архитектура, зависимости, ключевые модули. Но это не замена API-документации — скорее инструмент для понимания кодовой базы.

Чем же отличается Context Hub?

Context Hub от Andrew Ng — CLI-утилита chub. Курированная, версионированная документация в markdown. Покрытие скромнее (~100+ пакетов), зато две уникальные фичи. Первая — annotations: агент может оставить заметку (например, «для Stripe webhooks нужен raw body, а не parsed JSON»), и эта заметка автоматически подтянется при следующем запросе. Агент накапливает знания между сессиями. Вторая — feedback: голосование за качество документации, которое улучшает доки для всего сообщества.

Context7 берёт широтой покрытия, DeepWiki — глубиной понимания кода, Context Hub — точностью и обучаемостью агента. В комментариях под постом Ng десятки людей спрашивают «чем это отличается от Context7?» — и ответ именно в annotation layer. Это попытка дать агентам persistent memory: не просто актуальные доки, а доки с накопленным опытом использования.

На практике эти инструменты не конкурируют, а дополняют друг друга. Context7 для широкого покрытия, DeepWiki для незнакомых репозиториев, Context Hub может выиграть там, где важна точность — annotations накапливают найденные edge cases и workarounds прямо в доках, и агент не наступает на те же грабли дважды.

#александр_опрышко
7🔥5👍3
Два подхода к разработке голосового AI: LLM-агент vs конечный автомат

В проектах с голосовыми AI-ассистентами мы в KTS чаще всего используем два подхода к управлению диалогом: LLM-агенты и конечные автоматы с отдельными компонентами. Выбор архитектуры влияет на гибкость диалога и уровень контроля системы.

LLM-агент.
С помощью realtime API мы встраиваем ассистента в голосового робота. LLM-агент управляет диалогом, адаптируется под контекст и принимает решения в зависимости от ситуации. Взаимодействие получается естественным и живым, без жёстких скриптов и шаблонных ответов. Но поведение модели не всегда предсказуемо, и у нас меньше возможностей для контроля.

Конечный автомат с отдельными компонентами.
Этот подход был единственно возможным до появления LLM. В нём мы разбиваем процесс взаимодействия голосового робота и пользователя на стадии:

— расшифровка аудио в текст;
— принятие решения на основе текущей фазы диалога;
— обновление состояния в конечном автомате или своей системе хранения контекста;
— генерация текста и преобразование обратно в речь.

Каждый шаг контролируется отдельно. Диалог детерминирован — мы точно знаем, как ассистент поведёт себя в каждой ситуации.

Как мы выбираем подход в проектах:

LLM-агент подходит для задач, где важна гибкость и естественное общение — консультации, сложные запросы, неструктурированные разговоры.

Конечный автомат — надёжное решение для строго регламентированных процессов: банковские операции, медицинские протоколы, юридические вопросы.

#александр_опрышко
🔥8
Ускоряем запуск специализированных AI-агентов: от идеи до production за месяц

Рынок ИИ переходит к гиперперсонализации и внедрению узкопрофильных AI-ассистентов для конкретных ролей: HR, поддержки, продаж, управления. Обычно разработка кастомного решения занимает несколько месяцев, требует значительных расходов и сложно масштабируется.

Мы нашли способ упростить и ускорить внедрение — разработали платформу автоматизации, которая построена на мультиагентной архитектуре и RAG-технологии. Она позволяет быстрее запускать специализированных AI-ассистентов в единой инфраструктуре.

Как работает система автоматизации:

◾️ AI-ассистент индексирует вашу базу знаний — PDF, таблицы, инструкции, схемы — и отвечает на вопросы пользователей в мультимодальном режиме со ссылками на источники. Данные обновляются автоматически без остановки системы.

◾️ Подключается к корпоративным сервисам: CRM, ERP, тикет-системами и базами данных. Ассистент видит историю клиента, статус заказа, остатки на складе и использует актуальные данные.

◾️ Ассистент встраивается в привычные каналы коммуникации: виджет на сайте, Telegram, мобильное приложение. Единая база знаний и логика ответов работают на всех площадках.

◾️ AI получает оценки ответов от пользователей, учитывает обратную связь и автоматически корректирует сценарий и поведение.

◾️ Платформа интегрируется с SSO-системами для авторизации пользователей. Диалоги проходят аудит, доступно маскирование персональных данных и разграничение прав доступа.

Система разворачивается в облаке, по гибридной схеме или полностью on-premise и позволяет обрабатывать данные в соответствии с 152-ФЗ.

Предлагаем начать с демо на ваших данных с дальнейшим переходом в пилот, проверить гипотезу на реальных пользователях и масштабировать решение по мере роста задач.

Запишитесь на демо — покажем, как AI-агент работает в ваших бизнес-процессах.
🔥7👍43
От умного справочника к агентам действия: как меняются требования к AI-инструментам

AI-ассистент обучается по базе данных, действует по заданному сценарию и коммуницирует с пользователем — например, подбирает товары или отвечает на вопросы. Такой формат взаимодействия уже стал привычным, его часто используют, чтобы автоматизировать рутину и обеспечить поддержку 24/7.

Но сегодня этого недостаточно — рынок переходит от ассистентов к агентам действия. Они работают в корпоративных системах, планируют шаги и принимают решения без постоянного участия человека.

При проектировании платформы AI Assistant мы изначально планировали работу наших агентов в формате действий, которые позволяют максимально автоматизировать ответ на запрос клиента — от фиксации заявки в системе до анализа конверсионных диалогов.

Чтобы реализовать подобные сценарии, мы настраиваем мультиагентную архитектуру и интеграцию с системами заказчика. При этом работа с RAG никуда не уходит — он остаётся памятью решения.

В текущих реализациях возможен перевод клиента с ассистента на живого человека. Доступен детальный анализ статистики общения AI-агентов для проверки качества и полноты ответов.

Иван Лавров, Head of AI KTS

«LLM и технологии, на которых построена платформа автоматизации KTS, постоянно улучшаются. Мы прогнозируем, что роль операторов постепенно будет снижаться и усилится автономность — за качеством выполнения заданий одних AI-агентов будут следить другие. Это позволит улучшить их работу за счёт обновления сценариев, интегрируемых систем и подгружаемых данных.

Когда настанет этот момент — вопрос открытый. И обычные ассистенты, и агенты действия требуют актуальной информации в источниках данных, правило GIGO никуда не ушло. Теперь тем, кто планирует выстраивать гибридную работу люди + роботы, нужно задуматься над подходами к формированию базы знаний и обеспечением качества данных»


Сейчас мы чаще внедряем агентов действия в процессы, где можно быстро посчитать экономический эффект и вернуть вложенные средства. Это решения для поддержки продаж, которые увеличивают конверсию и количество лидов, и ассистенты для высокочастотных сценариев — они помогают сократить затраты на ФОТ. Постепенно единичные автоматизации процессов будут объединяться в общую систему для интеграции в сложные сценарии работы.
🔥85👍3
KTS на GoCloud 2026: поговорим про AI и облака

9 апреля в Москве пройдёт конференция GoCloud от Cloud.ru. В этом году ключевая тема — простые и безопасные инструменты для работы с AI, которые можно использовать уже сейчас.

Что ждёт участников:
■ 4 трека про AI, Data, инструменты разработки и облачную
инфраструктуру
■ 50+ спикеров из ведущих российских компаний
■ 15+ демозон с live-демонстрациями облачных и AI-сервисов, партнёрских продуктов и нетворкинг с экспертами
■ 7 воркшопов под руководством экспертов

Александр Опрышко, управляющий партнёр и системный архитектор KTS, примет участие в круглом столе на тему «DevOps-инструменты в облаке». Вместе с коллегами он обсудит, как AI помогает в этом направлении, и поделится опытом организации процесса.

Конференция проходит в двух форматах: офлайн и онлайн-трансляция на сайте.

Когда: 9 апреля, 10:00
Где: кинотеатр «КАРО 11 Октябрь», ул. Новый Арбат, д. 24

Для участия нужно зарегистрироваться. До встречи на GoCloud 2026!
🔥5👍3
RAG без облака: как запустить LLM для FinTech и уложить inference в одну H100

В KTS обратился крупный клиент из FinTech с запросом на корпоративную базу знаний.

Сначала мы собрали демоверсию на собственной облачной инфраструктуре. По качеству она устраивала клиента и показывала нужный результат. Но облачные AI-инструменты для FinTech часто не подходят из-за высоких требований к безопасности данных.

В таких проектах обычно используют open source LLM. У этого подхода есть две проблемы: качество таких моделей часто ниже, чем у облачных, а inference обходится дорого.

Мы рассчитали инфраструктуру для решения. Оценили стоимость видеокарт, которые понадобятся для запуска модели, и возможный экономический эффект. На старте экономика выглядела неочевидной — стоимость видеокарт могла съесть значительную часть потенциальной выгоды.

Поэтому мы начали экспериментировать с демоверсией продукта и искать способ повысить качество и снизить стоимость inference. В итоге решение удалось запустить полностью на одной карте H100 с требуемым качеством (более 94% корректных ответов на базе знаний).

В результате задача, которая изначально выглядела слишком дорогой для on-premise инфраструктуры, стала экономически оправданной.

Для FinTech и других регулируемых отраслей это важный кейс. Облачные AI-сервисы часто недоступны из-за требований к данным, а стоимость локальной инфраструктуры останавливает такие проекты ещё на старте.

#александр_опрышко
11👍5🔥2
Стоит ли бизнесу маскировать AI-ассистента под человека?

На демо AI-ассистента для крупной сети фитнес-центров нам задали ожидаемый вопрос: должен ли робот мимикрировать под человека? Ведь посетители сайта легко могут определить, что перед ними ИИ. Моя точка зрения: нет никакого смысла скрывать виртуальную сущность ассистентов.

Объясню, почему:

1. В попытке «очеловечивания» робот отходит от своей агентской задачи, что иногда приводит к фейлам. ИИ-ассистент австралийской сети Woolworths рассказывал клиентам про свою маму и дядю, убеждая в своей «кожаности», пока компания не отключила эти скрипты после волны возмущения. Есть и данные: по исследованию Nielsen Norman Group, добавление «человеческой теплоты» снижает точность ответов ИИ на 10—30%.

2. Решение вопросов через ИИ может вызвать даже бОльшее доверие со стороны людей. На моём опыте компании с действительно топовой коммуникацией редкость. У части компаний сервис заложен в ценностях, но это исключения. В остальных случаях робот выполняет работу/дает ответы быстрее и точнее, чем человек, а это именно то, что мы ожидаем от профессионального сервиса. Порог качества, ожидаемого от людей, тоже вырастет: зачем средний сервис от человека, если можно получить такой же или лучше от робота? В конечном счёте это хорошо для клиента.

3. Человеку проще спросить у робота, чем у другого человека, в чувствительных, а может и где-то постыдных вопросах. Перед роботом не нужно оправдываться за «глупый» вопрос, не страшно переспрашивать.

4. В какой-то момент раскрытие ИИ при предоставлении сервиса станет законодательно обязательным и в РФ. В ЕС это уже закон — с августа 2026 AI Act обязывает сообщать пользователю, что он общается с ИИ. Россия обычно перенимает регуляторные тренды с лагом в пару лет — лучше быть готовым заранее, чем перестраиваться потом.

Но есть важный момент!

Не прятать робота за человеком — не значит убирать людей из процесса. Наоборот, стоит подчеркивать их роль: кто разрабатывает, обучает, анализирует работу ИИ-системы. Доверие клиента строится не на иллюзии, что с ним говорит человек, а на понимании, что за роботом стоит команда, которая его обучила на специфике конкретного бизнеса.

Отдельная тема — гибридные схемы. Где люди проверяют и улучшают работу ИИ-агентов. В каких ситуациях необходимо подключение живого специалиста. Совместная работа, где ИИ подсказывает решения, но ответственность и коммуникация остается за человеком. Это не костыль на переходный период, а живая целевая модель.

Что мы ответили фитнес-сети? Сейчас нет необходимости притворяться, что это не виртуальный помощник. Их посетителю не нужен фальшивый друг на ресепшен. Ему нужен тот, кто за минуту ответит на все вопросы, подберет клуб с подходящим расположением и расписанием и поможет оформить абонемент, что напрямую влияет на бизнес-метрики.

#иван_лавров
🔥10👍4
Как я использую Claude в менеджерских задачах

Чтобы AI выдавал хороший результат, он должен знать всё, что знаешь ты. Не «напиши правильный промпт» — а дай весь контекст.

Для этого нужно создать базу знаний и регулярно загружать в неё данные. Сделать это задним числом — сложно и муторно. Намного проще «скормить» предыдущие заметки, начать вести базу знаний в понятном для Claude формате и регулярно к нему обращаться.

С чего я начал в январе:
▫️ создал git-репу, описал себя и свои цели за 3 года
▫️ подключил календари, почту и ремайндеры через MCP
▫️ написал скилл для старта дня: Claude скачивает повестку на сегодня/завтра и ведёт архив
▫️ разложил артефакты по проектам

Через 3 месяца:
▫️ goals/ — цели и стратегия
▫️ projects/ — все проекты с артефактами и контекстом
▫️ meets/ — записи и саммари встреч
▫️ memory/ — персональная память Claude, которой я управляю вручную
▫️ schedule/ — расписание, синхронизированное с календарём
▫️ todolist/ — задачи из Apple Reminders
▫️ tgposts/ — автоматизация контента для Telegram-канала
▫️ main_mcp.py — единая точка входа для собственных автоматизаций: код автоматизаций лежит рядом с базой знаний, база знаний в формате Markdown

Обычный иерархический текст превратился в динамическую базу знаний, которая кумулятивно увеличивает свою ценность. При этом управление контекстом я не отдаю на откуп AI. Модель не определяет самостоятельно, что важно — я вручную управляю необходимой информацией.

Ещё один инсайт: многие процессы можно автоматизировать через человекопонятные алгоритмы на базе скиллов Claude Code. Пишешь по шагам, что нужно сделать — и получаешь не просто детерминированную автоматизацию, а процессы с интеллектом внутри: декомпозиция смет, саммари встреч и собеседований, анализ новостей из Twitter, разбор стартапов из YC.

С удивлением обнаружил, что лидеры индустрии приходят к похожему. Karpathy на этой неделе описал концепцию LLM Wiki: складываешь сырые источники в папку, LLM компилирует из них wiki с бэклинками и категоризацией. Его главная мысль — память AI должна быть явной (видишь, что он знает и не знает), в файлах (не привязана к провайдеру) и интероперабельной (любая модель работает с теми же файлами).

#александр_опрышко #ai #claude_code
👍21🔥12👌1
Александр Опрышко, один из основателей KTS, прямо сейчас на круглом столе конференции GoCloud 2026.

Обсуждаем проблемы при развертывании CI/CD-пайплайна, ограничения облачных и on-premise решений и где оправдан гибрид. А также делимся, как AI помогает в этом направлении на примере своих кейсов.

Прямая трансляция конференции по ссылке.
🔥145👍3
Продолжаем развивать Agent Platform. Ниже — ключевые изменения за последний месяц.

▫️Повысили планку доступности и надежности системы.

▫️Добавили прозрачный мониторинг. Теперь по каждой модели пользователям доступны метрики времени отклика и доступности.

▫️Детализировали траты токенов и списания в личном кабинете. Появилась разбивка по периодам и возможность выгрузки данных. Упрощает контроль затрат и подготовку отчетности.

▫️Улучшили работу с графическими моделями OpenAI, включая GPT Image и DALL·E.

▫️Запустили партнерскую программу в бета режиме. Если вы работаете с AI-проектами или ведете блог на AI-тематику, напишите нам на почту agentplatform@kts.tech, мы открыты к сотрудничеству
🔥10
6 сценариев внедрения ИИ в девелопмент

Собрали решения, которые можно быстро встроить в работу и получить измеримый результат: снизить количество ошибок, увеличить производительность команд и оптимизировать расходы.

▪️AI-ассистент менеджера по продажам
Чат-бот подключается к привычным каналам: CRM, сайту, Telegram. Помогает найти ответы на вопросы клиентов и даёт подсказки по документам.

▪️Консультант по недвижимости
Обрабатывает запросы на естественном языке, точнее выявляет потребности и подбирает персональные объекты. Может работать как плагин на сайте, в мессенджере или личном кабинете.

▪️Голосовой помощник для колл-центра или шоурума
Работает как дополнение к телефонии или робот-консультант. Воспринимает вопросы клиентов, отвечает по базе знаний и формирует персонализированные подборки решений.

▪️Анализ диалогов операторов колл-центра
Выявляет ошибки и отклонения от сценариев, классифицирует причины отказа и помогает оценить качество работы сотрудников. ИИ-ассистент может анализировать диалоги как в реальном времени, так и в ретроспективе.

▪️ИИ-помощник для управляющей компании
Чат-бот или голосовой робот отвечает на частые вопросы жителей, фиксирует обращения и снижает нагрузку на операторов.

▪️Компьютерное зрение на стройке
Программно-аппаратный комплекс, веб- и мобильное приложение для мониторинга целевых событий. Фиксирует передвижение техники и персонала, контролирует опасные зоны и выявляет простои.

Подробнее о том, какие AI-решения можно внедрить в девелопмент уже сейчас, смотрите в презентации коммерческого директора KTS Александра Баталова.
👍65🤝2🔥1
Managed Agents от Anthropic: зачем агентам своя операционная система

Anthropic опубликовал инженерный разбор Managed Agents — своего сервиса для запуска агентов. Это интересное объяснение того, как стоит проектировать инфраструктуру агентов в 2026.

Проблема. Агент — это не один вызов LLM, а длинный цикл: модель думает → вызывает инструмент → получает результат → думает дальше. Если жёстко зашить этот цикл под текущее поколение моделей, через полгода придётся переписывать инфраструктуру. Авторы формулируют это одной фразой, которую уже растащили на цитаты: «Harnesses encode assumptions that go stale as models improve».

Идея. Решение не новое — так операционные системы в своё время справились с «программами, которых ещё не существует». Они не пытались угадать будущие приложения, а виртуализировали железо в стабильные абстракции: процесс, файл, сокет. Приложения менялись, абстракции оставались.

Anthropic применяет этот приём к агентам — раскладывает их на три независимые сущности:

▪️Session — append-only лог всего, что произошло. Живёт отдельно от модели и её контекстного окна. Это «память» агента, к которой можно обращаться произвольно.
▪️Harness — цикл, который крутит модель и маршрутизирует tool calls. Stateless, одноразовый, заменяемый.
▪️Sandbox — среда, где исполняются инструменты. Тоже одноразовая: упала — подняли новую.

Подробный разбор можно прочитать по ссылке.

#александр_опрышко
🔥6👍1
Мой MCP-стек для Claude Code

Сам по себе Claude Code — просто CLI. Реальную пользу ему даёт обвязка из MCP-серверов: они подключают агента к твоим данным и workflow.

Делюсь стеком, который использую ежедневно. Разбил его на три контура:

▫️ Автоматизация рутины (менеджерская часть)
workbook — самописный MCP, который постепенно наращиваю под свои задачи. Сейчас в нём: работа с Твиттером, Контур.Толк, календарём, почтой, to-do list.

yandex-tracker — управляю загрузкой, создаю задачи на основе транскрибации.

excel-mcp-server и mcp-google-sheets — читаю локальные xlsx и Google Sheets. Удобно для работы со сметами.

▫️ Исследования
arXiv — для поиска и чтения свежих статей, чтобы понимать, как устроены SoTA-подходы.

reddit-mcp-buddy — быстро снять пульс сообщества: что обсуждают, какие инструменты хвалят, на что жалуются. Хороший сигнал для продуктовых решений.

playwright/computer-use — когда WebSearch и WebFetch не справляются (авторизация, JS-рендеринг, закрытый контент) или нужна автоматизация без API.

▫️ Программирование
context7, deepwiki — инструменты, которые дают актуальную документацию для агента. Подробно рассказывал об этом в посте.

everything-claude-code (affaan-m) — готовый набор из 47 агентов, 181 скилла и 79 команд: code-review, TDD, planner, build-fix, мультиагентная оркестрация. Беру как стартер и выкидываю лишнее.

spec-kit от GitHub — тулкит для spec-driven development. Вместо вайб-кодинга выстраивает пайплайн: constitution → specify → clarify → plan → tasks → implement → verify. Спеки становятся исполняемыми артефактами, агент работает с чёткими входами вместо расплывчатых промптов.

#александр_опрышко
🔥13👍71
AI — только для enterprise. Доказываем, что это не так

Средний и малый бизнес отказывается от внедрения AI, потому что считает его дорогим инструментом для крупных корпораций с миллионными бюджетами.

На самом деле ИИ-решения подходят любому бизнесу, в котором есть повторяющиеся процессы.

В новой статье разбираем:
▫️ почему проекты остаются на уровне вечного пилота
▫️ процессы, которые стоит автоматизировать в первую очередь
▫️ какие метрики использовать, чтобы оценить результат
▫️ как платформенный подход меняет экономику AI-проектов
▫️ сроки и этапы запуска кастомного решения

Статья будет интересна малому и среднему бизнесу, который думает о внедрении AI, но не знает, с чего начать. Заходите в блог, чтобы узнать, как за 1-2 месяца сделать AI прикладным инструментом с измеримым эффектом.
🔥8👏2
Этика AI в продаже недвижимости: можно ли прослушивать разговоры с клиентами?

Застройщики часто приходят к нам с запросом записывать встречи и прогонять их через LLM: хочется контролировать качество консультаций, собирать все возражения и автоматизировать работу с ними.

Технологически это несложно, но на практике подход может сыграть против девелопера.

При покупке квартиры люди обсуждают с агентом чувствительные темы: финансовые возможности, семейные обстоятельства, размер первоначального взноса. Если человек понимает, что разговор записывается и анализируется AI, доверие рушится. Прослушка и контроль со стороны искусственного интеллекта пугают клиентов, поэтому сделка может сорваться.

Эффективнее внедрить AI-ассистента для продавцов. Он помогает со сложными вопросами в реальном времени: за секунды находит информацию в базе знаний и формулирует точный ответ. Это сохраняет динамику сделки, показывает экспертность и не нарушает приватность клиента.
5🔥4👍2
Поговорим, как AI влияет на OKR: от горизонтов планирования до управленческого мышления

12 мая в 11:30 приглашаем на подкаст с Иваном Лавровым, Head of AI в KTS и основателем OKRsana — платформы для управления OKR с интегрированными AI-агентами.

В прямом эфире обсудим:
— каковы актуальные горизонты планирования
— помогает ли AI формулировать более сильные цели или, наоборот, упрощает мышление
— можно ли уйти от таблиц в OKR и не потерять управляемость
— какие инструменты реально работают, а какие остаются модными практиками

Регистрируйтесь по ссылке, приходите за инсайтами и задавайте вопросы — обещаем, будет интересно!
🔥84
Знаем, как найти лишние расходы на инфраструктуру и сократить их без риска ↗️
Please open Telegram to view this post
VIEW IN TELEGRAM
Вы всё ещё переплачиваете за инфраструктуру? Тогда мы идём к вам.

Расходы на облако часто растут незаметно. Тестовые среды работают ночью и в выходные. Неиспользуемые ресурсы продолжают списывать деньги. У команд нет общего правила, кто следит за потреблением и где проходит граница между «нужно» и «просто осталось включенным».

В итоге счета растут, а ясности, за что платит бизнес, становится меньше.

Мы поможем найти, где инфраструктура расходует лишнее, и сократить затраты без риска для продукта и команды.

Что делаем:

— проводим аудит расходов на облако;
— оптимизируем инфраструктуру;
— настраиваем мониторинг потребления и уведомления;
— выделяем центры затрат;
— прогнозируем бюджет;
— считаем TCO и ROI.

Если есть ощущение, что можно сэкономить на инфраструктуре, начните с бесплатного аудита. За 5 рабочих дней покажем, где вы теряете деньги. Сначала доведем до результата и только потом возьмем оплату. Гонорар KTS = подтвержденная экономия за 6 месяцев.
🔥4👍3👌2
RAG-платформа для 12 000 операторов Альфа-Банка: ускорили поиск данных в 20 раз

Раньше операторы контакт-центра вручную искали информацию в базе знаний, чтобы ответить клиенту. На обработку одного запроса в среднем уходило 5 минут.

Чтобы ускорить работу операторов, Альфа-Банк решил внедрить RAG-платформу. За помощью обратились к команде KTS.

За 4 месяца мы вместе вывели проект в production и настроили систему так, чтобы данные всегда были актуальны, и каждый оператор получал ответ с учётом его уровня доступа.

Платформу развернули внутри контура банка и запустили на двух GPU H100. Это позволило уложиться в экономику проекта и при этом обеспечить запас по производительности.

В результате RAG-платформа ускорила и упростила работу операторов:

▪️ среднее время обработки запроса уменьшилось на 40 секунд: с 5 минут до 4 минут 20 секунд
▪️ поиск данных стал в 20 раз быстрее: 3 секунды вместо 60

93% операторов положительно оценили работу платформы, и решение масштабировали на всех сотрудников Альфа-Банка. Сегодня система обрабатывает 85 000 запросов в сутки.

Больше деталей про настройку и работу RAG-системы показали в кейсе
🔥16👍8
ИИ застрял в «одиночном режиме»

За неделю несколько ведущих ресерчеров независимо высказались об одном: следующий рубеж развития ИИ — не интеллект, а интерактивность. Не «насколько умна модель», а «насколько хорошо она работает вместе с человеком».

В чём проблема: сегодня модели воспринимают реальность одним потоком. Пока не дописали запрос — LLM ждёт и не видит, что вы делаете. Это узкий канал: до модели доходит лишь часть вашего знания, намерения и оценки.

Thinking Machines сравнивает текущий формат взаимодействия с попыткой решить важный спор по почте вместо личной встречи. Они вводят новую концепцию — interaction models. Ключевая идея: интерактивность не «обвязка» вокруг модели, а часть самой архитектуры. Сегодня системы имитируют перебивания и многоканальность через harness (внешнюю «обвязку» — готовые компоненты, склеенные вокруг модели) и VAD (voice activity detection — отдельный модуль, который определяет, говорит человек или молчит) для распознавания границ реплик.

Аргумент от Bitter Lesson: рукотворные надстройки проиграют общим масштабируемым методам. Если интерактивность встроена в модель — масштабирование одновременно делает её умнее и улучшает качество взаимодействия с человеком.

Гонка за «интеллектом» упёрлась в то, как этот интеллект передать человеку и принять обратно правки.

#александр_опрышко #развитие_ИИ
🔥7👍4👏31