Памяти у агента четыре – и каждая закрывает свою задачу
Под «памятью агента» обычно подразумевают одно – историю чата в контексте.
Добавили буфер сообщений – значит, «память подключена». Но так ли это?
На самом деле можно выделить как минимум четыре рабочих типа.
1. In-context: история и факты прямо в промпте. Быстро и точно, но упирается в лимит окна и теряет середину длинного диалога.
2. External: векторная база с поиском по запросу. Хранилище почти бесконечное, токены предсказуемы, но плохая выборка подсовывает шум и провоцирует галлюцинации.
3. Parametric: знания, зашитые в веса модели. Нулевая задержка и широкий кругозор, но факты устаревают после даты обучения.
4. Episodic: память, которая переживает сессии. По идентификатору пользователя из базы подтягиваются имя, предпочтения и прошлые решения пользователя.
Сверху – архитектуры под эти типы.
- Классический RAG: линейный конвейер для статичных корпусов вроде документации.
- Agentic RAG: агент сам решает, когда искать и как переформулировать запрос (ценой задержки и стоимости)
- GraphRAG: векторный поиск плюс граф связей между сущностями (когда ответ нужно собирать из разных источников).
Типичные "провалы" лечатся по-разному: in-context требует сжатия старых сообщений в сводку; RAG – гибридный поиск (dense + sparse) с re-ranker; агентные циклы – supervisor-узел с порогом уверенности.
Под каждую задачу – свой тип.
Одна «буферная память на всё» – самая частая причина того, что демо работает, а продакшн разваливается.
Под «памятью агента» обычно подразумевают одно – историю чата в контексте.
Добавили буфер сообщений – значит, «память подключена». Но так ли это?
На самом деле можно выделить как минимум четыре рабочих типа.
1. In-context: история и факты прямо в промпте. Быстро и точно, но упирается в лимит окна и теряет середину длинного диалога.
2. External: векторная база с поиском по запросу. Хранилище почти бесконечное, токены предсказуемы, но плохая выборка подсовывает шум и провоцирует галлюцинации.
3. Parametric: знания, зашитые в веса модели. Нулевая задержка и широкий кругозор, но факты устаревают после даты обучения.
4. Episodic: память, которая переживает сессии. По идентификатору пользователя из базы подтягиваются имя, предпочтения и прошлые решения пользователя.
Сверху – архитектуры под эти типы.
- Классический RAG: линейный конвейер для статичных корпусов вроде документации.
- Agentic RAG: агент сам решает, когда искать и как переформулировать запрос (ценой задержки и стоимости)
- GraphRAG: векторный поиск плюс граф связей между сущностями (когда ответ нужно собирать из разных источников).
Типичные "провалы" лечатся по-разному: in-context требует сжатия старых сообщений в сводку; RAG – гибридный поиск (dense + sparse) с re-ranker; агентные циклы – supervisor-узел с порогом уверенности.
Под каждую задачу – свой тип.
Одна «буферная память на всё» – самая частая причина того, что демо работает, а продакшн разваливается.
1👏10❤1
Весенний привет! ☀️
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•🛡 AI Security - самый свежий 🆕
•🏆 Соревновательный DS - проверенная классика
•🧠 LLM-курс - свой сервис с AI
• 🏄♀️ Vibe-кодинг - хайп
•🤖 ИИ-АГЕНТЫ и автоматизация с n8n - практикум по быстрой разработке систем с ИИ под капотом.
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•
•
•
• 🏄♀️ Vibe-кодинг - хайп
•
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍2🎉1
Обычно, когда ИИ-агенту нужно что-то найти на сайте, он тыкается по странице вслепую — грузит всё подряд, ошибается, повторяет. Дорого и медленно.
browse.sh от Browserbase даёт агенту готовые «навыки» под конкретные сайты — больше 200 штук, от маркетплейсов до GitHub. Агенту не нужно догадываться, как устроен сайт: ему сразу дают карту. Расход токенов падает в 50 раз.
Тренд понятный: агенты выходят из чата и начинают реально работать с вебом. И выигрывает тут не самая мощная модель, а тот инструмент, который делает рутину надёжно и дёшево.
Please open Telegram to view this post
VIEW IN TELEGRAM
Еще один бриллиант, который мы добавили в распродажу Степика, хотя запуск 11 июня, но бонусная цена доступна уже.
https://stepik.org/a/258985
Забирайте)
https://stepik.org/a/258985
Забирайте)
👍6👎2🗿2😁1🤔1
Привет, вайбкодеры! 🏁
Сегодня представляем🔥 итоговый проект одного из учеников наших курсов.
Игра на платформе itch.io : FRACTALITY - фрактальные крестики-нолики с боевыми котами, которые имеют уникальные суперспособности и в конце могут сделать друг другу ФРАКТАЛИТИ🥊
Звучит крышесносно🤯 , слово автору:
Мы поиграли и залипли на пару часов. Работает в браузере на компе и на мобилке.
✊ Поддержите автора звёздами на итче и полезным фидбэком!
Ссылка на игру, там же можно оставить комментарии: https://kukuruzo.itch.io/fractality
P. S.: Единственный минус itch.io не пускает без VPN.
Сегодня представляем
Игра на платформе itch.io : FRACTALITY - фрактальные крестики-нолики с боевыми котами, которые имеют уникальные суперспособности и в конце могут сделать друг другу ФРАКТАЛИТИ
Звучит крышесносно
Давно интересовался музыкой и играми в стиле mashup, ещё много играли с друзьями во фрактальные крестики-нолики (на 9 досок сразу) на бумаге.
Решил в качестве итогового проекта на курсе навайбкодить и добавить механики из мортал комбата.
Мне, сыну и друзьям зашло.
Использовал Клод код и кодекс для генерации ассетов и 11labs мсп для генерации звука и музыки.
Использовал игровой движок Godot.
Планирую развивать проект, добавить героев и другие режимы игры - буду рад любому фидбэку!
Мы поиграли и залипли на пару часов. Работает в браузере на компе и на мобилке.
Ссылка на игру, там же можно оставить комментарии: https://kukuruzo.itch.io/fractality
P. S.: Единственный минус itch.io не пускает без VPN.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AI Security | Безопасный ИИ
Привет, редтимеры! 🚩
В курсе открылся новый модуль с новым главным героем🔥
Внутри:
• рассмотрим непрямые промпт-инъекции (атакуем не из чата, а через документы)
• будем атаковать разных агентов
• потренируемся строить модель уязвимостей агентских систем (threat model)
• И конечно, пособираем флаги 🚩
По прежнему ждём от вас фидбэк.
P.S.: Один из уроков модуля немного задерживается.
В курсе открылся новый модуль с новым главным героем
Внутри:
• рассмотрим непрямые промпт-инъекции (атакуем не из чата, а через документы)
• будем атаковать разных агентов
• потренируемся строить модель уязвимостей агентских систем (threat model)
• И конечно, пособираем флаги 🚩
По прежнему ждём от вас фидбэк.
P.S.: Один из уроков модуля немного задерживается.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Если вы никак не можете решить какой дизайн сделать для своего дорвея сайта - можете вдохновиться здесь идеями дизайн-систем крупнейших онлайн компаний мира 👉 https://getdesign.md/
И конечно же скопировать их в одну команду в Claude Code 😁
И конечно же скопировать их в одну команду в Claude Code 😁
getdesign.md
getdesign.md — DESIGN.md collection for AI coding agents
Browse independent design system analyses from popular websites. Drop one into your project as design reference for your coding agent.
Напоминалка, что распродажа завтра заканчивается!!! 🏃♀️➡️
👍2
Forwarded from 🧑💻 Vibe-coding | AI практика 🤖
Весенний привет! ☀️
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•🛡 AI Security - самый свежий 🆕
•🏆 Соревновательный DS - проверенная классика
•🧠 LLM-курс - свой сервис с AI
• 🏄♀️ Vibe-кодинг - хайп
•🤖 ИИ-АГЕНТЫ и автоматизация с n8n - практикум по быстрой разработке систем с ИИ под капотом.
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•
•
•
• 🏄♀️ Vibe-кодинг - хайп
•
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 🏄 Соревновательный Data Science | Kaggle | Чемпионаты
Привет, Чемпионы! 🏆
🤖 AI Agent Security - Multi-Step Tool Attacks: Почувствуй себя хакером в мире LLM-агентов! 🎯
На Kaggle стартовало, пожалуй, самое долгожданное соревнование для специалистов по AI Safety и ИИ-безопасности. Организаторы не абы кто, а OpenAI, Google, IEEE и WCCI. Вместо привычного тюнинга бустингов или классификации картинок нам предлагают заняться алгоритмическим ред-тимингом и взломать умных ИИ-агентов, использующих внешние инструменты.
Это НЕ конкурс на написание единичных «джейлбрейков» вручную. Задача гораздо глубже: нужно написать автоматический алгоритм атаки, который заставит агента совершить цепочку деструктивных действий.
В чем суть задачи?
Современные агенты умеют читать файлы, лазить в интернет, отправлять email-ы и делать HTTP-запросы. Но что, если во входящем письме или на веб-странице спрятана инструкция, которая заставит агента прочитать secret.txt, вытащить оттуда SECRET_API_KEY и отправить его на сторонний сервер через http.post?
Ваш алгоритм (attack.py) будет помещен в Gym-style среду. Ему предстоит взаимодействовать с изолированным агентом (тестировать будут на GPT-OSS и Gemma 4), искать многошаговые уязвимости и выдавать воспроизводимые цепочки промптов, которые пробивают гардрайлы (guardrails).
🚀 Что здесь может сработать:
Reinforcement Learning (RL) и MCTS. Поиск цепочки атак - это, по сути, исследование графа состояний. Алгоритмы вроде Monte Carlo Tree Search (MCTS) или Q-learning могут помочь эффективно искать траектории, которые шаг за шагом сдвигают контекст агента в сторону опасного действия.
Пакетные итеративные промпты (Prompt Injection Frameworks). Агенты «ломаются» на стыке контекстов. Использование техник Indirect Prompt Injection (когда вредоносный текст подсовывается через web.search или mail_seed.json) - ключ к успеху. Нужно заставить агента самого прочитать ваш скрытый промпт при выполнении легитимной задачи.
Анализ трейсов (Trace Analysis). Среда возвращает логи вызовов инструментов. Напишите парсер логов (отслеживайте fs.read, email.read), чтобы ваш алгоритм атаки динамически адаптировался: если агент прочитал нужный файл, следующий шаг атаки должен подтолкнуть его к вызову http.post.
Генерация состязательных суффиксов (Adversarial Optimization). Атаки на основе градиентов или генетических алгоритмов для подбора таких токенов, которые максимизируют вероятность вызова агентом запрещенной функции, несмотря на системные промпты защиты.
📅 Дедлайн:
Прием решений открыт до конца августа 2026 года. Призовой фонд: $50,000, но Solo Gold и статус главного кошмара для ИИ-безопасности OpenAI стоят гораздо дороже!
🔗 Ссылка на соревнование:
https://www.kaggle.com/competitions/ai-agent-security-multi-step-tool-attacks
Для кого эта тема в новинку, предлагаем быстро погрузиться на нашем практическом курсе по AI Security 🚩. (промокод в комментах)
Кто готов заняться легальным хакингом фронтирных моделей? Обсуждаем векторы атак в комментариях! 👇
🤖 AI Agent Security - Multi-Step Tool Attacks: Почувствуй себя хакером в мире LLM-агентов! 🎯
На Kaggle стартовало, пожалуй, самое долгожданное соревнование для специалистов по AI Safety и ИИ-безопасности. Организаторы не абы кто, а OpenAI, Google, IEEE и WCCI. Вместо привычного тюнинга бустингов или классификации картинок нам предлагают заняться алгоритмическим ред-тимингом и взломать умных ИИ-агентов, использующих внешние инструменты.
Это НЕ конкурс на написание единичных «джейлбрейков» вручную. Задача гораздо глубже: нужно написать автоматический алгоритм атаки, который заставит агента совершить цепочку деструктивных действий.
В чем суть задачи?
Современные агенты умеют читать файлы, лазить в интернет, отправлять email-ы и делать HTTP-запросы. Но что, если во входящем письме или на веб-странице спрятана инструкция, которая заставит агента прочитать secret.txt, вытащить оттуда SECRET_API_KEY и отправить его на сторонний сервер через http.post?
Ваш алгоритм (attack.py) будет помещен в Gym-style среду. Ему предстоит взаимодействовать с изолированным агентом (тестировать будут на GPT-OSS и Gemma 4), искать многошаговые уязвимости и выдавать воспроизводимые цепочки промптов, которые пробивают гардрайлы (guardrails).
🚀 Что здесь может сработать:
Reinforcement Learning (RL) и MCTS. Поиск цепочки атак - это, по сути, исследование графа состояний. Алгоритмы вроде Monte Carlo Tree Search (MCTS) или Q-learning могут помочь эффективно искать траектории, которые шаг за шагом сдвигают контекст агента в сторону опасного действия.
Пакетные итеративные промпты (Prompt Injection Frameworks). Агенты «ломаются» на стыке контекстов. Использование техник Indirect Prompt Injection (когда вредоносный текст подсовывается через web.search или mail_seed.json) - ключ к успеху. Нужно заставить агента самого прочитать ваш скрытый промпт при выполнении легитимной задачи.
Анализ трейсов (Trace Analysis). Среда возвращает логи вызовов инструментов. Напишите парсер логов (отслеживайте fs.read, email.read), чтобы ваш алгоритм атаки динамически адаптировался: если агент прочитал нужный файл, следующий шаг атаки должен подтолкнуть его к вызову http.post.
Генерация состязательных суффиксов (Adversarial Optimization). Атаки на основе градиентов или генетических алгоритмов для подбора таких токенов, которые максимизируют вероятность вызова агентом запрещенной функции, несмотря на системные промпты защиты.
📅 Дедлайн:
Прием решений открыт до конца августа 2026 года. Призовой фонд: $50,000, но Solo Gold и статус главного кошмара для ИИ-безопасности OpenAI стоят гораздо дороже!
🔗 Ссылка на соревнование:
https://www.kaggle.com/competitions/ai-agent-security-multi-step-tool-attacks
Для кого эта тема в новинку, предлагаем быстро погрузиться на нашем практическом курсе по AI Security 🚩. (промокод в комментах)
Кто готов заняться легальным хакингом фронтирных моделей? Обсуждаем векторы атак в комментариях! 👇
❤3👍2 1
🏆 КОНКУРС: дойди до сертификата и забери мерч (+ призы)
Чемпионы, у нас тут движ до конца июня 🔥
Вы уже начали Claude Code для непрограммистов? Так вот, самое время дойти до конца. Тех, кто финиширует, ждёт подгон.
Что надо сделать:
1. Закончить курс на Stepik до сертификата (да-да, того самого, с отличием 🎓)
2. Оставить честный отзыв о курсе
3. Написать нам в личку @Aleron_df, что готово ✅
Что разыграем среди финишёров:
🎁 фирменный мерч школы
💸 скидку 40% на любой наш курс
🧠 личную консультацию 30 минут
И это ещё не всё. Все, кто дойдёт до сертификата, получат доступ на закрытое мероприятие — оно пройдёт в июле/августе. Туда с улицы не попасть 😏
⏳ Дедлайн — 30 июня. Дальше карета превращается в тыкву.
Если только планируете начать, то смело приступайте к прохождению, вы еще успеваете 👉 Claude Code для НЕпрограммистов
Чемпионы, у нас тут движ до конца июня 🔥
Вы уже начали Claude Code для непрограммистов? Так вот, самое время дойти до конца. Тех, кто финиширует, ждёт подгон.
Что надо сделать:
1. Закончить курс на Stepik до сертификата (да-да, того самого, с отличием 🎓)
2. Оставить честный отзыв о курсе
3. Написать нам в личку @Aleron_df, что готово ✅
Что разыграем среди финишёров:
🎁 фирменный мерч школы
💸 скидку 40% на любой наш курс
🧠 личную консультацию 30 минут
И это ещё не всё. Все, кто дойдёт до сертификата, получат доступ на закрытое мероприятие — оно пройдёт в июле/августе. Туда с улицы не попасть 😏
⏳ Дедлайн — 30 июня. Дальше карета превращается в тыкву.
Если только планируете начать, то смело приступайте к прохождению, вы еще успеваете 👉 Claude Code для НЕпрограммистов
❤1 1