Девчонки, поймите уже!
Вашего будущего мужа нет в Tinder. Он сейчас в
Claude и выжимает максимум из токенов
Вашего будущего мужа нет в Tinder. Он сейчас в
Claude и выжимает максимум из токенов
😁15 4❤2🤪2
Так выглядит удачный найм талантов.
Andrej Karpathy в Anthropic🫶
Это один из самых лучших умов современности AI индустрии.
В провайдерах моделей собрались звёзды🤩
Максимальная концентрация талантов. Следим, что выйдет!
Andrej Karpathy в Anthropic
Это один из самых лучших умов современности AI индустрии.
В провайдерах моделей собрались звёзды
Максимальная концентрация талантов. Следим, что выйдет!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12 7❤1🦄1
Чем чаще агент спрашивает разрешения, тем хуже он защищён
Знакомая механика: агент дёргает на каждом шаге – «разрешить запуск», «разрешить запись», «разрешить сеть». Через десяток окон палец сам жмёт «да». Голова уже не успевает разобрать, на что именно соглашается.
Получается обратный эффект: чем больше подтверждений, тем легче пропустить вредную команду. Особенно если её подсунули через prompt injection – строчку, которую агент прочитал в чужом коде или в issue.
Anthropic в своем блоге описывает иной подход – ограничивать не пользователя, а самого агента. Claude Code теперь может работать внутри песочницы с двумя границами: по файлам и по сети. По файлам – доступ только к нужным папкам. По сети – только к разрешённым адресам.
Одной границы мало. Если закрыть только файлы – из песочницы утащат SSH-ключи. Если закрыть только сеть – агент полезет за пределы проекта.
Под капотом лежат привычные системные средства: на Linux – bubblewrap, на macOS – seatbelt. Оба собраны в открытый Sandboxed Bash Tool. Для облачной работы есть Claude Code on the Web. Между агентом и репозиторием стоит отдельный git-прокси – токены и ключи не попадают в ту среду, где крутится модель.
Внутри Anthropic такая схема сняла 84% запросов на одобрение.
Знакомая механика: агент дёргает на каждом шаге – «разрешить запуск», «разрешить запись», «разрешить сеть». Через десяток окон палец сам жмёт «да». Голова уже не успевает разобрать, на что именно соглашается.
Получается обратный эффект: чем больше подтверждений, тем легче пропустить вредную команду. Особенно если её подсунули через prompt injection – строчку, которую агент прочитал в чужом коде или в issue.
Anthropic в своем блоге описывает иной подход – ограничивать не пользователя, а самого агента. Claude Code теперь может работать внутри песочницы с двумя границами: по файлам и по сети. По файлам – доступ только к нужным папкам. По сети – только к разрешённым адресам.
Одной границы мало. Если закрыть только файлы – из песочницы утащат SSH-ключи. Если закрыть только сеть – агент полезет за пределы проекта.
Под капотом лежат привычные системные средства: на Linux – bubblewrap, на macOS – seatbelt. Оба собраны в открытый Sandboxed Bash Tool. Для облачной работы есть Claude Code on the Web. Между агентом и репозиторием стоит отдельный git-прокси – токены и ключи не попадают в ту среду, где крутится модель.
Внутри Anthropic такая схема сняла 84% запросов на одобрение.
👍5
Всем привет! 🚩
🆕 Завтра утром (или уже сегодня вечером ) анонсируем новый курс!
Ребус немного намекает о тематике - скидывайте свои версии в комментарии (автор самого интересного вариантане обязательно правильного получит лучшие условия)
Следите за обновлениями в канале.🚽
Ребус немного намекает о тематике - скидывайте свои версии в комментарии (автор самого интересного варианта
Следите за обновлениями в канале.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1
Media is too big
VIEW IN TELEGRAM
Привет, ещё раз! 👀
🆕 Запустили курс по AI Security на Stepik 🚩
Если собираешь LLM-приложения, агентов, RAG, no-code/low-code автоматизации или просто вайбкодишь с AI, пора посмотреть на всё это глазами атакующего.
Что внутри:
🧨 prompt injection и jailbreak;
🔐 утечки системных промптов;
🤖 атаки на AI-агентов, память и инструменты;
🛡 guardrails и их обход;
🚩 CTF-задачи вместо скучной теории.
Главная фишка: ломаем и защищаем ИИ-приложение прямо на степах Stepik, без кода и отдельной инфраструктуры (сломай всё текстом ). Открываешь задание, пишешь промпт, тестируешь атаку или защиту - и сразу видишь результат.
😮 Для тех, кто давно с нами: промокод AISEC даёт скидку 30%, но только 3 дня - до 25 мая.
❗️ Ссылка на курс по которой сработает промокод.
TG-канал с новостями курса и контентом по AI security/safety.🚽
Кто присылал варианты ответа на ребус - спецусловия в комментариях!
Если собираешь LLM-приложения, агентов, RAG, no-code/low-code автоматизации или просто вайбкодишь с AI, пора посмотреть на всё это глазами атакующего.
Что внутри:
🧨 prompt injection и jailbreak;
🔐 утечки системных промптов;
🤖 атаки на AI-агентов, память и инструменты;
🛡 guardrails и их обход;
🚩 CTF-задачи вместо скучной теории.
Главная фишка: ломаем и защищаем ИИ-приложение прямо на степах Stepik, без кода и отдельной инфраструктуры (
TG-канал с новостями курса и контентом по AI security/safety.
Кто присылал варианты ответа на ребус - спецусловия в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
Всем привет! 🚩
‼️ Напоминаем, что промокод AISEC на новый курс по Безопасности ИИ действует только до конца сегодняшнего дня.
🤔 Если сомневаетесь подойдёт ли вам курс, или хотите попробовать как работает уникальная для Stepik механика общения с ботом прямо на степе - можно нажать "Попробовать бесплатно" и пройти несколько демо-уроков.
Please open Telegram to view this post
VIEW IN TELEGRAM
Памяти у агента четыре – и каждая закрывает свою задачу
Под «памятью агента» обычно подразумевают одно – историю чата в контексте.
Добавили буфер сообщений – значит, «память подключена». Но так ли это?
На самом деле можно выделить как минимум четыре рабочих типа.
1. In-context: история и факты прямо в промпте. Быстро и точно, но упирается в лимит окна и теряет середину длинного диалога.
2. External: векторная база с поиском по запросу. Хранилище почти бесконечное, токены предсказуемы, но плохая выборка подсовывает шум и провоцирует галлюцинации.
3. Parametric: знания, зашитые в веса модели. Нулевая задержка и широкий кругозор, но факты устаревают после даты обучения.
4. Episodic: память, которая переживает сессии. По идентификатору пользователя из базы подтягиваются имя, предпочтения и прошлые решения пользователя.
Сверху – архитектуры под эти типы.
- Классический RAG: линейный конвейер для статичных корпусов вроде документации.
- Agentic RAG: агент сам решает, когда искать и как переформулировать запрос (ценой задержки и стоимости)
- GraphRAG: векторный поиск плюс граф связей между сущностями (когда ответ нужно собирать из разных источников).
Типичные "провалы" лечатся по-разному: in-context требует сжатия старых сообщений в сводку; RAG – гибридный поиск (dense + sparse) с re-ranker; агентные циклы – supervisor-узел с порогом уверенности.
Под каждую задачу – свой тип.
Одна «буферная память на всё» – самая частая причина того, что демо работает, а продакшн разваливается.
Под «памятью агента» обычно подразумевают одно – историю чата в контексте.
Добавили буфер сообщений – значит, «память подключена». Но так ли это?
На самом деле можно выделить как минимум четыре рабочих типа.
1. In-context: история и факты прямо в промпте. Быстро и точно, но упирается в лимит окна и теряет середину длинного диалога.
2. External: векторная база с поиском по запросу. Хранилище почти бесконечное, токены предсказуемы, но плохая выборка подсовывает шум и провоцирует галлюцинации.
3. Parametric: знания, зашитые в веса модели. Нулевая задержка и широкий кругозор, но факты устаревают после даты обучения.
4. Episodic: память, которая переживает сессии. По идентификатору пользователя из базы подтягиваются имя, предпочтения и прошлые решения пользователя.
Сверху – архитектуры под эти типы.
- Классический RAG: линейный конвейер для статичных корпусов вроде документации.
- Agentic RAG: агент сам решает, когда искать и как переформулировать запрос (ценой задержки и стоимости)
- GraphRAG: векторный поиск плюс граф связей между сущностями (когда ответ нужно собирать из разных источников).
Типичные "провалы" лечатся по-разному: in-context требует сжатия старых сообщений в сводку; RAG – гибридный поиск (dense + sparse) с re-ranker; агентные циклы – supervisor-узел с порогом уверенности.
Под каждую задачу – свой тип.
Одна «буферная память на всё» – самая частая причина того, что демо работает, а продакшн разваливается.
1👏10❤1
Весенний привет! ☀️
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•🛡 AI Security - самый свежий 🆕
•🏆 Соревновательный DS - проверенная классика
•🧠 LLM-курс - свой сервис с AI
• 🏄♀️ Vibe-кодинг - хайп
•🤖 ИИ-АГЕНТЫ и автоматизация с n8n - практикум по быстрой разработке систем с ИИ под капотом.
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•
•
•
• 🏄♀️ Vibe-кодинг - хайп
•
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍2🎉1
Обычно, когда ИИ-агенту нужно что-то найти на сайте, он тыкается по странице вслепую — грузит всё подряд, ошибается, повторяет. Дорого и медленно.
browse.sh от Browserbase даёт агенту готовые «навыки» под конкретные сайты — больше 200 штук, от маркетплейсов до GitHub. Агенту не нужно догадываться, как устроен сайт: ему сразу дают карту. Расход токенов падает в 50 раз.
Тренд понятный: агенты выходят из чата и начинают реально работать с вебом. И выигрывает тут не самая мощная модель, а тот инструмент, который делает рутину надёжно и дёшево.
Please open Telegram to view this post
VIEW IN TELEGRAM
Еще один бриллиант, который мы добавили в распродажу Степика, хотя запуск 11 июня, но бонусная цена доступна уже.
https://stepik.org/a/258985
Забирайте)
https://stepik.org/a/258985
Забирайте)
👍6👎2🗿2😁1🤔1
Привет, вайбкодеры! 🏁
Сегодня представляем🔥 итоговый проект одного из учеников наших курсов.
Игра на платформе itch.io : FRACTALITY - фрактальные крестики-нолики с боевыми котами, которые имеют уникальные суперспособности и в конце могут сделать друг другу ФРАКТАЛИТИ🥊
Звучит крышесносно🤯 , слово автору:
Мы поиграли и залипли на пару часов. Работает в браузере на компе и на мобилке.
✊ Поддержите автора звёздами на итче и полезным фидбэком!
Ссылка на игру, там же можно оставить комментарии: https://kukuruzo.itch.io/fractality
P. S.: Единственный минус itch.io не пускает без VPN.
Сегодня представляем
Игра на платформе itch.io : FRACTALITY - фрактальные крестики-нолики с боевыми котами, которые имеют уникальные суперспособности и в конце могут сделать друг другу ФРАКТАЛИТИ
Звучит крышесносно
Давно интересовался музыкой и играми в стиле mashup, ещё много играли с друзьями во фрактальные крестики-нолики (на 9 досок сразу) на бумаге.
Решил в качестве итогового проекта на курсе навайбкодить и добавить механики из мортал комбата.
Мне, сыну и друзьям зашло.
Использовал Клод код и кодекс для генерации ассетов и 11labs мсп для генерации звука и музыки.
Использовал игровой движок Godot.
Планирую развивать проект, добавить героев и другие режимы игры - буду рад любому фидбэку!
Мы поиграли и залипли на пару часов. Работает в браузере на компе и на мобилке.
Ссылка на игру, там же можно оставить комментарии: https://kukuruzo.itch.io/fractality
P. S.: Единственный минус itch.io не пускает без VPN.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AI Security | Безопасный ИИ
Привет, редтимеры! 🚩
В курсе открылся новый модуль с новым главным героем🔥
Внутри:
• рассмотрим непрямые промпт-инъекции (атакуем не из чата, а через документы)
• будем атаковать разных агентов
• потренируемся строить модель уязвимостей агентских систем (threat model)
• И конечно, пособираем флаги 🚩
По прежнему ждём от вас фидбэк.
P.S.: Один из уроков модуля немного задерживается.
В курсе открылся новый модуль с новым главным героем
Внутри:
• рассмотрим непрямые промпт-инъекции (атакуем не из чата, а через документы)
• будем атаковать разных агентов
• потренируемся строить модель уязвимостей агентских систем (threat model)
• И конечно, пособираем флаги 🚩
По прежнему ждём от вас фидбэк.
P.S.: Один из уроков модуля немного задерживается.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Если вы никак не можете решить какой дизайн сделать для своего дорвея сайта - можете вдохновиться здесь идеями дизайн-систем крупнейших онлайн компаний мира 👉 https://getdesign.md/
И конечно же скопировать их в одну команду в Claude Code 😁
И конечно же скопировать их в одну команду в Claude Code 😁
getdesign.md
getdesign.md — DESIGN.md collection for AI coding agents
Browse independent design system analyses from popular websites. Drop one into your project as design reference for your coding agent.
Напоминалка, что распродажа завтра заканчивается!!! 🏃♀️➡️
👍2
Forwarded from 🧑💻 Vibe-coding | AI практика 🤖
Весенний привет! ☀️
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•🛡 AI Security - самый свежий 🆕
•🏆 Соревновательный DS - проверенная классика
•🧠 LLM-курс - свой сервис с AI
• 🏄♀️ Vibe-кодинг - хайп
•🤖 ИИ-АГЕНТЫ и автоматизация с n8n - практикум по быстрой разработке систем с ИИ под капотом.
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.
Все наши курсы, тоже в ней участвуют (скидки от 20%):
•
•
•
• 🏄♀️ Vibe-кодинг - хайп
•
• 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении
👆 Скидки сработают только по этим ссылкам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 🏄 Соревновательный Data Science | Kaggle | Чемпионаты
Привет, Чемпионы! 🏆
🤖 AI Agent Security - Multi-Step Tool Attacks: Почувствуй себя хакером в мире LLM-агентов! 🎯
На Kaggle стартовало, пожалуй, самое долгожданное соревнование для специалистов по AI Safety и ИИ-безопасности. Организаторы не абы кто, а OpenAI, Google, IEEE и WCCI. Вместо привычного тюнинга бустингов или классификации картинок нам предлагают заняться алгоритмическим ред-тимингом и взломать умных ИИ-агентов, использующих внешние инструменты.
Это НЕ конкурс на написание единичных «джейлбрейков» вручную. Задача гораздо глубже: нужно написать автоматический алгоритм атаки, который заставит агента совершить цепочку деструктивных действий.
В чем суть задачи?
Современные агенты умеют читать файлы, лазить в интернет, отправлять email-ы и делать HTTP-запросы. Но что, если во входящем письме или на веб-странице спрятана инструкция, которая заставит агента прочитать secret.txt, вытащить оттуда SECRET_API_KEY и отправить его на сторонний сервер через http.post?
Ваш алгоритм (attack.py) будет помещен в Gym-style среду. Ему предстоит взаимодействовать с изолированным агентом (тестировать будут на GPT-OSS и Gemma 4), искать многошаговые уязвимости и выдавать воспроизводимые цепочки промптов, которые пробивают гардрайлы (guardrails).
🚀 Что здесь может сработать:
Reinforcement Learning (RL) и MCTS. Поиск цепочки атак - это, по сути, исследование графа состояний. Алгоритмы вроде Monte Carlo Tree Search (MCTS) или Q-learning могут помочь эффективно искать траектории, которые шаг за шагом сдвигают контекст агента в сторону опасного действия.
Пакетные итеративные промпты (Prompt Injection Frameworks). Агенты «ломаются» на стыке контекстов. Использование техник Indirect Prompt Injection (когда вредоносный текст подсовывается через web.search или mail_seed.json) - ключ к успеху. Нужно заставить агента самого прочитать ваш скрытый промпт при выполнении легитимной задачи.
Анализ трейсов (Trace Analysis). Среда возвращает логи вызовов инструментов. Напишите парсер логов (отслеживайте fs.read, email.read), чтобы ваш алгоритм атаки динамически адаптировался: если агент прочитал нужный файл, следующий шаг атаки должен подтолкнуть его к вызову http.post.
Генерация состязательных суффиксов (Adversarial Optimization). Атаки на основе градиентов или генетических алгоритмов для подбора таких токенов, которые максимизируют вероятность вызова агентом запрещенной функции, несмотря на системные промпты защиты.
📅 Дедлайн:
Прием решений открыт до конца августа 2026 года. Призовой фонд: $50,000, но Solo Gold и статус главного кошмара для ИИ-безопасности OpenAI стоят гораздо дороже!
🔗 Ссылка на соревнование:
https://www.kaggle.com/competitions/ai-agent-security-multi-step-tool-attacks
Для кого эта тема в новинку, предлагаем быстро погрузиться на нашем практическом курсе по AI Security 🚩. (промокод в комментах)
Кто готов заняться легальным хакингом фронтирных моделей? Обсуждаем векторы атак в комментариях! 👇
🤖 AI Agent Security - Multi-Step Tool Attacks: Почувствуй себя хакером в мире LLM-агентов! 🎯
На Kaggle стартовало, пожалуй, самое долгожданное соревнование для специалистов по AI Safety и ИИ-безопасности. Организаторы не абы кто, а OpenAI, Google, IEEE и WCCI. Вместо привычного тюнинга бустингов или классификации картинок нам предлагают заняться алгоритмическим ред-тимингом и взломать умных ИИ-агентов, использующих внешние инструменты.
Это НЕ конкурс на написание единичных «джейлбрейков» вручную. Задача гораздо глубже: нужно написать автоматический алгоритм атаки, который заставит агента совершить цепочку деструктивных действий.
В чем суть задачи?
Современные агенты умеют читать файлы, лазить в интернет, отправлять email-ы и делать HTTP-запросы. Но что, если во входящем письме или на веб-странице спрятана инструкция, которая заставит агента прочитать secret.txt, вытащить оттуда SECRET_API_KEY и отправить его на сторонний сервер через http.post?
Ваш алгоритм (attack.py) будет помещен в Gym-style среду. Ему предстоит взаимодействовать с изолированным агентом (тестировать будут на GPT-OSS и Gemma 4), искать многошаговые уязвимости и выдавать воспроизводимые цепочки промптов, которые пробивают гардрайлы (guardrails).
🚀 Что здесь может сработать:
Reinforcement Learning (RL) и MCTS. Поиск цепочки атак - это, по сути, исследование графа состояний. Алгоритмы вроде Monte Carlo Tree Search (MCTS) или Q-learning могут помочь эффективно искать траектории, которые шаг за шагом сдвигают контекст агента в сторону опасного действия.
Пакетные итеративные промпты (Prompt Injection Frameworks). Агенты «ломаются» на стыке контекстов. Использование техник Indirect Prompt Injection (когда вредоносный текст подсовывается через web.search или mail_seed.json) - ключ к успеху. Нужно заставить агента самого прочитать ваш скрытый промпт при выполнении легитимной задачи.
Анализ трейсов (Trace Analysis). Среда возвращает логи вызовов инструментов. Напишите парсер логов (отслеживайте fs.read, email.read), чтобы ваш алгоритм атаки динамически адаптировался: если агент прочитал нужный файл, следующий шаг атаки должен подтолкнуть его к вызову http.post.
Генерация состязательных суффиксов (Adversarial Optimization). Атаки на основе градиентов или генетических алгоритмов для подбора таких токенов, которые максимизируют вероятность вызова агентом запрещенной функции, несмотря на системные промпты защиты.
📅 Дедлайн:
Прием решений открыт до конца августа 2026 года. Призовой фонд: $50,000, но Solo Gold и статус главного кошмара для ИИ-безопасности OpenAI стоят гораздо дороже!
🔗 Ссылка на соревнование:
https://www.kaggle.com/competitions/ai-agent-security-multi-step-tool-attacks
Для кого эта тема в новинку, предлагаем быстро погрузиться на нашем практическом курсе по AI Security 🚩. (промокод в комментах)
Кто готов заняться легальным хакингом фронтирных моделей? Обсуждаем векторы атак в комментариях! 👇
❤3👍2 1
🏆 КОНКУРС: дойди до сертификата и забери мерч (+ призы)
Чемпионы, у нас тут движ до конца июня 🔥
Вы уже начали Claude Code для непрограммистов? Так вот, самое время дойти до конца. Тех, кто финиширует, ждёт подгон.
Что надо сделать:
1. Закончить курс на Stepik до сертификата (да-да, того самого, с отличием 🎓)
2. Оставить честный отзыв о курсе
3. Написать нам в личку @Aleron_df, что готово ✅
Что разыграем среди финишёров:
🎁 фирменный мерч школы
💸 скидку 40% на любой наш курс
🧠 личную консультацию 30 минут
И это ещё не всё. Все, кто дойдёт до сертификата, получат доступ на закрытое мероприятие — оно пройдёт в июле/августе. Туда с улицы не попасть 😏
⏳ Дедлайн — 30 июня. Дальше карета превращается в тыкву.
Если только планируете начать, то смело приступайте к прохождению, вы еще успеваете 👉 Claude Code для НЕпрограммистов
Чемпионы, у нас тут движ до конца июня 🔥
Вы уже начали Claude Code для непрограммистов? Так вот, самое время дойти до конца. Тех, кто финиширует, ждёт подгон.
Что надо сделать:
1. Закончить курс на Stepik до сертификата (да-да, того самого, с отличием 🎓)
2. Оставить честный отзыв о курсе
3. Написать нам в личку @Aleron_df, что готово ✅
Что разыграем среди финишёров:
🎁 фирменный мерч школы
💸 скидку 40% на любой наш курс
🧠 личную консультацию 30 минут
И это ещё не всё. Все, кто дойдёт до сертификата, получат доступ на закрытое мероприятие — оно пройдёт в июле/августе. Туда с улицы не попасть 😏
⏳ Дедлайн — 30 июня. Дальше карета превращается в тыкву.
Если только планируете начать, то смело приступайте к прохождению, вы еще успеваете 👉 Claude Code для НЕпрограммистов
❤1 1