🏄 Соревновательный Data Science | Kaggle | Чемпионаты
3.3K subscribers
335 photos
55 videos
2 files
336 links
Соревновательный Data Science - сообщество тех, кто побеждает или только учится побеждать в ML чемпионатах👨‍💻

Наш курс на Stepik:
https://stepik.org/a/108888

Чат:
https://tg-me.sbs/+UeIeCRykqYEwY2Y6

Для предложений и вопросов: @Aleron_1
Download Telegram
Привет, Чемпионы! 🏆

Давненько не было новостей от Kaggle.

Недавно на платформе появился раздел Benchmarks.

И вот вышел курс из 7 модулей Kaggle Benchmarks Deep Dive

Правда собственно про бечмарки и бенчмаркинг там последние 2 занятия, но базу про LLM хорошо дают.

Го, проходить! 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
12❤‍🔥1💯1
Привет, Чемпионы! 🚩

🆕 Завтра утром (или уже сегодня вечером) анонсируем новый курс!

Ребус немного намекает о тематике - скидывайте свои версии в комментарии (автор самого интересного варианта не обязательно правильного получит лучшие условия)

Следите за обновлениями в канале. 🚽

P.S.: Курс может быть интересен как соревновательному сообществу, так и Markdown-инженерам 😏 (хотя где эта грань 🤔)
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉4
Media is too big
VIEW IN TELEGRAM
Привет, ещё раз! 👀

🆕 Запустили курс по AI Security на Stepik 🚩

Это практический курс-CTF-чемпионат для тех, кому интересны LLM, adversarial thinking и CTF-подход: не просто «как работает модель», а как её можно обойти, сломать, заставить раскрыть лишнее, и как потом это закрывать.

Что внутри:

🧨 prompt injection и jailbreak;
🔐 утечки системных промптов;
🤖 атаки на AI-агентов, память и инструменты;
🛡 guardrails и их обход;
🚩 CTF-задачи вместо скучной теории.

Главная фишка: ломаем и защищаем ИИ-приложение прямо на степах Stepik, без кода и отдельной инфраструктуры (сломай всё текстом). Открываешь задание, пишешь промпт, тестируешь атаку или защиту - забираешь флаг 🚩.

😮 Для тех, кто давно с нами: промокод AISEC даёт скидку 30%, но только 3 дня - до 25 мая.

❗️Ссылка на курс по которой сработает промокод.

TG-канал с новостями курса и контентом по AI security/safety. 🚽
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉43
Всем привет! 🚩

‼️Напоминаем, что промокод AISEC на новый курс по Безопасности ИИ действует только до конца сегодняшнего дня.

🤔 Если сомневаетесь подойдёт ли вам курс, или хотите попробовать как работает уникальная для Stepik механика общения с ботом прямо на степе - можно нажать "Попробовать бесплатно" и пройти несколько демо-уроков.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯42
Привет, Чемпионы! 🏆

🌋 ROGII Wellbore Geology Prediction: Время бурить дата-сеты и доставать золото из недр! 💎

На Kaggle идёт хардкорная сорева для любителей реальных индустриальных задач и сложного таблично-последовательного ML. Никаких генераций котиков и классификации отзывов - только суровая физика, геотермальные каротажи и километры скважин.

Предсказываем литологию (типы горных пород) и геологические маркеры на основе данных бурения. ROGII (авторы топового софта для геостейринга StarSteer) выкатили датасет, на котором сломается любая дефолтная модель, если подходить к ней без ума.

Почему стоит участвовать?
Это идеальный трек для тех, кто соскучился по настоящему Feature Engineering. Здесь мало просто запустить модель - нужно понять физику процесса. Данные каротажа (гамма-излучение, сопротивление, плотность) зашумлены, датчики ломаются, а пласты земли идут в строгой последовательности, которую нужно уметь декодировать.

🚀 Что здесь может сработать:
GroupKFold по скважинам (Well ID) - это база валидации. Если вы перемешаете строчки из одной и той же скважины между трейном и тестом, то поймаете жесткий лик (data leakage) и улетите на дно прайват-лидерборда.

Контекст имеет значение. Земля - это слоеный пирог. Используйте скользящие окна (rolling features), лаги вверх-вниз по глубине и дифференциалы каротажных кривых.

Deep Learning для сиквенсов. Скажите привет 1D CNN, Bi-LSTM или легким Трансформерам. Породы сменяют друг друга последовательно, и марковские свойства переходов тут работают во всю мощь.

Борьба с дисбалансом.
Глина (shale) есть везде, а вот продуктивный песчаник или редкий известняк придется выковыривать по крупицам. Кастомные лосс-функции (Focal Loss) и правильный ресэмплинг спасут ваш Macro F1-Score.

📅 Дедлайн:
Соревнование только началось, времени на эксперименты предостаточно. Самое время расчехлить свои Jupyter-ноутбуки!

🔗 Ссылка на соревнование:
https://www.kaggle.com/competitions/rogii-wellbore-geology-prediction

Кто готов штурмовать скважины? Делитесь мыслями по поводу гео-данных в комментариях! 👇
13💯2❤‍🔥1
Весенний привет! ☀️

На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня.

Все наши курсы, тоже в ней участвуют (скидки от 20%):
🛡 AI Security - самый свежий 🆕
🏆Соревновательный DS - проверенная классика
🧠 LLM-курс - свой сервис с AI
🏄‍♀️ Vibe-кодинг - хайп
🤖 ИИ-АГЕНТЫ и автоматизация с n8n - практикум по быстрой разработке систем с ИИ под капотом.
👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении

👆 Скидки сработают только по этим ссылкам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Контент топ будет
❤‍🔥1
Forwarded from Maria Vorontsova
Тренировки по ML

6️⃣ июня состоится семнадцатая встреча в рамках тренировок по машинному обучению ❤️

Что будет на встрече:
⚪️Orbit Wars как первое RL соревнование на Kaggle в эпоху coding agents

📢 Спикер: Дмитрий Руденко, Kaggle Competition Master, самый активный участник соревновательного сообщества. Автор @pseudolabeling

📆 Когда: 6 июня в 18:10
🗺️ Где: онлайн ❤️ ссылка на подключение

Подробнее про челленджи 🐭

По организационным вопросам вы можете обращаться к Марии ↩️

#анонсы #студенты #ии
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1
Forwarded from Samvel K
В Kaggle CLI наконец-то форумы завезли. А это значит, что агентам придется страдать чуть меньше.
7
Привет, Чемпионы! 🏆

🤖 AI Agent Security - Multi-Step Tool Attacks: Почувствуй себя хакером в мире LLM-агентов! 🎯

На Kaggle стартовало, пожалуй, самое долгожданное соревнование для специалистов по AI Safety и ИИ-безопасности. Организаторы не абы кто, а OpenAI, Google, IEEE и WCCI. Вместо привычного тюнинга бустингов или классификации картинок нам предлагают заняться алгоритмическим ред-тимингом и взломать умных ИИ-агентов, использующих внешние инструменты.

Это НЕ конкурс на написание единичных «джейлбрейков» вручную. Задача гораздо глубже: нужно написать автоматический алгоритм атаки, который заставит агента совершить цепочку деструктивных действий.

В чем суть задачи?
Современные агенты умеют читать файлы, лазить в интернет, отправлять email-ы и делать HTTP-запросы. Но что, если во входящем письме или на веб-странице спрятана инструкция, которая заставит агента прочитать secret.txt, вытащить оттуда SECRET_API_KEY и отправить его на сторонний сервер через http.post?

Ваш алгоритм (attack.py) будет помещен в Gym-style среду. Ему предстоит взаимодействовать с изолированным агентом (тестировать будут на GPT-OSS и Gemma 4), искать многошаговые уязвимости и выдавать воспроизводимые цепочки промптов, которые пробивают гардрайлы (guardrails).

🚀 Что здесь может сработать:

Reinforcement Learning (RL) и MCTS. Поиск цепочки атак - это, по сути, исследование графа состояний. Алгоритмы вроде Monte Carlo Tree Search (MCTS) или Q-learning могут помочь эффективно искать траектории, которые шаг за шагом сдвигают контекст агента в сторону опасного действия.

Пакетные итеративные промпты (Prompt Injection Frameworks). Агенты «ломаются» на стыке контекстов. Использование техник Indirect Prompt Injection (когда вредоносный текст подсовывается через web.search или mail_seed.json) - ключ к успеху. Нужно заставить агента самого прочитать ваш скрытый промпт при выполнении легитимной задачи.

Анализ трейсов (Trace Analysis). Среда возвращает логи вызовов инструментов. Напишите парсер логов (отслеживайте fs.read, email.read), чтобы ваш алгоритм атаки динамически адаптировался: если агент прочитал нужный файл, следующий шаг атаки должен подтолкнуть его к вызову http.post.

Генерация состязательных суффиксов (Adversarial Optimization). Атаки на основе градиентов или генетических алгоритмов для подбора таких токенов, которые максимизируют вероятность вызова агентом запрещенной функции, несмотря на системные промпты защиты.

📅 Дедлайн:
Прием решений открыт до конца августа 2026 года. Призовой фонд: $50,000, но Solo Gold и статус главного кошмара для ИИ-безопасности OpenAI стоят гораздо дороже!

🔗 Ссылка на соревнование:
https://www.kaggle.com/competitions/ai-agent-security-multi-step-tool-attacks

Для кого эта тема в новинку, предлагаем быстро погрузиться на нашем практическом курсе по AI Security 🚩. (промокод в комментах)

Кто готов заняться легальным хакингом фронтирных моделей? Обсуждаем векторы атак в комментариях! 👇
6❤‍🔥4
Новый ML/RL-хакатон по рыночным данным с призовым фондом $5,000

Команда Reinforce.fi (ex-Overnight.fi) запускает соревнование по построению модели принятия решений на рынке.

Задача отличается от классического прогнозирования временных рядов.

Участникам предстоит выбрать одно из 10 возможных действий (A1–A10) для каждого состояния рынка и максимизировать итоговую прибыль стратегии.

Данные:

• реальные рыночные данные с анонимизированными признаками
• последовательности длиной 1000 шагов
• различные рыночные режимы и временные периоды
• train и validation датасеты в формате Parquet

Метрика:

Score = суммарный PnL по всем принятым решениям.

Что может пригодиться:

• Reinforcement Learning
• Time Series Forecasting
• Sequential Models
• Transformers
• Decision Making Algorithms
• Ensemble-подходы

Призы:

1️⃣ $2,500
2️⃣ $1,500
3️⃣ $1,000

Финал соревнования:

Топ-10 участников лидерборда предоставляют код или ноутбук для проверки на скрытом датасете. Финалисты презентуют свои решения команде Reinforce.fi онлайн или офлайн.

Старт соревнования — конец июня 2026 года (продолжительность — около 1.5–2 месяцев).

Telegram-чат участников:
https://tg-me.sbs/+R6lMJ10VXP5hOTI0

Регистрация и подробные условия
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6