Love. Death. Transformers.
24.4K subscribers
4.56K photos
522 videos
81 files
2.98K links
❤️☠️🤗

Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.
Download Telegram
а сходка в sf это вообще актуальная тема?
💩29🌭5👍1
🐉 Открыт набор на Technical AI Safety курс по оценке LLM: подходы, бенчмарки и методология

Evals for AI Safety — это методология измерения качества, надежности и безопасности ИИ-систем. В условиях повсеместного внедрения языковых моделей в продакшн умение корректно оценивать их возможности и риски становится приоритетным навыком.

Как устроен курс:
🔘Анализ методологии evals на основе современных и классических статей в области
🔘Менторы из Apollo research, AI Lab SKOLKOVO, AIRI Institute, Яндекс и др
🔘Обучение в мини-группах, по 4-6 человек
🔘Формат: оффлайн в Москве или онлайн
🔘Ожидаемая нагрузка: 10-15 часов в неделю
🔘Стоимость: бесплатно, отбор на конкурсной основе

Цель курса:
Дать базу для начала карьеры в области оценки ИИ и понимание того, какую роль evals играет в AI Safety. Программа знакомит с основными концепциями evals, учит анализировать существующие бенчмарки, проектировать собственные оценки и разрабатывать дизайн экспериментов в области evals. Участники курса освоят Inspect AI (один из самых популярных фреймворков для оценки LLM).

Кого мы ждем:
🔘Студентов STEM-направлений, планирующих карьеру в области ИИ
🔘IT-специалистов, желающих освоить навык тестирования языковых моделей
🔘Продвинутых и начинающих специалистов в области ML, которые хотят углубиться в методологию оценки моделей

Подробнее: тут
Подать заявку на участие в курсе, а также на фасилитацию можно до 22 февраля: тут

Если вам интересно менторство, преподавание, сотрудничество с курсом или вы хотите задать вопрос, то напишите Юле
Please open Telegram to view this post
VIEW IN TELEGRAM
31❤‍🔥98👍2🥱2🔥1💔1💋1
72😍50🔥17❤‍🔥10🥱6👍2🎉1💋1
Love. Death. Transformers.
Деплоймент клавда нереальный будет. + Обзор этой штуки
Девушка собрала часа за 2, все очень просто в целом, неплохие камеры и микрофон, 2 dgx spark едут потому что RPI бессмысленно для этого + streaming openai API полынй калл
🔥55👍7😍4😁3❤‍🔥2💋2
Love. Death. Transformers.
Девушка собрала часа за 2, все очень просто в целом, неплохие камеры и микрофон, 2 dgx spark едут потому что RPI бессмысленно для этого + streaming openai API полынй калл
С моделями для стриминга и такого рода девайсов все не очень, по сути архитектура становится многоуровневой, эмоции-тулколы-стриминг разносятся на разные уровни и получается очень большая штука
1❤‍🔥16🔥7🤔6💋1
115😁44🔥13💩6💋54👍1
Подписчики: - Мы хотим детекцию сгенерированных текстов.
Я: - У нас есть детекция сгенерированных текстов дома.
Детекция сгенерированных текстов дома: https://www.reviewer3.com/evidence/arena - попробуй угадать сам, какая рецензия написана человеком, а какая - LLMкой!
1😁46🔥3💅1
Крутой хакатон от мистраля!


А если будете в Париже или Токио или SF будет возможность развирутализироватся с одним из админов
worldwide-hackathon.mistral.ai/
🔥24🥱15🥴63
я. не. могу. поверить.
😁7333🔥7🤔1💩1😍1💋1
Yandex покатил релизы вслед за AIRI
https://huggingface.co/Qwen/Qwen3.5-397B-A17B
- гибридный attn
- MTP
- 256к нативно и YARN до 1м
😁172🤪229👍8💊6💋2🔥1
Love. Death. Transformers.
Yandex покатил релизы вслед за AIRI https://huggingface.co/Qwen/Qwen3.5-397B-A17B - гибридный attn - MTP - 256к нативно и YARN до 1м
юмор автора инициализирован весами программы Аншлаг, но в репорте сказано, что АКБ
😁78💋6🔥3
Love. Death. Transformers.
С моделями для стриминга и такого рода девайсов все не очень, по сути архитектура становится многоуровневой, эмоции-тулколы-стриминг разносятся на разные уровни и получается очень большая штука
если еще подумать и поигратся с квантами то ситуация остается очень и очень печальной

ну как сказать, клод всю ночь игрался с mlx и проиграл
1👍9😭5💩3🔥1💋1
Мужчины не говорят что у них депрессия. Мужчины дизайнят свой ASIC для ллмок
179😁25👍11🔥74😢1💋1
TLDR по агентам 2026

Вам не поможет ваша ебейшая китайская сота если она не KIMI2.5

Это к слову GAIA
44🫡17🦄5🔥1💩1💋1
Forwarded from Ilya Gusev
мои старые замеры на гайе бтв (первые 30 примеров)
🔥10💋3
GAIA

Тема давно уже известная, но тк я страдаю ADHD опишу

- это бенчмарк способность агента делать сравнительно бесполезную, но сложную работу, а именно:
A paper about AI regulation that was originally submitted to arXiv.org in June 2022 shows a figure with three axes, where each axis has a label word at both ends. Which of these words is used to describe a type of society in a Physics and Society article submitted to arXiv.org on August 11, 2016?


Что делать с этой информацией? Что оно меряет? я лично без понятия
При этом это неплохая прокси для общих агентов посмотреть "а что там вообще изменилось"
За год произошло следущее
- тулколы последовательные норм у всех завелись
- скафолды ощутимо докидывают
- без норм ллмов делать особо нечего
- KIMI хороша на бенчах
link
👍27🔥7😁3💔1💋1