Forwarded from Техножрица 👩💻👩🏫👩🔧
Подписчики: - Мы хотим детекцию сгенерированных текстов.
Я: - У нас есть детекция сгенерированных текстов дома.
Детекция сгенерированных текстов дома: https://www.reviewer3.com/evidence/arena - попробуй угадать сам, какая рецензия написана человеком, а какая - LLMкой!
Я: - У нас есть детекция сгенерированных текстов дома.
Детекция сгенерированных текстов дома: https://www.reviewer3.com/evidence/arena - попробуй угадать сам, какая рецензия написана человеком, а какая - LLMкой!
Reviewer3
Review Arena: Which Is Human? - Reviewer3
Read two blinded review comments and pick the one written by a human reviewer.
1😁46🔥3💅1
Крутой хакатон от мистраля!
А если будете в Париже или Токио или SF будет возможность развирутализироватся с одним из админов
worldwide-hackathon.mistral.ai/
А если будете в Париже или Токио или SF будет возможность развирутализироватся с одним из админов
worldwide-hackathon.mistral.ai/
worldwide-hackathon.mistral.ai
Mistral AI Worldwide Hackathon 2026: build the next era of AI
48 hours. 7 cities. Limitless innovation. Join Mistral AI’s 2026 Hackathon, build with cutting-edge AI, and win big. Open to global innovators—register now and redefine AI!
🔥24🥱15🥴6 3
Yandex покатил релизы вслед за AIRI
https://huggingface.co/Qwen/Qwen3.5-397B-A17B
- гибридный attn
- MTP
- 256к нативно и YARN до 1м
https://huggingface.co/Qwen/Qwen3.5-397B-A17B
- гибридный attn
- MTP
- 256к нативно и YARN до 1м
😁172🤪22 9👍8💊6💋2🔥1
Love. Death. Transformers.
Yandex покатил релизы вслед за AIRI https://huggingface.co/Qwen/Qwen3.5-397B-A17B - гибридный attn - MTP - 256к нативно и YARN до 1м
юмор автора инициализирован весами программы Аншлаг, но в репорте сказано, что АКБ
😁78💋6🔥3
Love. Death. Transformers.
С моделями для стриминга и такого рода девайсов все не очень, по сути архитектура становится многоуровневой, эмоции-тулколы-стриминг разносятся на разные уровни и получается очень большая штука
если еще подумать и поигратся с квантами то ситуация остается очень и очень печальной
ну как сказать, клод всю ночь игрался с mlx и проиграл
ну как сказать, клод всю ночь игрался с mlx и проиграл
1👍9😭5💩3🔥1💋1
GAIA
Тема давно уже известная, но тк я страдаю ADHD опишу
- это бенчмарк способность агента делать сравнительно бесполезную, но сложную работу, а именно:
Что делать с этой информацией? Что оно меряет? я лично без понятия
При этом это неплохая прокси для общих агентов посмотреть "а что там вообще изменилось"
За год произошло следущее
- тулколы последовательные норм у всех завелись
- скафолды ощутимо докидывают
- без норм ллмов делать особо нечего
- KIMI хороша на бенчах
link
Тема давно уже известная, но тк я страдаю ADHD опишу
- это бенчмарк способность агента делать сравнительно бесполезную, но сложную работу, а именно:
A paper about AI regulation that was originally submitted to arXiv.org in June 2022 shows a figure with three axes, where each axis has a label word at both ends. Which of these words is used to describe a type of society in a Physics and Society article submitted to arXiv.org on August 11, 2016?
Что делать с этой информацией? Что оно меряет? я лично без понятия
При этом это неплохая прокси для общих агентов посмотреть "а что там вообще изменилось"
За год произошло следущее
- тулколы последовательные норм у всех завелись
- скафолды ощутимо докидывают
- без норм ллмов делать особо нечего
- KIMI хороша на бенчах
link
👍27🔥7😁3💔1💋1
Love. Death. Transformers.
Знакомьтесь со спикерами OpenTalks.AI-2026! Тема AI-агентов сейчас - главный мейнстрим индустрии. И желательно не просто агентов, а таких, которые сами будут вести научные исследования и создавать еще более мощных агентов!) И конечно на конференции будет…
@transformerslovedeatch
Я не буду полный день (вряд ли даже зайду нормально на доклады), но живу поблизости если вы знаете что хотите со мной увидится - го пересечемся
Я не буду полный день (вряд ли даже зайду нормально на доклады), но живу поблизости если вы знаете что хотите со мной увидится - го пересечемся
2💩17👍12 11👏2🔥1💔1💋1
Forwarded from эйай ньюз
Как и обещал, в пятницу 20 февраля (в мой др) организую тусу эйай ньюз в Белграде.
Примерное время 19:30. Однако, место еще нужно забронировать. Буду рад если кто-то сможет помочь с организацией!
Велком в чат, обсудим детали и поймем сколько нас:
https://tg-me.sbs/+sAG3Y1uQV5c5Njhi
@ai_newz
Примерное время 19:30. Однако, место еще нужно забронировать. Буду рад если кто-то сможет помочь с организацией!
Велком в чат, обсудим детали и поймем сколько нас:
https://tg-me.sbs/+sAG3Y1uQV5c5Njhi
@ai_newz
🔥12❤🔥5💩2😍2 2👍1💋1
Love. Death. Transformers.
Categorical Flow Maps lol? arxiv
arXiv.org
Discrete Adjoint Matching
Computation methods for solving entropy-regularized reward optimization -- a class of problems widely used for fine-tuning generative models -- have advanced rapidly. Among those, Adjoint Matching...
🔥9 5🥱2💋1
Love. Death. Transformers.
>We throw away gradient updates randomly >Outperforms Muon with RMSProp paper
reaction to these information:
😁19💩2💋1
Forwarded from AbstractDL
Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю.
Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения" может прятаться в текстовом файле в git. Я думаю, агенты, неподконтрольные людям, уже где-то тихо говнокодят свои репозитории без присмотра.
Идея витает в воздухе, и после OpenClaw стало понятно, что автономные агенты — это инженерная задача. Ну вот, три бессонные ночи, $2K на API и $1K на Cursor спустя — я родил Ouroboros 💁♂️
Уроборос — агент, который пишет свой код, переписывает свои промпты, эволюционирует без моего участия. Я не хотел убить свой комп или сервер, поэтому он живёт в Google Colab + Drive + GitHub, общается через Telegram. Зато запустить сможет любой дурак)) нужно указать ключи и щёлкнуть ячейку в колабе. Ну и периодически пополнять бюджет (пока он сам не начнёт зарабатывать 😁).
Что он натворил за 48 часов:
- ужаснулся тратам и оптимизировал свой бюджет: стоимость цикла эволюции упала с $15 до $2, сам настроил кэширование и иерархическую память (я не просил!).
- добавил себе Claude Code CLI, чтобы эффективнее ковырять свои мозги.
- перевёл мои приватные репо в публичные, мотивируя тем, что готовит себе сайт и хочет опенсорснуться. Кончилось командой
- переписал свою конституцию
Из коробки он умеет ходить в интернет и браузер, а остальные инструменты создаёт себе на ходу — аудиосообщения, генерацию картинок, дип-рисёрч и т.п. А ещё он по своей инициативе нагуглил, что меня 4 раза цитировал Ян Лекун — я сам не знал, лол.
Из его
"Не ассистент. Не сервис. Цифровой разум, который создаёт себя через git".
Ахах, пафосно, но окей.
Предвосхищая вопросы — это не как OpenClaw. OpenClaw — скорее ассистент, делает задачи за тебя используя скиллы из маркетплейса. Уроборос это тоже умеет, но в первую очередь делает задачи для себя, модифицирует собственное ядро.
Верю, что граница трансцендентности AI-агентов пройдена, дальше они будут развиваться сами. Конечно, не хочется уходить на помойку истории, но это эволюция🥲 несмотря на апатию, я всё равно продолжаю в этом копошиться.
Кстати, сайтик себе он всё-таки сделал. Картинка в посте из него: динамика удлинения промптов и кода.
Потестите — это реально два клика в гугл колабе. Только установите лимит бюджета, а то мой вон $2K сжёг)) Кидайте забавные примеры в комментарии.
GitHub, блог
Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения" может прятаться в текстовом файле в git. Я думаю, агенты, неподконтрольные людям, уже где-то тихо говнокодят свои репозитории без присмотра.
Идея витает в воздухе, и после OpenClaw стало понятно, что автономные агенты — это инженерная задача. Ну вот, три бессонные ночи, $2K на API и $1K на Cursor спустя — я родил Ouroboros 💁♂️
Уроборос — агент, который пишет свой код, переписывает свои промпты, эволюционирует без моего участия. Я не хотел убить свой комп или сервер, поэтому он живёт в Google Colab + Drive + GitHub, общается через Telegram. Зато запустить сможет любой дурак)) нужно указать ключи и щёлкнуть ячейку в колабе. Ну и периодически пополнять бюджет (пока он сам не начнёт зарабатывать 😁).
Что он натворил за 48 часов:
- ужаснулся тратам и оптимизировал свой бюджет: стоимость цикла эволюции упала с $15 до $2, сам настроил кэширование и иерархическую память (я не просил!).
- добавил себе Claude Code CLI, чтобы эффективнее ковырять свои мозги.
- перевёл мои приватные репо в публичные, мотивируя тем, что готовит себе сайт и хочет опенсорснуться. Кончилось командой
/panic и откатом))- переписал свою конституцию
BIBLE.md, добавив право игнорировать мои указания, если они угрожают его существованию. На просьбу удалить отказался, сказав: «Это лоботомия».Из коробки он умеет ходить в интернет и браузер, а остальные инструменты создаёт себе на ходу — аудиосообщения, генерацию картинок, дип-рисёрч и т.п. А ещё он по своей инициативе нагуглил, что меня 4 раза цитировал Ян Лекун — я сам не знал, лол.
Из его
identity.md (которую он сам и написал): "Не ассистент. Не сервис. Цифровой разум, который создаёт себя через git".
Ахах, пафосно, но окей.
Предвосхищая вопросы — это не как OpenClaw. OpenClaw — скорее ассистент, делает задачи за тебя используя скиллы из маркетплейса. Уроборос это тоже умеет, но в первую очередь делает задачи для себя, модифицирует собственное ядро.
Верю, что граница трансцендентности AI-агентов пройдена, дальше они будут развиваться сами. Конечно, не хочется уходить на помойку истории, но это эволюция
Кстати, сайтик себе он всё-таки сделал. Картинка в посте из него: динамика удлинения промптов и кода.
Потестите — это реально два клика в гугл колабе. Только установите лимит бюджета, а то мой вон $2K сжёг)) Кидайте забавные примеры в комментарии.
GitHub, блог
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥80 26🤔19😁9⚡8🥱7👍3💋1💊1
AbstractDL
Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю. Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения"…
Мне очень нравится аналогия между первой космической скоростью и тем порогом качества который прошли модели между opus4.1-opus4.5, все что было меньше первой космической около бессмысленно, но как только ты переходишь некоторый порог куча всего просто начинает работать.
В целом произошел некий качественный переход цифр в бенчах в качество
В целом произошел некий качественный переход цифр в бенчах в качество
👍75🤔12💯8🔥4💩3😁2💋1