Love. Death. Transformers.
Эпоха self improving agents на подходе челы гоняли свой авторесерч на параметр гольфе и в среднем находили штуки ккоторые либо значительно улучшали паблик скор либо рекордом становились на некоторое время https://www.weco.ai/blog/parameter-golf-aiden
Anthropic
When AI builds itself
Our progress toward recursive self-improvement, and its implications.
❤🔥13💋8👍4🔥4🗿2💩1
Forwarded from Generative Anton
UK_army_leadership.pdf
4.1 MB
Кстати. Одна из лучших вещей, которые можно прочитать про leadership и как управлять командой — методичка армии UK. Сильно рекомендую.
😁68🫡22🤷♀4💩3🤔2🤷2🤷♂1👍1🔥1🐳1
Love. Death. Transformers.
https://www.anthropic.com/institute/recursive-self-improvement
Бтв принципиальный ответ на вопрос "будет ли средний подписчик этого канала безработным через пару лет" кроется в ответе на вопрос: там sigmoid или log curve и насколько быстро оно проникнет
👍41😁40😭7🔥3💩1💅1
Forwarded from КПД
Неожиданный опенсорс от Ideogram - Ideogram-4.
Чекпоинты прилагаются в fp8 и nf4 форматах.
Утверждается, что оно state-of-the-art среди open-source моделей и не сильно уступает ведущим closed-source. При этом размер модели вообще не огромный - всего 9.3B параметров (то есть превосходит куда более увесистые модели типа Flux-2-dev, Hunyuan-Image-3 и Qwen-Image).
Архитектурно - single-stream DiT с Qwen-3-VL-Instruct энкодером.
Еще из примечательного - учатся и инферятся на структурированных JSON кэпшенах.
Лицензия, правда, некоммерческая.
[Блогпост]
Чекпоинты прилагаются в fp8 и nf4 форматах.
Утверждается, что оно state-of-the-art среди open-source моделей и не сильно уступает ведущим closed-source. При этом размер модели вообще не огромный - всего 9.3B параметров (то есть превосходит куда более увесистые модели типа Flux-2-dev, Hunyuan-Image-3 и Qwen-Image).
Архитектурно - single-stream DiT с Qwen-3-VL-Instruct энкодером.
Еще из примечательного - учатся и инферятся на структурированных JSON кэпшенах.
Лицензия, правда, некоммерческая.
[Блогпост]
🤔28🔥13🤡3
Please open Telegram to view this post
VIEW IN TELEGRAM
🗿33🔥5👍3🙉1
Forwarded from Al Talent Hub
Через 3 дня заканчивается прием заявок на 1 волну конкурса Junior ML Contest, а ты еще не загрузил свой проект на платформу?
Рассказали как это исправить в карточках выше
➡️ Сайт JMLC для подачи заявки➡️ Платформа Talent Track для загрузки проекта
Если у тебя остались вопросы — пиши в чат абитуриентов, мы обязательно ответим!
А еще больше важных дат ищи в нашем календаре абитуриента
🏆 — как же я крут, уже все загрузил
@aitalenthubnews
#ITMO #NapoleonIT
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡31👍20😁16❤🔥15 12🔥8💩4💊1
* мне за это не платили
** я сам закончил эту магу
*** субьективно - единсвтенная мага в россии которую имеет смысл поступать и заканчивать в текущих реалиях, есть курсы шада, есть неплохие курсы с КТ по c++ и opencl, можно и нужно писать статьи на конфы, если поднапрячься - можно 2-3 статьи на workshop написать за время обучения + есть отсрочка И возможность учится удаленно
** я сам закончил эту магу
*** субьективно - единсвтенная мага в россии которую имеет смысл поступать и заканчивать в текущих реалиях, есть курсы шада, есть неплохие курсы с КТ по c++ и opencl, можно и нужно писать статьи на конфы, если поднапрячься - можно 2-3 статьи на workshop написать за время обучения + есть отсрочка И возможность учится удаленно
Я согласен что работа стала смещаться вче больше в сторону способности находить точки куда можно приложить автохарнесс и получить результат.
Скоро выложу своиубыточные b2b Ai saas стартап. Прикольные штуки и расскажу о них, наконец мои древние v100 и амперы крутятся 24/7 и делают что то полезное (хоть и ооочень медленно)
А пока вот мой скилл который крутит задачи для меня:
https://github.com/AlexWortega/claude-autoresearch-skill
(Он иногда способен бороться с ленью/слопом опуса 4.8)
Скоро выложу свои
А пока вот мой скилл который крутит задачи для меня:
https://github.com/AlexWortega/claude-autoresearch-skill
(Он иногда способен бороться с ленью/слопом опуса 4.8)
Я не понимаю этого прикола постить читшиты по темам, ну выучат челы базовые "сложные" вопросы и потом завалят на подумать, все равно понимания не прибавится. Но китайцам респект в любом случае.
k-a.in/rl-algo.html
k-a.in/rl-algo.html
🤔46🤓10👍5🔥3🥴1
https://arxiv.org/pdf/2507.21509 - помните как все смеляись над этим парнем?
Теперь он пришел мстить.
Теперь он пришел мстить.
😁73🗿5👍2🤡2🔥1
GPU без танцев с инфраструктурой
На infra.conf Яндекс рассказал про Dev Cluster — сервис для динамического распределения GPU-ресурсов. Решение позволяет ML-инженерам за несколько кликов получать готовые конфигурации для обучения моделей и тестирования гипотез без сложной настройки инфраструктуры.
Сервис помогает эффективнее использовать вычислительные ресурсы, сокращает простои GPU и ускоряет проведение экспериментов, что способствует более быстрому выводу ML-продуктов на рынок.
Подробнее на CNews.
На infra.conf Яндекс рассказал про Dev Cluster — сервис для динамического распределения GPU-ресурсов. Решение позволяет ML-инженерам за несколько кликов получать готовые конфигурации для обучения моделей и тестирования гипотез без сложной настройки инфраструктуры.
Сервис помогает эффективнее использовать вычислительные ресурсы, сокращает простои GPU и ускоряет проведение экспериментов, что способствует более быстрому выводу ML-продуктов на рынок.
Подробнее на CNews.
infra.yandex.ru
Как мы с помощью Dev Cluster шерим GPU между ML-специалистами
Рассказываем о Dev Cluster — новом инструменте, с помощью которого можно удобно распределять ресурс GPU между ML-инженерами Яндекса.
💩67🤡32🔥13 9💊7👍6👏2🍓2💅2 2