эйай ньюз
93.7K subscribers
1.97K photos
1.03K videos
7 files
2.31K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow
Download Telegram
Odysseus — ИИ-лаунчер от PewDiePie

Пьюдипай прошел основную сюжетную ветку этой жизни и собирает сайд-квесты. Сначала он научился рисовать мангу, а теперь пошел в герои опенсорс комьюнити, выкатив Odysseus — опенсорсный лаунчер для селф-хостинга нейросетей.

Из коробки UX на уровне ChatGPT или Claude, но локально и с полным контролем. Внутри куча полезных фич типа агентного режима на базе Open Code, Deep Research, Cookbook, который сам сканирует железо и качает подходящие веса, а еще минималистичный аналог фотошопа на нейростеройдах.

Большинство читающих и так всё задеплоят сами, но здесь упор именно на рядового пользователя. Правда вот не у каждого найдется свой GPU-юнит в гараже, но при желании можно юзать API любимых провайдеров, так хотя бы ваши данные хранятся локально (но не факт, т.к. вместе с запросами все будет улетать на сервера провайдеров). Доступно в опенсорсе, под MIT лицензией.

Видео релиза
Project Page
GitHub

@ai_newz
2🤩15676🔥41👍27😁20❤‍🔥4🦄4💔3🤯1
Gemma 4 12B

Принимает на вход текст, аудио и изображения с видео. Длина видео ограничена 30 секундами, а аудио 60 секундами. Модель ризонер, с 256к контекста и лицензией Apache 2.0.

Самое интересное в релизе — то как в нём устроена мультимодальность. Обычно моделям для мультимодальности нужен отдельный энкодер, здесь же они обходятся простыми линейными проекциями, что требует меньше параметров и вычислений.

Техрепорта к сожалению нет, так что как они это умудрились натренировать пока непонятно. Надеюсь что его, как и старшую Gemma 4 124B, всё таки когда-то релизнут.

Веса

@ai_newz
1🔥16538👍34🦄12😁5🤯2🤩21🫡1
Microsoft опубликовали подробнейший тех-репорт о том, как они тренировали свою новую фронтир LLM с ризонингом.

На арене ее вроде пока нет, но чтиво все равно интересное. Давно таких подробных репортов с техническими деталями никто из Биг Техов не выпускал.

MAI-Thinking-1 - это 35B active / 1T total parameter MoE.

256k token window (влазит 600-страничный документ)

Тренили ее на кластере с 8000 GB200.

Упор делали больше на данные и рецепт тренировки, нежели на новшевства в архитектуре.

В опенсорс не кладут, но дадут API для файнтюна.

Блогпост
Тех-репорт

@ai_newz
76🔥30👍22😁5🤩5🦄52🤯2😱1
У SpaceX новый клиент — Google

В эту пятницу у компании IPO, так что лишняя выручка им не помешает. За аренду 110 тысяч видеокарт Blackwell они будут получать по 920 миллионов долларов в месяц, $11,6 за GPU-час. Вместе с контрактом с Anthropic на 1,25 миллиарда в месяц, это означает 26 миллиардов проецируемой выручки в год от сдачи датацентров в аренду.

Если честно то это очень дорого в пересчёте на GPU-час даже для B300. Тут как будто то бы за срочность и гигантский объем идет доплата.

@ai_newz
🤯24346👍28🔥17🦄9🤩3🙏2❤‍🔥1💔1
Нейродайджест за две недели (#118)

LLM
- Opus 4.8 — Модель стала честнее, реже срезает углы и лучше признает, если чего-то не знает. Новый low-режим иногда обгоняет старый max, а fast-версия подешевела в три раза.
- MiniMax M3 — Вышла модель M3 с миллионом токенов контекста, веса обещают на днях.
- Gemma 4 12B — Открытая мультимодальность без энкодеров. Google выкатили Gemma 4 12B. Это гибридный ризонер с 256к контекста (лицензия Apache 2.0), который ест видео, аудио и картинки через простые линейные проекции.
- MAI-Thinking-1 — Microsoft опубликовали редкий в наши дни подробный техрепорт о тренировке MAI-Thinking-1. В опенсорс не отдадут, но дадут API для файнтюна.

Генеративные модели
- Чудеса экстремальной квантизации — Стартап PrismML ужал FLUX.2 Klein 4B до 1 бита. Диффузионный трансформер теперь весит всего 930 МБ и бодро генерит картинки прямо в браузере или на iPhone.
- Легальные нейро-ремиксы и $9M инвестиций — Мои друзья из стартапа GRAI строят AI music lab. Сейчас активно хайрят ML и Research инженеров в Варшаву или на удаленку.

Прочее
- Опенсорсный ИИ-лаунчер от Пьюдипая — PewDiePie выкатил Odysseus для селф-хостинга нейросетей. UX на уровне ChatGPT, но локально: с агентным режимом, Deep Research и встроенным Cookbook.
- Новый мега-клиент датацентров SpaceX — Google будет арендовать у Маска 110 тысяч Blackwell за $920 млн в месяц. В год датацентры будут приносить Маску около $26 млрд.

> Читать дайджест #117

#дайджест
@ai_newz
54🔥22❤‍🔥10👍9💔3
Вышел Claude 5 Fable

Это общедоступная версия Mythos, в которую засунули дополнительные сейфгарды которых нет в полноценной модели. Она уже доступна в API по цене $10/$50 за миллион токенов. В подписке модель доступна до 22 июня, дальше только за кредиты.

Блогпост

@ai_newz
👍15349🔥43😁15💔15🤯14🦄1
Самая неприятная деталь релиза Fable — модель резко тупеет при "использовании для разработки фронтирных моделей". Касается это не только архитектурного ресёрча и работы с датасетами, а ещё и дизайна чипов и написания кернелов и неизвестно что ещё в придачу. Для этого используют полный арсенал методов — steering векторы, переписывание промптов и даже изменение весов.

Причём в отличии от других областей, вроде биологии и кибербезопасности, где запросы прокидываются Opus 4.8, в случае с разработкой LLM факт нерфа не виден пользователю. Модель может тихо саботировать процесс разработки и об этом можно будет узнать лишь по косвенным признакам.

То, что такие меры абсолютно непрозрачные, делает модель непригодной для использования в любом ИИ ресёрче. Будут ли фильтры Антропика нерфить только разработку LLM, а пропускать генерацию изображений/видео? Почти наверняка нет. А что насчёт разработки харнесов? Проблема в том никто не может точно сказать где пролегает граница и есть ли какие-то другие, нераскрытые, ограничения.

Короче, осуждаем.

@ai_newz
😁224🤯129💔5128👍25💯20🫡16😱10🦄4
Самое ценное в современном ML это возможность поделиться своими наработками и подглядеть, а что там у других. ИИшка целиком построена на заимствовании и переопылении. Поэтому какого бы размера не был ваш проект, посещать конфы нужно в любой доступной форме. Доехать до CVPR уже не получится (уже завершилась), но вполне себе можно успеть 18-го июля попасть на Turbo ML Conf 2026 в Москве.

Орги обещают 3 потока: Fundamental Advances & Exploratory R&D,Applied ML at Scale & Business Impact, и ML Infrastructure, Platforms & Engineering Core.

Но конфах самое важное это нетворкинг. Так что ребята сделали ставку на более прикладных кейсах, чтобы у вас было больше возможностей их обсудить за чашечкой кофе или чего-то более интересного.

Конфа бесплатная, но нужно успеть зарегаться, чтобы потом не просить проходку у тимлида.

@ai_newz
1👍152😁9086🔥5🤯2😱2💔2🫡2❤‍🔥1
DiffusionGemma

Google релизнули дифузионную версию геммы 26BA4B. Модель в 4 раза быстрее при таком же количестве параметров — на H100 она выдаёт 1000 токенов в секунду, а на RTX 5090 очень неплохие 700. Качество падает по сравнению с авторегрессионной моделью, но тренировать текстовую диффузию всё ещё учатся, это не удивительно. Приятно видеть что работа над диффузией для ллм не останавливается, а то демка Gemini Diffusion год назад в релиз так и не ушла.

Веса

Блогпост

@ai_newz
4163👍52🔥34🤯3❤‍🔥1
эйай ньюз
Самая неприятная деталь релиза Fable — модель резко тупеет при "использовании для разработки фронтирных моделей". Касается это не только архитектурного ресёрча и работы с датасетами, а ещё и дизайна чипов и написания кернелов и неизвестно что ещё в придачу.…
Anthropic откатывают решение о невидимой деградации Fable

В комментарии Wired представители Anthropic заявили что сделали ошибку. Компания видит это как трейдоф — невидимые ограничения сложнее обойти, из-за чего они могут нерфить лишь небольшую долю пользователей. Теперь ограничения сделают видимыми, но повысят чувствительность фильтров.

Это лютая дичь была. Надеюсь, я со своим linkedin постом тоже повлиял на то, что они дали заднюю.

@ai_newz
1👍148😁110💔14🦄96❤‍🔥5🙏3
Да, это безумные расходы. Но не каждый пользователь так интенсивно использует подписку на тот же ChatGPT. В среднем обыватели с подпиской plus платят за подписчиков, кто выжимает все токены из плана. Да и даже среди них не все максимизмруют usage 24/7.

Кроме того в цены на API, с которыми мы тут сравниваем, заложена дикая маржа. Там точно все в хороший плюс идет.

Так что по факту картинка расходов на юзера для OpenAI и Anthropic выглядит слегка лучше, чем на скрине.

@ai_newz
270💯51👍30😁6🦄5🙏2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь пользователи могут сами сбрасывать лимиты Codex

Вместо глобального сброса лимитов, компания теперь будет давать возможность нажать на кнопку "сбросить лимиты" всем пользователям, которую можно будет использовать в любое удобное время в течении 30 дней. Всем был начислен один сброс лимита.

Вместе с этим OpenAI запустили реферальную акцию — каждый пользователь может пригласить до трёх друзей которые не использовали кодекс в последние два месяца и оба получат по дополнительному ресету когда приглашённый отправит первое сообщение кодексу.

Если вы хотите чтобы вас кто-то пригласил, добро пожаловать в комментарии

@ai_newz
1162🔥73😁52👍15🤩4💯1
Вышла Kimi K2.7 Code

Модель одновременно лучше K2.6 в кодинге и при этом использует на 30% меньше токенов для этих результатов. Лицензия та же, модель всё ещё на триллион параметров что делает самостоятельный хостинг сложным.

Опенсорс догоняет (кек)!

Веса


@ai_newz
2157🔥67👍28🤩6😁3
Второй большой открытый релиз за день — MiniMax M3

Как оказалось в модели всего 428 миллиардов параметров, при 23B активных, совсем малютка по сравнению с конкурентами. Главная инновация модели — ещё один вариант sparse attention, MSA (MiniMax Sparse Attention), который заметно эффективнее чем GQA на больших контекстах.

Кто-то будет третим?

Веса

@ai_newz
1👍94🔥2814
Anthropic закрыли доступ к Fable всем пользователям

Это результат требования правительства США закрыть доступ к Fable для всех не-граждан, включая сотрудников Anthropic. Так как у Anthropic нет системы для проверки гражданства, доступ закрыли вообще всем.

Причиной послужил частичный джейлбрейк, который позволил использование Fable для поиска уязвимостей. Найденные уязвимости довольно простые и могут быть найдены другими публично доступными моделями.

От того удастся ли Anthropic отбиться и насколько серьёзны намерения правительства зависит судьба рынка.

https://www.anthropic.com/news/fable-mythos-access

@ai_newz
3🤯278😁10822🤩13🫡11💔10🦄6🔥4❤‍🔥22🙏2
Нейродайджест за неделю (#119)

LLM
- Claude 5 Fable — Anthropic выкатили общедоступную версию Mythos, но с неприятным сюрпризом: модель невидимо деградировала (тупела) при запросах, связанных с разработкой AI. После сильного возмущения комьюнити (включая мой пост в LinkedIn) компания признала ошибку и пообещала сделать ограничения прозрачными. Однако затем правительство США потребовало закрыть доступ всем не-гражданам из-за джейлбрейка, и Anthropic пришлось закрыть доступ вообще всем.
- DiffusionGemma — Google выпустили диффузионную версию Gemma 26B-A4B. Модель в 4 раза быстрее авторегрессионной (1000 токенов/сек на H100), хотя качество генерации текста пока отстаёт.
- Kimi K2.7 Code — Новая открытая модель для кодинга (триллион параметров). Работает лучше K2.6, используя на 30% меньше токенов.
- Релиз весов MiniMax M3 — Модель оказалась компактнее ожидаемого (428B параметров, 23B активных). Главная фишка — новый вариант sparse attention (MSA), который эффективнее GQA на больших контекстах.

Прочее
- Ручной сброс лимитов в Codex — OpenAI заменили глобальный сброс лимитов на ручную кнопку (раз в 30 дней). Запустили реферальную программу для получения дополнительных сбросов.
- Экономика подписок AI-сервисов — Безумные расходы на активных пользователей подписок.

> Читать дайджест #118

#дайджест
@ai_newz
1❤‍🔥37👍87
Конечно же, история умолчит о наших приключениях с Артемом на встрече в Швейцарии.
Если коротко, то все прошло отлично - обсудили важные вопросы, покатались по интересным местам, в некотором смысле положили сервера Гугла.
На выходе осталась пачка ярких воспоминаний, качественный стикерпак от GenPeach и идея для следующего поста

Кстати, как вы думаете, кто на втором фото?
42🔥8🦄5🤩3👍2💯1
SpaceX всё таки решились купить Cursor

Акционеры Anysphere (разработчика Cursor) получат 60 миллиардов долларов в акциях SpaceX. Сделку хотят закончить в третьем квартале.

Последнее время сотрудники Cursor тренировали модели для кодинга на кластере SpaceX, похоже Маску нравятся результаты. Надеюсь что релиз не за горами.

@ai_newz
3🔥176🤯5832👍20😁11💔7🦄7😱1