эйай ньюз – Telegram

эйай ньюз

93.7K subscribers

1.97K photos

1.03K videos

7 files

2.31K links

Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow

Download Telegram

About

Blog

Apps

Platform

эйай ньюз

93.7K subscribers

эйай ньюз

Odysseus — ИИ-лаунчер от PewDiePie

Пьюдипай прошел основную сюжетную ветку этой жизни и собирает сайд-квесты. Сначала он научился рисовать мангу, а теперь пошел в герои опенсорс комьюнити, выкатив Odysseus — опенсорсный лаунчер для селф-хостинга нейросетей.

Из коробки UX на уровне ChatGPT или Claude, но локально и с полным контролем. Внутри куча полезных фич типа агентного режима на базе Open Code, Deep Research, Cookbook, который сам сканирует железо и качает подходящие веса, а еще минималистичный аналог фотошопа на нейростеройдах.

Большинство читающих и так всё задеплоят сами, но здесь упор именно на рядового пользователя. Правда вот не у каждого найдется свой GPU-юнит в гараже, но при желании можно юзать API любимых провайдеров, так хотя бы ваши данные хранятся локально (но не факт, т.к. вместе с запросами все будет улетать на сервера провайдеров). Доступно в опенсорсе, под MIT лицензией.

Видео релиза
Project Page
GitHub

@ai_newz

MY trillion $Dollar Project is finally OUT!

Use code PEWDIEPIE at the link below to get an exclusive 60% off an annual Incogni plan: https://incogni.com/pewdiepie
⛵ Check out Odysseus: https://pewdiepie-archdaemon.github.io/odysseus/ ⛵

🌎 Get an exclusive 15% discount on Saily data plans! Use code…

2🤩156❤76🔥41👍27😁20❤‍🔥4🦄4💔3🤯1

41.8K views16:14

эйай ньюз

Gemma 4 12B

Принимает на вход текст, аудио и изображения с видео. Длина видео ограничена 30 секундами, а аудио 60 секундами. Модель ризонер, с 256к контекста и лицензией Apache 2.0.

Самое интересное в релизе — то как в нём устроена мультимодальность. Обычно моделям для мультимодальности нужен отдельный энкодер, здесь же они обходятся простыми линейными проекциями, что требует меньше параметров и вычислений.

Техрепорта к сожалению нет, так что как они это умудрились натренировать пока непонятно. Надеюсь что его, как и старшую Gemma 4 124B, всё таки когда-то релизнут.

Веса

@ai_newz

1🔥165❤38👍34🦄12😁5🤯2🤩2⚡1🫡1

36.6K viewsedited 17:37

эйай ньюз

Microsoft опубликовали подробнейший тех-репорт о том, как они тренировали свою новую фронтир LLM с ризонингом.

На арене ее вроде пока нет, но чтиво все равно интересное. Давно таких подробных репортов с техническими деталями никто из Биг Техов не выпускал.

MAI-Thinking-1 - это 35B active / 1T total parameter MoE.

256k token window (влазит 600-страничный документ)

Тренили ее на кластере с 8000 GB200.

Упор делали больше на данные и рецепт тренировки, нежели на новшевства в архитектуре.

В опенсорс не кладут, но дадут API для файнтюна.

Блогпост
Тех-репорт

@ai_newz

Introducing MAI-Thinking-1 | Microsoft AI

❤76🔥30👍22😁5🤩5🦄5⚡2🤯2😱1

38.2K viewsedited 18:25

эйай ньюз

У SpaceX новый клиент — Google

В эту пятницу у компании IPO, так что лишняя выручка им не помешает. За аренду 110 тысяч видеокарт Blackwell они будут получать по 920 миллионов долларов в месяц, $11,6 за GPU-час. Вместе с контрактом с Anthropic на 1,25 миллиарда в месяц, это означает 26 миллиардов проецируемой выручки в год от сдачи датацентров в аренду.

Если честно то это очень дорого в пересчёте на GPU-час даже для B300. Тут как будто то бы за срочность и гигантский объем идет доплата.

@ai_newz

🤯243❤46👍28🔥17🦄9🤩3🙏2❤‍🔥1💔1

38.1K viewsedited 15:22

эйай ньюз

Нейродайджест за две недели (#118)

LLM
- Opus 4.8 — Модель стала честнее, реже срезает углы и лучше признает, если чего-то не знает. Новый low-режим иногда обгоняет старый max, а fast-версия подешевела в три раза.
- MiniMax M3 — Вышла модель M3 с миллионом токенов контекста, веса обещают на днях.
- Gemma 4 12B — Открытая мультимодальность без энкодеров. Google выкатили Gemma 4 12B. Это гибридный ризонер с 256к контекста (лицензия Apache 2.0), который ест видео, аудио и картинки через простые линейные проекции.
- MAI-Thinking-1 — Microsoft опубликовали редкий в наши дни подробный техрепорт о тренировке MAI-Thinking-1. В опенсорс не отдадут, но дадут API для файнтюна.

Генеративные модели
- Чудеса экстремальной квантизации — Стартап PrismML ужал FLUX.2 Klein 4B до 1 бита. Диффузионный трансформер теперь весит всего 930 МБ и бодро генерит картинки прямо в браузере или на iPhone.
- Легальные нейро-ремиксы и $9M инвестиций — Мои друзья из стартапа GRAI строят AI music lab. Сейчас активно хайрят ML и Research инженеров в Варшаву или на удаленку.

Прочее
- Опенсорсный ИИ-лаунчер от Пьюдипая — PewDiePie выкатил Odysseus для селф-хостинга нейросетей. UX на уровне ChatGPT, но локально: с агентным режимом, Deep Research и встроенным Cookbook.
- Новый мега-клиент датацентров SpaceX — Google будет арендовать у Маска 110 тысяч Blackwell за $920 млн в месяц. В год датацентры будут приносить Маску около $26 млрд.

> Читать дайджест #117

#дайджест
@ai_newz

❤54🔥22❤‍🔥10👍9💔3

32.4K viewsedited 20:41

эйай ньюз

Вышел Claude 5 Fable

Это общедоступная версия Mythos, в которую засунули дополнительные сейфгарды которых нет в полноценной модели. Она уже доступна в API по цене $10/$50 за миллион токенов. В подписке модель доступна до 22 июня, дальше только за кредиты.

Блогпост

@ai_newz

👍153❤49🔥43😁15💔15🤯14🦄1

35.7K views17:10

эйай ньюз

Самая неприятная деталь релиза Fable — модель резко тупеет при "использовании для разработки фронтирных моделей". Касается это не только архитектурного ресёрча и работы с датасетами, а ещё и дизайна чипов и написания кернелов и неизвестно что ещё в придачу. Для этого используют полный арсенал методов — steering векторы, переписывание промптов и даже изменение весов.

Причём в отличии от других областей, вроде биологии и кибербезопасности, где запросы прокидываются Opus 4.8, в случае с разработкой LLM факт нерфа не виден пользователю. Модель может тихо саботировать процесс разработки и об этом можно будет узнать лишь по косвенным признакам.

То, что такие меры абсолютно непрозрачные, делает модель непригодной для использования в любом ИИ ресёрче. Будут ли фильтры Антропика нерфить только разработку LLM, а пропускать генерацию изображений/видео? Почти наверняка нет. А что насчёт разработки харнесов? Проблема в том никто не может точно сказать где пролегает граница и есть ли какие-то другие, нераскрытые, ограничения.

Короче, осуждаем.

@ai_newz

😁224🤯129💔51❤28👍25💯20🫡16😱10🦄4

77.9K viewsedited 08:29

эйай ньюз

Самое ценное в современном ML это возможность поделиться своими наработками и подглядеть, а что там у других. ИИшка целиком построена на заимствовании и переопылении. Поэтому какого бы размера не был ваш проект, посещать конфы нужно в любой доступной форме. Доехать до CVPR уже не получится (уже завершилась), но вполне себе можно успеть 18-го июля попасть на Turbo ML Conf 2026 в Москве.

Орги обещают 3 потока: Fundamental Advances & Exploratory R&D,Applied ML at Scale & Business Impact, и ML Infrastructure, Platforms & Engineering Core.

Но конфах самое важное это нетворкинг. Так что ребята сделали ставку на более прикладных кейсах, чтобы у вас было больше возможностей их обсудить за чашечкой кофе или чего-то более интересного.

Конфа бесплатная, но нужно успеть зарегаться, чтобы потом не просить проходку у тимлида.

@ai_newz

1👍152😁90❤86🔥5🤯2😱2💔2🫡2❤‍🔥1

28.5K views14:46

эйай ньюз

DiffusionGemma

Google релизнули дифузионную версию геммы 26BA4B. Модель в 4 раза быстрее при таком же количестве параметров — на H100 она выдаёт 1000 токенов в секунду, а на RTX 5090 очень неплохие 700. Качество падает по сравнению с авторегрессионной моделью, но тренировать текстовую диффузию всё ещё учатся, это не удивительно. Приятно видеть что работа над диффузией для ллм не останавливается, а то демка Gemini Diffusion год назад в релиз так и не ушла.

Веса
Блогпост

@ai_newz

4❤163👍52🔥34🤯3❤‍🔥1

30.8K viewsedited 16:55

эйай ньюз

эйай ньюз

Самая неприятная деталь релиза Fable — модель резко тупеет при "использовании для разработки фронтирных моделей". Касается это не только архитектурного ресёрча и работы с датасетами, а ещё и дизайна чипов и написания кернелов и неизвестно что ещё в придачу.…

Anthropic откатывают решение о невидимой деградации Fable

В комментарии Wired представители Anthropic заявили что сделали ошибку. Компания видит это как трейдоф — невидимые ограничения сложнее обойти, из-за чего они могут нерфить лишь небольшую долю пользователей. Теперь ограничения сделают видимыми, но повысят чувствительность фильтров.

Это лютая дичь была. Надеюсь, я со своим linkedin постом тоже повлиял на то, что они дали заднюю.

@ai_newz

1👍148😁110💔14🦄9❤6❤‍🔥5🙏3

31.2K viewsedited 05:01

эйай ньюз

Да, это безумные расходы. Но не каждый пользователь так интенсивно использует подписку на тот же ChatGPT. В среднем обыватели с подпиской plus платят за подписчиков, кто выжимает все токены из плана. Да и даже среди них не все максимизмруют usage 24/7.

Кроме того в цены на API, с которыми мы тут сравниваем, заложена дикая маржа. Там точно все в хороший плюс идет.

Так что по факту картинка расходов на юзера для OpenAI и Anthropic выглядит слегка лучше, чем на скрине.

@ai_newz

Denis Sexy IT 🤖

Тут опять пересчитали сколько костов вложено в подписки OpenAI / Anthropic если пересчитать на API цены, а не цены подписок

То что OpenAI за 200$ дает еще 13800$ бесплатно, это, конечно, безумие нашего времени – никакой стартап конкурировать с таким не сможет

2❤70💯51👍30😁6🦄5🙏2❤‍🔥1

27.8K viewsedited 09:43

эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

Теперь пользователи могут сами сбрасывать лимиты Codex

Вместо глобального сброса лимитов, компания теперь будет давать возможность нажать на кнопку "сбросить лимиты" всем пользователям, которую можно будет использовать в любое удобное время в течении 30 дней. Всем был начислен один сброс лимита.

Вместе с этим OpenAI запустили реферальную акцию — каждый пользователь может пригласить до трёх друзей которые не использовали кодекс в последние два месяца и оба получат по дополнительному ресету когда приглашённый отправит первое сообщение кодексу.

Если вы хотите чтобы вас кто-то пригласил, добро пожаловать в комментарии

@ai_newz

1❤162🔥73😁52👍15🤩4💯1

27.7K views06:09

эйай ньюз

Вышла Kimi K2.7 Code

Модель одновременно лучше K2.6 в кодинге и при этом использует на 30% меньше токенов для этих результатов. Лицензия та же, модель всё ещё на триллион параметров что делает самостоятельный хостинг сложным.

Опенсорс догоняет (кек)!

Веса

@ai_newz

2❤157🔥67👍28🤩6😁3

27.3K views11:37

эйай ньюз

Второй большой открытый релиз за день — MiniMax M3

Как оказалось в модели всего 428 миллиардов параметров, при 23B активных, совсем малютка по сравнению с конкурентами. Главная инновация модели — ещё один вариант sparse attention, MSA (MiniMax Sparse Attention), который заметно эффективнее чем GQA на больших контекстах.

Кто-то будет третим?

Веса

@ai_newz

MiniMaxAI/MiniMax-M3 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

1👍94🔥28❤14

27.3K viewsedited 15:20

эйай ньюз

Anthropic закрыли доступ к Fable всем пользователям

Это результат требования правительства США закрыть доступ к Fable для всех не-граждан, включая сотрудников Anthropic. Так как у Anthropic нет системы для проверки гражданства, доступ закрыли вообще всем.

Причиной послужил частичный джейлбрейк, который позволил использование Fable для поиска уязвимостей. Найденные уязвимости довольно простые и могут быть найдены другими публично доступными моделями.

От того удастся ли Anthropic отбиться и насколько серьёзны намерения правительства зависит судьба рынка.

https://www.anthropic.com/news/fable-mythos-access

@ai_newz

Statement on the US government directive to suspend access to Fable 5 and Mythos 5

The US government has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States.

3🤯278😁108❤22🤩13🫡11💔10🦄6🔥4❤‍🔥2⚡2🙏2

38K views07:24

эйай ньюз

Нейродайджест за неделю (#119)

LLM
- Claude 5 Fable — Anthropic выкатили общедоступную версию Mythos, но с неприятным сюрпризом: модель невидимо деградировала (тупела) при запросах, связанных с разработкой AI. После сильного возмущения комьюнити (включая мой пост в LinkedIn) компания признала ошибку и пообещала сделать ограничения прозрачными. Однако затем правительство США потребовало закрыть доступ всем не-гражданам из-за джейлбрейка, и Anthropic пришлось закрыть доступ вообще всем.
- DiffusionGemma — Google выпустили диффузионную версию Gemma 26B-A4B. Модель в 4 раза быстрее авторегрессионной (1000 токенов/сек на H100), хотя качество генерации текста пока отстаёт.
- Kimi K2.7 Code — Новая открытая модель для кодинга (триллион параметров). Работает лучше K2.6, используя на 30% меньше токенов.
- Релиз весов MiniMax M3 — Модель оказалась компактнее ожидаемого (428B параметров, 23B активных). Главная фишка — новый вариант sparse attention (MSA), который эффективнее GQA на больших контекстах.

Прочее
- Ручной сброс лимитов в Codex — OpenAI заменили глобальный сброс лимитов на ручную кнопку (раз в 30 дней). Запустили реферальную программу для получения дополнительных сбросов.
- Экономика подписок AI-сервисов — Безумные расходы на активных пользователей подписок.

> Читать дайджест #118

#дайджест
@ai_newz

1❤‍🔥37👍8❤7

21.9K views05:46

эйай ньюз

Forwarded from Roman Doronin | AI for Friends

Конечно же, история умолчит о наших приключениях с Артемом на встрече в Швейцарии.
Если коротко, то все прошло отлично - обсудили важные вопросы, покатались по интересным местам, в некотором смысле положили сервера Гугла.
На выходе осталась пачка ярких воспоминаний, качественный стикерпак от GenPeach и идея для следующего поста

Кстати, как вы думаете, кто на втором фото?

❤42🔥8🦄5🤩3👍2💯1

19.9K views18:41

эйай ньюз

SpaceX всё таки решились купить Cursor

Акционеры Anysphere (разработчика Cursor) получат 60 миллиардов долларов в акциях SpaceX. Сделку хотят закончить в третьем квартале.

Последнее время сотрудники Cursor тренировали модели для кодинга на кластере SpaceX, похоже Маску нравятся результаты. Надеюсь что релиз не за горами.

@ai_newz

3🔥176🤯58❤32👍20😁11💔7🦄7😱1

15.1K views12:56