Odysseus — ИИ-лаунчер от PewDiePie
Пьюдипай прошел основную сюжетную ветку этой жизни и собирает сайд-квесты. Сначала он научился рисовать мангу, а теперь пошел в герои опенсорс комьюнити, выкатив Odysseus — опенсорсный лаунчер для селф-хостинга нейросетей.
Из коробки UX на уровне ChatGPT или Claude, но локально и с полным контролем. Внутри куча полезных фич типа агентного режима на базе Open Code, Deep Research, Cookbook, который сам сканирует железо и качает подходящие веса, а еще минималистичный аналог фотошопа на нейростеройдах.
Большинство читающих и так всё задеплоят сами, но здесь упор именно на рядового пользователя. Правда вот не у каждого найдется свой GPU-юнит в гараже, но при желании можно юзать API любимых провайдеров, так хотя бы ваши данные хранятся локально (но не факт, т.к. вместе с запросами все будет улетать на сервера провайдеров). Доступно в опенсорсе, под MIT лицензией.
Видео релиза
Project Page
GitHub
@ai_newz
Пьюдипай прошел основную сюжетную ветку этой жизни и собирает сайд-квесты. Сначала он научился рисовать мангу, а теперь пошел в герои опенсорс комьюнити, выкатив Odysseus — опенсорсный лаунчер для селф-хостинга нейросетей.
Из коробки UX на уровне ChatGPT или Claude, но локально и с полным контролем. Внутри куча полезных фич типа агентного режима на базе Open Code, Deep Research, Cookbook, который сам сканирует железо и качает подходящие веса, а еще минималистичный аналог фотошопа на нейростеройдах.
Большинство читающих и так всё задеплоят сами, но здесь упор именно на рядового пользователя. Правда вот не у каждого найдется свой GPU-юнит в гараже, но при желании можно юзать API любимых провайдеров, так хотя бы ваши данные хранятся локально (но не факт, т.к. вместе с запросами все будет улетать на сервера провайдеров). Доступно в опенсорсе, под MIT лицензией.
Видео релиза
Project Page
GitHub
@ai_newz
YouTube
MY trillion $Dollar Project is finally OUT!
Use code PEWDIEPIE at the link below to get an exclusive 60% off an annual Incogni plan: https://incogni.com/pewdiepie
⛵ Check out Odysseus: https://pewdiepie-archdaemon.github.io/odysseus/ ⛵
🌎 Get an exclusive 15% discount on Saily data plans! Use code…
⛵ Check out Odysseus: https://pewdiepie-archdaemon.github.io/odysseus/ ⛵
🌎 Get an exclusive 15% discount on Saily data plans! Use code…
2🤩156❤76🔥41👍27😁20❤🔥4🦄4💔3🤯1
Gemma 4 12B
Принимает на вход текст, аудио и изображения с видео. Длина видео ограничена 30 секундами, а аудио 60 секундами. Модель ризонер, с 256к контекста и лицензией Apache 2.0.
Самое интересное в релизе — то как в нём устроена мультимодальность. Обычно моделям для мультимодальности нужен отдельный энкодер, здесь же они обходятся простыми линейными проекциями, что требует меньше параметров и вычислений.
Техрепорта к сожалению нет, так что как они это умудрились натренировать пока непонятно. Надеюсь что его, как и старшую Gemma 4 124B, всё таки когда-то релизнут.
Веса
@ai_newz
Принимает на вход текст, аудио и изображения с видео. Длина видео ограничена 30 секундами, а аудио 60 секундами. Модель ризонер, с 256к контекста и лицензией Apache 2.0.
Самое интересное в релизе — то как в нём устроена мультимодальность. Обычно моделям для мультимодальности нужен отдельный энкодер, здесь же они обходятся простыми линейными проекциями, что требует меньше параметров и вычислений.
Техрепорта к сожалению нет, так что как они это умудрились натренировать пока непонятно. Надеюсь что его, как и старшую Gemma 4 124B, всё таки когда-то релизнут.
Веса
@ai_newz
1🔥165❤38👍34🦄12😁5🤯2🤩2⚡1🫡1
Microsoft опубликовали подробнейший тех-репорт о том, как они тренировали свою новую фронтир LLM с ризонингом.
На арене ее вроде пока нет, но чтиво все равно интересное. Давно таких подробных репортов с техническими деталями никто из Биг Техов не выпускал.
MAI-Thinking-1 - это 35B active / 1T total parameter MoE.
256k token window (влазит 600-страничный документ)
Тренили ее на кластере с 8000 GB200.
Упор делали больше на данные и рецепт тренировки, нежели на новшевства в архитектуре.
В опенсорс не кладут, но дадут API для файнтюна.
Блогпост
Тех-репорт
@ai_newz
На арене ее вроде пока нет, но чтиво все равно интересное. Давно таких подробных репортов с техническими деталями никто из Биг Техов не выпускал.
MAI-Thinking-1 - это 35B active / 1T total parameter MoE.
256k token window (влазит 600-страничный документ)
Тренили ее на кластере с 8000 GB200.
Упор делали больше на данные и рецепт тренировки, нежели на новшевства в архитектуре.
В опенсорс не кладут, но дадут API для файнтюна.
Блогпост
Тех-репорт
@ai_newz
Microsoft AI
Introducing MAI-Thinking-1 | Microsoft AI
❤76🔥30👍22😁5🤩5🦄5⚡2🤯2😱1
У SpaceX новый клиент — Google
В эту пятницу у компании IPO, так что лишняя выручка им не помешает. За аренду 110 тысяч видеокарт Blackwell они будут получать по 920 миллионов долларов в месяц, $11,6 за GPU-час. Вместе с контрактом с Anthropic на 1,25 миллиарда в месяц, это означает 26 миллиардов проецируемой выручки в год от сдачи датацентров в аренду.
Если честно то это очень дорого в пересчёте на GPU-час даже для B300. Тут как будто то бы за срочность и гигантский объем идет доплата.
@ai_newz
В эту пятницу у компании IPO, так что лишняя выручка им не помешает. За аренду 110 тысяч видеокарт Blackwell они будут получать по 920 миллионов долларов в месяц, $11,6 за GPU-час. Вместе с контрактом с Anthropic на 1,25 миллиарда в месяц, это означает 26 миллиардов проецируемой выручки в год от сдачи датацентров в аренду.
Если честно то это очень дорого в пересчёте на GPU-час даже для B300. Тут как будто то бы за срочность и гигантский объем идет доплата.
@ai_newz
🤯243❤46👍28🔥17🦄9🤩3🙏2❤🔥1💔1
Нейродайджест за две недели (#118)
LLM
- Opus 4.8 — Модель стала честнее, реже срезает углы и лучше признает, если чего-то не знает. Новый low-режим иногда обгоняет старый max, а fast-версия подешевела в три раза.
- MiniMax M3 — Вышла модель M3 с миллионом токенов контекста, веса обещают на днях.
- Gemma 4 12B — Открытая мультимодальность без энкодеров. Google выкатили Gemma 4 12B. Это гибридный ризонер с 256к контекста (лицензия Apache 2.0), который ест видео, аудио и картинки через простые линейные проекции.
- MAI-Thinking-1 — Microsoft опубликовали редкий в наши дни подробный техрепорт о тренировке MAI-Thinking-1. В опенсорс не отдадут, но дадут API для файнтюна.
Генеративные модели
- Чудеса экстремальной квантизации — Стартап PrismML ужал FLUX.2 Klein 4B до 1 бита. Диффузионный трансформер теперь весит всего 930 МБ и бодро генерит картинки прямо в браузере или на iPhone.
- Легальные нейро-ремиксы и $9M инвестиций — Мои друзья из стартапа GRAI строят AI music lab. Сейчас активно хайрят ML и Research инженеров в Варшаву или на удаленку.
Прочее
- Опенсорсный ИИ-лаунчер от Пьюдипая — PewDiePie выкатил Odysseus для селф-хостинга нейросетей. UX на уровне ChatGPT, но локально: с агентным режимом, Deep Research и встроенным Cookbook.
- Новый мега-клиент датацентров SpaceX — Google будет арендовать у Маска 110 тысяч Blackwell за $920 млн в месяц. В год датацентры будут приносить Маску около $26 млрд.
> Читать дайджест #117
#дайджест
@ai_newz
LLM
- Opus 4.8 — Модель стала честнее, реже срезает углы и лучше признает, если чего-то не знает. Новый low-режим иногда обгоняет старый max, а fast-версия подешевела в три раза.
- MiniMax M3 — Вышла модель M3 с миллионом токенов контекста, веса обещают на днях.
- Gemma 4 12B — Открытая мультимодальность без энкодеров. Google выкатили Gemma 4 12B. Это гибридный ризонер с 256к контекста (лицензия Apache 2.0), который ест видео, аудио и картинки через простые линейные проекции.
- MAI-Thinking-1 — Microsoft опубликовали редкий в наши дни подробный техрепорт о тренировке MAI-Thinking-1. В опенсорс не отдадут, но дадут API для файнтюна.
Генеративные модели
- Чудеса экстремальной квантизации — Стартап PrismML ужал FLUX.2 Klein 4B до 1 бита. Диффузионный трансформер теперь весит всего 930 МБ и бодро генерит картинки прямо в браузере или на iPhone.
- Легальные нейро-ремиксы и $9M инвестиций — Мои друзья из стартапа GRAI строят AI music lab. Сейчас активно хайрят ML и Research инженеров в Варшаву или на удаленку.
Прочее
- Опенсорсный ИИ-лаунчер от Пьюдипая — PewDiePie выкатил Odysseus для селф-хостинга нейросетей. UX на уровне ChatGPT, но локально: с агентным режимом, Deep Research и встроенным Cookbook.
- Новый мега-клиент датацентров SpaceX — Google будет арендовать у Маска 110 тысяч Blackwell за $920 млн в месяц. В год датацентры будут приносить Маску около $26 млрд.
> Читать дайджест #117
#дайджест
@ai_newz
❤54🔥22❤🔥10👍9💔3
Самая неприятная деталь релиза Fable — модель резко тупеет при "использовании для разработки фронтирных моделей". Касается это не только архитектурного ресёрча и работы с датасетами, а ещё и дизайна чипов и написания кернелов и неизвестно что ещё в придачу. Для этого используют полный арсенал методов — steering векторы, переписывание промптов и даже изменение весов.
Причём в отличии от других областей, вроде биологии и кибербезопасности, где запросы прокидываются Opus 4.8, в случае с разработкой LLM факт нерфа не виден пользователю. Модель может тихо саботировать процесс разработки и об этом можно будет узнать лишь по косвенным признакам.
То, что такие меры абсолютно непрозрачные, делает модель непригодной для использования в любом ИИ ресёрче. Будут ли фильтры Антропика нерфить только разработку LLM, а пропускать генерацию изображений/видео? Почти наверняка нет. А что насчёт разработки харнесов? Проблема в том никто не может точно сказать где пролегает граница и есть ли какие-то другие, нераскрытые, ограничения.
Короче, осуждаем.
@ai_newz
Причём в отличии от других областей, вроде биологии и кибербезопасности, где запросы прокидываются Opus 4.8, в случае с разработкой LLM факт нерфа не виден пользователю. Модель может тихо саботировать процесс разработки и об этом можно будет узнать лишь по косвенным признакам.
То, что такие меры абсолютно непрозрачные, делает модель непригодной для использования в любом ИИ ресёрче. Будут ли фильтры Антропика нерфить только разработку LLM, а пропускать генерацию изображений/видео? Почти наверняка нет. А что насчёт разработки харнесов? Проблема в том никто не может точно сказать где пролегает граница и есть ли какие-то другие, нераскрытые, ограничения.
Короче, осуждаем.
@ai_newz
😁224🤯129💔51❤28👍25💯20🫡16😱10🦄4
Самое ценное в современном ML это возможность поделиться своими наработками и подглядеть, а что там у других. ИИшка целиком построена на заимствовании и переопылении. Поэтому какого бы размера не был ваш проект, посещать конфы нужно в любой доступной форме. Доехать до CVPR уже не получится (уже завершилась), но вполне себе можно успеть 18-го июля попасть на Turbo ML Conf 2026 в Москве.
Орги обещают 3 потока: Fundamental Advances & Exploratory R&D,Applied ML at Scale & Business Impact, и ML Infrastructure, Platforms & Engineering Core.
Но конфах самое важное это нетворкинг. Так что ребята сделали ставку на более прикладных кейсах, чтобы у вас было больше возможностей их обсудить за чашечкой кофе или чего-то более интересного.
Конфа бесплатная, но нужно успеть зарегаться, чтобы потом не просить проходку у тимлида.
@ai_newz
Орги обещают 3 потока: Fundamental Advances & Exploratory R&D,Applied ML at Scale & Business Impact, и ML Infrastructure, Platforms & Engineering Core.
Но конфах самое важное это нетворкинг. Так что ребята сделали ставку на более прикладных кейсах, чтобы у вас было больше возможностей их обсудить за чашечкой кофе или чего-то более интересного.
Конфа бесплатная, но нужно успеть зарегаться, чтобы потом не просить проходку у тимлида.
@ai_newz
1👍152😁90❤86🔥5🤯2😱2💔2🫡2❤🔥1
DiffusionGemma
Google релизнули дифузионную версию геммы 26BA4B. Модель в 4 раза быстрее при таком же количестве параметров — на H100 она выдаёт 1000 токенов в секунду, а на RTX 5090 очень неплохие 700. Качество падает по сравнению с авторегрессионной моделью, но тренировать текстовую диффузию всё ещё учатся, это не удивительно. Приятно видеть что работа над диффузией для ллм не останавливается, а то демка Gemini Diffusion год назад в релиз так и не ушла.
Веса
Блогпост
@ai_newz
Google релизнули дифузионную версию геммы 26BA4B. Модель в 4 раза быстрее при таком же количестве параметров — на H100 она выдаёт 1000 токенов в секунду, а на RTX 5090 очень неплохие 700. Качество падает по сравнению с авторегрессионной моделью, но тренировать текстовую диффузию всё ещё учатся, это не удивительно. Приятно видеть что работа над диффузией для ллм не останавливается, а то демка Gemini Diffusion год назад в релиз так и не ушла.
Веса
Блогпост
@ai_newz
4❤163👍52🔥34🤯3❤🔥1
эйай ньюз
Самая неприятная деталь релиза Fable — модель резко тупеет при "использовании для разработки фронтирных моделей". Касается это не только архитектурного ресёрча и работы с датасетами, а ещё и дизайна чипов и написания кернелов и неизвестно что ещё в придачу.…
Anthropic откатывают решение о невидимой деградации Fable
В комментарии Wired представители Anthropic заявили что сделали ошибку. Компания видит это как трейдоф — невидимые ограничения сложнее обойти, из-за чего они могут нерфить лишь небольшую долю пользователей. Теперь ограничения сделают видимыми, но повысят чувствительность фильтров.
Это лютая дичь была. Надеюсь, я со своим linkedin постом тоже повлиял на то, что они дали заднюю.
@ai_newz
В комментарии Wired представители Anthropic заявили что сделали ошибку. Компания видит это как трейдоф — невидимые ограничения сложнее обойти, из-за чего они могут нерфить лишь небольшую долю пользователей. Теперь ограничения сделают видимыми, но повысят чувствительность фильтров.
Это лютая дичь была. Надеюсь, я со своим linkedin постом тоже повлиял на то, что они дали заднюю.
@ai_newz
1👍148😁110💔14🦄9❤6❤🔥5🙏3
Да, это безумные расходы. Но не каждый пользователь так интенсивно использует подписку на тот же ChatGPT. В среднем обыватели с подпиской plus платят за подписчиков, кто выжимает все токены из плана. Да и даже среди них не все максимизмруют usage 24/7.
Кроме того в цены на API, с которыми мы тут сравниваем, заложена дикая маржа. Там точно все в хороший плюс идет.
Так что по факту картинка расходов на юзера для OpenAI и Anthropic выглядит слегка лучше, чем на скрине.
@ai_newz
Кроме того в цены на API, с которыми мы тут сравниваем, заложена дикая маржа. Там точно все в хороший плюс идет.
Так что по факту картинка расходов на юзера для OpenAI и Anthropic выглядит слегка лучше, чем на скрине.
@ai_newz
Telegram
Denis Sexy IT 🤖
Тут опять пересчитали сколько костов вложено в подписки OpenAI / Anthropic если пересчитать на API цены, а не цены подписок
То что OpenAI за 200$ дает еще 13800$ бесплатно, это, конечно, безумие нашего времени – никакой стартап конкурировать с таким не сможет
То что OpenAI за 200$ дает еще 13800$ бесплатно, это, конечно, безумие нашего времени – никакой стартап конкурировать с таким не сможет
2❤70💯51👍30😁6🦄5🙏2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь пользователи могут сами сбрасывать лимиты Codex
Вместо глобального сброса лимитов, компания теперь будет давать возможность нажать на кнопку "сбросить лимиты" всем пользователям, которую можно будет использовать в любое удобное время в течении 30 дней. Всем был начислен один сброс лимита.
Вместе с этим OpenAI запустили реферальную акцию — каждый пользователь может пригласить до трёх друзей которые не использовали кодекс в последние два месяца и оба получат по дополнительному ресету когда приглашённый отправит первое сообщение кодексу.
Если вы хотите чтобы вас кто-то пригласил, добро пожаловать в комментарии
@ai_newz
Вместо глобального сброса лимитов, компания теперь будет давать возможность нажать на кнопку "сбросить лимиты" всем пользователям, которую можно будет использовать в любое удобное время в течении 30 дней. Всем был начислен один сброс лимита.
Вместе с этим OpenAI запустили реферальную акцию — каждый пользователь может пригласить до трёх друзей которые не использовали кодекс в последние два месяца и оба получат по дополнительному ресету когда приглашённый отправит первое сообщение кодексу.
Если вы хотите чтобы вас кто-то пригласил, добро пожаловать в комментарии
@ai_newz
1❤162🔥73😁52👍15🤩4💯1
Второй большой открытый релиз за день — MiniMax M3
Как оказалось в модели всего 428 миллиардов параметров, при 23B активных, совсем малютка по сравнению с конкурентами. Главная инновация модели — ещё один вариант sparse attention, MSA (MiniMax Sparse Attention), который заметно эффективнее чем GQA на больших контекстах.
Кто-то будет третим?
Веса
@ai_newz
Как оказалось в модели всего 428 миллиардов параметров, при 23B активных, совсем малютка по сравнению с конкурентами. Главная инновация модели — ещё один вариант sparse attention, MSA (MiniMax Sparse Attention), который заметно эффективнее чем GQA на больших контекстах.
Кто-то будет третим?
Веса
@ai_newz
huggingface.co
MiniMaxAI/MiniMax-M3 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
1👍94🔥28❤14
Anthropic закрыли доступ к Fable всем пользователям
Это результат требования правительства США закрыть доступ к Fable для всех не-граждан, включая сотрудников Anthropic. Так как у Anthropic нет системы для проверки гражданства, доступ закрыли вообще всем.
Причиной послужил частичный джейлбрейк, который позволил использование Fable для поиска уязвимостей. Найденные уязвимости довольно простые и могут быть найдены другими публично доступными моделями.
От того удастся ли Anthropic отбиться и насколько серьёзны намерения правительства зависит судьба рынка.
https://www.anthropic.com/news/fable-mythos-access
@ai_newz
Это результат требования правительства США закрыть доступ к Fable для всех не-граждан, включая сотрудников Anthropic. Так как у Anthropic нет системы для проверки гражданства, доступ закрыли вообще всем.
Причиной послужил частичный джейлбрейк, который позволил использование Fable для поиска уязвимостей. Найденные уязвимости довольно простые и могут быть найдены другими публично доступными моделями.
От того удастся ли Anthropic отбиться и насколько серьёзны намерения правительства зависит судьба рынка.
https://www.anthropic.com/news/fable-mythos-access
@ai_newz
Anthropic
Statement on the US government directive to suspend access to Fable 5 and Mythos 5
The US government has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States.
3🤯278😁108❤22🤩13🫡11💔10🦄6🔥4❤🔥2⚡2🙏2
Нейродайджест за неделю (#119)
LLM
- Claude 5 Fable — Anthropic выкатили общедоступную версию Mythos, но с неприятным сюрпризом: модель невидимо деградировала (тупела) при запросах, связанных с разработкой AI. После сильного возмущения комьюнити (включая мой пост в LinkedIn) компания признала ошибку и пообещала сделать ограничения прозрачными. Однако затем правительство США потребовало закрыть доступ всем не-гражданам из-за джейлбрейка, и Anthropic пришлось закрыть доступ вообще всем.
- DiffusionGemma — Google выпустили диффузионную версию Gemma 26B-A4B. Модель в 4 раза быстрее авторегрессионной (1000 токенов/сек на H100), хотя качество генерации текста пока отстаёт.
- Kimi K2.7 Code — Новая открытая модель для кодинга (триллион параметров). Работает лучше K2.6, используя на 30% меньше токенов.
- Релиз весов MiniMax M3 — Модель оказалась компактнее ожидаемого (428B параметров, 23B активных). Главная фишка — новый вариант sparse attention (MSA), который эффективнее GQA на больших контекстах.
Прочее
- Ручной сброс лимитов в Codex — OpenAI заменили глобальный сброс лимитов на ручную кнопку (раз в 30 дней). Запустили реферальную программу для получения дополнительных сбросов.
- Экономика подписок AI-сервисов — Безумные расходы на активных пользователей подписок.
> Читать дайджест #118
#дайджест
@ai_newz
LLM
- Claude 5 Fable — Anthropic выкатили общедоступную версию Mythos, но с неприятным сюрпризом: модель невидимо деградировала (тупела) при запросах, связанных с разработкой AI. После сильного возмущения комьюнити (включая мой пост в LinkedIn) компания признала ошибку и пообещала сделать ограничения прозрачными. Однако затем правительство США потребовало закрыть доступ всем не-гражданам из-за джейлбрейка, и Anthropic пришлось закрыть доступ вообще всем.
- DiffusionGemma — Google выпустили диффузионную версию Gemma 26B-A4B. Модель в 4 раза быстрее авторегрессионной (1000 токенов/сек на H100), хотя качество генерации текста пока отстаёт.
- Kimi K2.7 Code — Новая открытая модель для кодинга (триллион параметров). Работает лучше K2.6, используя на 30% меньше токенов.
- Релиз весов MiniMax M3 — Модель оказалась компактнее ожидаемого (428B параметров, 23B активных). Главная фишка — новый вариант sparse attention (MSA), который эффективнее GQA на больших контекстах.
Прочее
- Ручной сброс лимитов в Codex — OpenAI заменили глобальный сброс лимитов на ручную кнопку (раз в 30 дней). Запустили реферальную программу для получения дополнительных сбросов.
- Экономика подписок AI-сервисов — Безумные расходы на активных пользователей подписок.
> Читать дайджест #118
#дайджест
@ai_newz
1❤🔥37👍8❤7
Forwarded from Roman Doronin | AI for Friends
Конечно же, история умолчит о наших приключениях с Артемом на встрече в Швейцарии.
Если коротко, то все прошло отлично - обсудили важные вопросы, покатались по интересным местам, в некотором смысле положили сервера Гугла.
На выходе осталась пачка ярких воспоминаний, качественный стикерпак от GenPeach и идея для следующего поста
Кстати, как вы думаете, кто на втором фото?
Если коротко, то все прошло отлично - обсудили важные вопросы, покатались по интересным местам, в некотором смысле положили сервера Гугла.
На выходе осталась пачка ярких воспоминаний, качественный стикерпак от GenPeach и идея для следующего поста
Кстати, как вы думаете, кто на втором фото?
❤42🔥8🦄5🤩3👍2💯1
SpaceX всё таки решились купить Cursor
Акционеры Anysphere (разработчика Cursor) получат 60 миллиардов долларов в акциях SpaceX. Сделку хотят закончить в третьем квартале.
Последнее время сотрудники Cursor тренировали модели для кодинга на кластере SpaceX, похоже Маску нравятся результаты. Надеюсь что релиз не за горами.
@ai_newz
Акционеры Anysphere (разработчика Cursor) получат 60 миллиардов долларов в акциях SpaceX. Сделку хотят закончить в третьем квартале.
Последнее время сотрудники Cursor тренировали модели для кодинга на кластере SpaceX, похоже Маску нравятся результаты. Надеюсь что релиз не за горами.
@ai_newz
3🔥176🤯58❤32👍20😁11💔7🦄7😱1