MaxRepost
1.37K subscribers
2.33K photos
617 videos
19 files
8.46K links
Мои мысли про ai, медиа, рекламу, технологии и разная странная хрень, которая происходит вокруг.

😎

Вопросы, предложения, подводные камни? @amyot
Download Telegram
С массовым пришествием современных калькуляторов LLM и агентов всё больше стимулов передать работу по пониманию сложных статей этим моделям и агентам, получать выжимки и саммари абстрактов, "понимать" про что это и двигаться дальше. Но здесь есть ловушка. Понимание не аутсорсится. Вернее аутсорсится, но это дорога в один конец. Потому что понимание -- это то, на чём строится следующее понимание; отдав его, ты теряешь не одну статью, а способность достраивать.

Развитие абстракций -- наша суть, не бросайте этот путь. Оставляйте себе время на понимание. Особенно базовых вещей. Не воспринимайте слова из области просто как ярлыки для чёрных ящиков. Не прочувствовали как работает трансформер -- потратьте время и разберитесь, есть много отличных материалов. SGD, RoPE, Adam -- аналогично.

Сейчас неделя Muon'а, разберитесь как работает Muon -- интуиция за ним реально простая и сам оригинальный пост описывает всё хорошо. Не буду скрывать, во внутренности мюона я сам нормально залез только на этой неделе, до этого он для меня выступал примерно как ещё один ярлык для полезной функции, которой все пользуются, и неважно как именно она внутри работает. Но понимать -- сильно лучше, чем не понимать.

Сделайте подход к линейной алгебре, если ещё не. Я не знаю другой области более базисной для текущей итерации ML/AI, любая инвестиция сюда быстро начнёт отбиваться, чем глубже, тем серьёзней.

Модель прочитает статью за тебя. Но понимать за тебя она не будет -- это единственное, что нельзя делегировать, не потеряв сам навык.
3
Forwarded from TechSparks
Успешный выход на биржу всегда считается важной вехой в истории добившейся этого компании — так что по следам успешного размещения SpaceX интересней, на мой взгляд, взглянуть на историю компании, чем подсчитывать деньги вокруг IPO. Вот как раз хорошая подборка фоток с комментариями, начиная с первой фоточки 2002 года, когда в компании и десятка сотрудников не было. Отдельно интересно проследить комментарии экспертов на протяжении этих 20+ лет, в том числе отечественных — но тут уж сами попросите любимую модельку сделать исследование:) Получится любопытно
https://www.businessinsider.com/spacex-history-photos
Forwarded from Data Secrets
Мем: в числе прочих доступа к Mythos лишили Андрея Карпаты, который недавно ушел работать в Anthropic R&D

Дело в том, что он не гражданин США.

Лицо исследователя без доступа к объекту исследования представили?
😁6
Разговаривал на днях с другом. Ему очень нравится читать этот канал, но он думал, что тут все репосты. Неа. Несмотря на название, тут много уникального контента 😹😹😹
2👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Seedance 2.0 mini

Начнем понедельник со слухов.

Последние три дня в сети упорно появляется информация, что Байтдэнс вот-вот бахнет версию Seedance 2.0 mini, которая:

По качеству ю лучше, чем Seedance 2.0 Fast

На 41 процент дешевле, чем обычный Seedance 2.0

Срок - июнь. Причем вот-вот.

А ещё в июне должна была выйти GPT-5.6.

Но с этими справками о гражданстве сроки становятся непредсказуемыми.

@cgevent
Forwarded from Data Secrets
OpenRouter выпустили API для запуска ансамблей моделей

По сути, это попытка превратить ручную сборку консенсуса моделей в готовый продукт из коробки, и весьма удачная. Работает так:

1. Вы отправляете один запрос в openrouter/fusion, и OpenRouter на своей стороне запускает панель из нескольких моделей, которые отвечают независимо друг от друга.

2. Затем еще одна модель-судья анализирует результаты и выдает на их основе финальный ответ.

3. Стек самих моделей по умолчанию выглядит как (~anthropic/claude-opus-latest, ~openai/gpt-latest, ~google/gemini-pro-latest), а судья – по дефолту первая из них, то есть claude-opus-latest. Также стек моделей и судью можно задать самостоятельно.

То есть, если выбирать модели по умолчанию, Fusion обычно стоит примерно в 4–5 раз дороже, чем один вызов модели. Есть смысл использовать только для очень сложных задач (буст в качестве действительно заметный, если что).

Но с другой стороны, благодаря возможности задать стек самому, это может быть и неплохой способ сэкономить. Например, OpenRouter пишут, что стек (Gemini 3 Flash, Kimi K2.6, and DeepSeek V4 Pro) превосходит соло запуски GPT-5.5 и Opus 4.8, и оказывается примерно в 1% от результатов Fable 5, а стоимость примерно вдвое ниже. Так что пробуем.

Еще из интересного: фича может работать как тул. То есть можно добавить {"type": "openrouter:fusion"} к вызову обычной модели, и она сможет сама как бы обратиться к совету других моделей, когда посчитает нужным.

Документация
🤔2
🇧🇷 Мэрия Рио-де-Жанейро (через свою муниципальную ит-компанию IplanRIO) только что выпустила модель под названием Rio 3.5 Open 397B

Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.

https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
Forwarded from Data Secrets
DeepMind выпустили большое исследование о том, что ждет нас после AGI

Статья (кстати, под интересным названием «От AGI к ASI») получилась очень небанальной и, скорее, философской. Основная идея авторов в том, что AGI – никакой не предел мечтаний, как мы привыкли считать благодаря маркетингу, а только начало.

Что такое AGI? Это Artificial General Intelligence, ИИ уровня человека. Но человеческий интеллект, на деле, очень ограничен. Ян Лекун вообще говорит, что AGI как термин он считает вводящей в заблуждение идеей, потому что человеческий интеллект никакой не «общий», а во многом специализированный и сформированный эволюцией, и люди универсальны только в тех задачах, которые мы способны вообразить.

Google следуют примерно той же логике, и проводят аналогию с физической силой. Если бы прогресс машин остановился на уровне человеческой силы, подумайте, каким был бы мир. Тут то же самое: человеческий мозг ограничен биологией, а машинные знания, память и способности можно масштабировать и ускорять.

Поэтому, на самом деле, мы стремимся к ASI, а не AGI – Artificial Superintelligence. Это уже система, которая превосходит даже не одного человека, а целые организации.

Путей к ASI несколько. Либо масштабирование текущих систем, либо какой-то парадигмальный скачок, либо самоулучшение ИИ, либо, и это самое интересное, сверхинтеллект как коллектив.

Причем для последнего варианта даже не требуется никакого сверх-развития. Например, прогресс моделей остановился на уровне AGI. Но при этом мы все еще можем наращивать вычислительные ресурсы, и тогда через несколько лет вместо тысячи экземпляров AGI можно будет запускать миллионы или сотни миллионов экземпляров. Чем не ASI?

В общем, чтиво занятное. Футуристам и любителям научной фантастики ссылка на полный текст: https://arxiv.org/pdf/2606.12683.
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
NatureOS

Принес позалипать. Что будет, если собрать всевозможные датчики и данные и отобразить это поверх Земной поверхности.

Данные о самолетах, судах, спутниках, дикой природе, качестве воздуха, пожарах, изображения с камер и собственная «грибная» вычислительная структура Mycosoft — все это транслируется из MINDEX, обрабатывается в Earth Simulator и интегрируется в каждый инструмент NatureOS.

Я залип на грибах. Они явно нами управляют.

Нужен хороший интернетик.

https://mycosoft.com/natureos/earth-simulator

@cgevent
Forwarded from TechSparks
Агенты в интернете становятся все многочисленней и разнообразней, и под них активно строится своя параллельная инфраструктура, охватывающая базовые интернет-сервисы. Платежными системами, например, вовсю занимаются банки.
Фундаментальная инфраструктура интернета — это, как мы знаем, поиск. И тут за последние недели была парочка интересных анонсов (удивительно, но не от Гугла).
Microsoft анонсировал (пока в виде листа ожидания) сервис Web IQ: пакет AI-native APIs к индексу Бинга, оптимизированный под запросы агентов. Суть сформулирована соблазнительно: Fewer tokens in, better answers out, lower cost per call; и это выглядит разумно: для проверки какой-то информации агенту нет нужды читать всю страницу, умный API отдаст лишь необходимый фрагмент и в итоге агент потратит меньше токенов.
Perplexity изначально строился как поиск ИИ-эры, и у него тоже объявлена новация. В зависимости от задачи, у агентов могут быть совершенно различные и подчас сложные стратегии извлечения информации из интернета, совсем не похожие на человеческие запросы.
we are introducing a new search architecture across our products: Search as Code (SaC). This new architecture empowers models to reach into the search stack itself rather than merely consume its final outputs

Впечатляет, с какой скоростью под новые реалии подстраиваются, казалось бы, уже давно устаканившиеся инфраструктурные сервисы интернета. И немножко завидую агентам: вот бы под нас так оперативно подлаживались… Хорошо быть ИИ-агентом, наверное
https://www.microsoft.com/en-us/webiq
А вот статья от Perplexity:
https://research.perplexity.ai/articles/rethinking-search-as-code-generation
Помните AI 2027, который съехал на 2031? (свежая версия показывает 2028/29 для того, что в новый год было 2031/2034)

Вот вышел пессимистичный [если не опомниться] сценарий Europe 2031 про будущее Европы и ИИ: https://europe2031.ai/

Короткое саммари тут.
Не только я люблю делать агентов под RS PI. Squeez Labs выкатили демку CrankGPT: полностью офлайн голосовой AI-ассистент на Raspberry Pi 5 8 GB, без облака. Но парни совсем угорели и он работает еще и без аккумулятора и питается от ручного генератора. Самая важная инженерная часть — питание. Raspberry Pi 5 капризен по напряжению: ему нужно примерно 4.8–5.3 V, а под inference бывают пики. Поэтому просто ручки недостаточно: они добавили кастомную плату с конденсаторами, которая сглаживает просадки и даёт около 20 секунд энергетического буфера. Крутишь ручку — Pi загружается, говоришь вопрос и локальные модели делают ASR → LLM → TTS. Из приколов LLM + TTS около 15 W. Это важная цифра: человек рукой 15 W может выдавать минут 10-15, так что сильно не позависаешь.

@maxrepost 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 🤖 The Bell Tech
SpaceX все-таки покупает разработчика ИИ-ассистента Cursor за $60 млрд

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+

SpaceX подтвердила покупку за $60 млрд стартапа Anysphere, разработчика популярного среди программистов ИИ-ассистента Cursor. Cделка объявлена спустя четыре дня после рекордного IPO SpaceX на Nasdaq, в ходе которого компания привлекла $85,7 млрд при капитализации более $2 трлн.

Акционеры Cursor могут получить оплату акциями SpaceX исходя из оценки стартапа в $60 млрд, уточняет Bloomberg. Стартап продолжит работать как дочерняя компания SpaceX. Закрытие сделки ожидается в третьем квартале 2026 года.

SpaceX получила опцион на покупку Cursor еще в апреле — тогда компании объявили о партнерстве в сфере вычислительных мощностей и обучения ИИ-моделей. По условиям соглашения SpaceX могла либо купить стартап за $60 млрд, либо заплатить $10 млрд за совместную работу. Реализацию опциона откладывали из-за готовившегося IPO.

Для SpaceX сделка усиливает позиции объединенной с ней в феврале 2026 года компании xAI, разработчика чат-бота Grok, которая конкурирует с OpenAI и Anthropic на рынке ИИ-инструментов для программистов. Гендиректор SpaceX Илон Маск ранее признавал, что xAI отстает от соперников именно в этом сегменте. Cursor, в свою очередь, получит доступ к вычислительной инфраструктуре SpaceX для обучения своих моделей.

Cursor основали в 2022 году четыре выпускника Массачусетского технологического института. Компания стала одной из наиболее быстро растущих в истории технологической отрасли: выручка в годовом исчислении (ARR) выросла со $100 млн в январе 2025 года до $1 млрд к ноябрю и до $2 млрд к февралю 2026-го. При последнем раунде финансирования в ноябре 2025 года стартап оценивался в $29,3 млрд — вдвое ниже цены нынешней сделки.
Forwarded from TechSparks
Тут Сатья Наделла написал (почему-то в Х, я уже отвык) длинное эссе про устройство ИИ-экономики. Он вводит помимо привычного термина “человеческий капитал” еще и “токенный капитал”: token capital is the firm’s AI capability it builds and owns. Нужно это ему, чтобы описать экономику, в которой впервые в истории возникает петля когнитивной обратной связи между людьми и цифровыми системами.
Наделла считает, что именно такая обратная связь обеспечивает сохранение потребности в человеческом капитале, который обеспечивает целеполагание, междисциплинарную экспертизу и выстраивание разных отношений между людьми.
Поэтому основная проблема не в выборе и освоении новых моделей, а в том, что Companies need to turn their workflows, domain knowledge, and accumulated judgment into AI systems that improve with each use. Ну, то есть организационная и административная трансформация, то самое, что у бизнеса хуже и медленнее всего получается.
Он вполне разумно предлагает создавать не только фронтирные модели, но и фронтирные экосистемы. Посмотрим, как это будет выглядеть на практике, опыт цифровой трансформации показывает, что тут десятилетия могут потребоваться, так что скорее начнется расслоение компаний, чем поголовная трансформация по Наделле.
https://x.com/satyanadella/status/2066182223213293753?s=61&t=rfm2neruKp2c4FhT4XFMNw
Hugging Face выкатили Serge, опенсорсного ИИ-ревьюера для GitHub.

Работает просто: вызываете агента в комментариях к pull request, и он сам проходит по diff, ищет баги, спорные места и оставляет замечания прямо в PR.

Что удобно:

* можно задавать правила ревью прямо в репозитории
* можно указать, на что агент должен обращать внимание
* можно заранее описать, что стоит игнорировать
* ревью запускается через обычный комментарий
* проект open source

Разработчики Hugging Face уже используют Serge внутри компании, в том числе для ревью в diffusers и transformers.

По сути, это ещё один шаг к новой норме: ревью кода становится не только задачей людей, но и постоянным AI-слоем поверх GitHub.

Не замена нормальному code review, а дополнительный фильтр, который может поймать очевидные баги, регрессии и странные решения до того, как до них дойдёт человек.

https://huggingface.co/blog/huggingface/serge
3
Подъехали подробности про блокировку fable 5.

Крестная мать баг-баунти програм (она запустила bug bounty в Microsoft и в Минобороны США, не баран чихнул), Кейти Муссурис, прочитала технический документ, который послужил основой для блокировки.

Говорит, что когда fable 5 дали на вход программу и попросили найти уязвимости, она отказалась. И тогда исследователь попросил модель исправить ошибки в этой программе. И подготовить тесты, чтобы проверить, исправлены ли они на самом деле.

Всё, это весь «взлом».

Можно конечно такое починить, но тогда модель станет абсолютно бесполезной для разработки софта.

🍿🍿
Кстати, Кейти была экспертом при подготовке Вассенаарских договоренностей, которые определяют, какой софт считается оружием и как его контролировать.

Я в этой связи вспоминаю, как правительство США пыталось запретить публичное распространение криптографии, которую они не могли взломать.

Правительство классифицировало стойкие алгоритмы как вооружение и запрещало их экспорт.

Например, в середине 90-х, было две разных версии браузера Netscape: одна с нормальным 128-битным шифрованием, доступная только в США и Канаде, а остальной мир должен был довольствоваться 40-битным шифрованием.

Активисты, которые боролись с этим безумием, в числе прочего, распространяли алгоритмы и даже исходники RSA и PGP в виде книги. Потому что книги защищены первой поправкой к конституции США о свободе слова.

Вот активистская футболка тех времен, с алгоритмом RSA и крупным предупреждением «эта футболка классифицируется как вооружение и не может быть экспортирована из США или показана иностранцу».
1
Обожаю такие истории. Клиент говорит, все обещают агентов и в итоге какая-то херня у всех. Я прямо на звонке: давайте сделаем чат в телеграм с вами и с парой ребят из вашего отдела. Кидаю туда моего Open PiPi office mode и его самого прошу рассказать что он умеет и провести интервью с клиентом. У людей на стороне клиента через 10 минут челюсть лежит на столе. Добавляю, что Пипи просто залетел в чат без онбординга и контекста, и теперь представьте как это будет работать при нормальном онбординге у вас. Сказали, как страшно жить. Хаха. Хорошо работающая фронтирная технология должна вызывать легкий трепет. 😹😹😹

@maxrepost 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
12