Forwarded from gonzo-обзоры ML статей
С массовым пришествием современных калькуляторов LLM и агентов всё больше стимулов передать работу по пониманию сложных статей этим моделям и агентам, получать выжимки и саммари абстрактов, "понимать" про что это и двигаться дальше. Но здесь есть ловушка. Понимание не аутсорсится. Вернее аутсорсится, но это дорога в один конец. Потому что понимание -- это то, на чём строится следующее понимание; отдав его, ты теряешь не одну статью, а способность достраивать.
Развитие абстракций -- наша суть, не бросайте этот путь. Оставляйте себе время на понимание. Особенно базовых вещей. Не воспринимайте слова из области просто как ярлыки для чёрных ящиков. Не прочувствовали как работает трансформер -- потратьте время и разберитесь, есть много отличных материалов. SGD, RoPE, Adam -- аналогично.
Сейчас неделя Muon'а, разберитесь как работает Muon -- интуиция за ним реально простая и сам оригинальный пост описывает всё хорошо. Не буду скрывать, во внутренности мюона я сам нормально залез только на этой неделе, до этого он для меня выступал примерно как ещё один ярлык для полезной функции, которой все пользуются, и неважно как именно она внутри работает. Но понимать -- сильно лучше, чем не понимать.
Сделайте подход к линейной алгебре, если ещё не. Я не знаю другой области более базисной для текущей итерации ML/AI, любая инвестиция сюда быстро начнёт отбиваться, чем глубже, тем серьёзней.
Модель прочитает статью за тебя. Но понимать за тебя она не будет -- это единственное, что нельзя делегировать, не потеряв сам навык.
Развитие абстракций -- наша суть, не бросайте этот путь. Оставляйте себе время на понимание. Особенно базовых вещей. Не воспринимайте слова из области просто как ярлыки для чёрных ящиков. Не прочувствовали как работает трансформер -- потратьте время и разберитесь, есть много отличных материалов. SGD, RoPE, Adam -- аналогично.
Сейчас неделя Muon'а, разберитесь как работает Muon -- интуиция за ним реально простая и сам оригинальный пост описывает всё хорошо. Не буду скрывать, во внутренности мюона я сам нормально залез только на этой неделе, до этого он для меня выступал примерно как ещё один ярлык для полезной функции, которой все пользуются, и неважно как именно она внутри работает. Но понимать -- сильно лучше, чем не понимать.
Сделайте подход к линейной алгебре, если ещё не. Я не знаю другой области более базисной для текущей итерации ML/AI, любая инвестиция сюда быстро начнёт отбиваться, чем глубже, тем серьёзней.
Модель прочитает статью за тебя. Но понимать за тебя она не будет -- это единственное, что нельзя делегировать, не потеряв сам навык.
❤3
Forwarded from TechSparks
Успешный выход на биржу всегда считается важной вехой в истории добившейся этого компании — так что по следам успешного размещения SpaceX интересней, на мой взгляд, взглянуть на историю компании, чем подсчитывать деньги вокруг IPO. Вот как раз хорошая подборка фоток с комментариями, начиная с первой фоточки 2002 года, когда в компании и десятка сотрудников не было. Отдельно интересно проследить комментарии экспертов на протяжении этих 20+ лет, в том числе отечественных — но тут уж сами попросите любимую модельку сделать исследование:) Получится любопытно
https://www.businessinsider.com/spacex-history-photos
https://www.businessinsider.com/spacex-history-photos
Business Insider
Photos of key moments in SpaceX history, from the scrappy startup days to milestone rocket launches
See key moments in SpaceX history, from Elon Musk celebrating with the team when there were fewer than 10 employees, to its milestone rocket launches.
Forwarded from Data Secrets
Мем: в числе прочих доступа к Mythos лишили Андрея Карпаты, который недавно ушел работать в Anthropic R&D
Дело в том, что он не гражданин США.
Лицо исследователя без доступа к объекту исследования представили?
Дело в том, что он не гражданин США.
Лицо исследователя без доступа к объекту исследования представили?
😁6
Разговаривал на днях с другом. Ему очень нравится читать этот канал, но он думал, что тут все репосты. Неа. Несмотря на название, тут много уникального контента 😹😹😹
❤2👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Seedance 2.0 mini
Начнем понедельник со слухов.
Последние три дня в сети упорно появляется информация, что Байтдэнс вот-вот бахнет версию Seedance 2.0 mini, которая:
По качеству ю лучше, чем Seedance 2.0 Fast
На 41 процент дешевле, чем обычный Seedance 2.0
Срок - июнь. Причем вот-вот.
А ещё в июне должна была выйти GPT-5.6.
Но с этими справками о гражданстве сроки становятся непредсказуемыми.
@cgevent
Начнем понедельник со слухов.
Последние три дня в сети упорно появляется информация, что Байтдэнс вот-вот бахнет версию Seedance 2.0 mini, которая:
По качеству ю лучше, чем Seedance 2.0 Fast
На 41 процент дешевле, чем обычный Seedance 2.0
Срок - июнь. Причем вот-вот.
А ещё в июне должна была выйти GPT-5.6.
Но с этими справками о гражданстве сроки становятся непредсказуемыми.
@cgevent
Forwarded from Data Secrets
OpenRouter выпустили API для запуска ансамблей моделей
По сути, это попытка превратить ручную сборку консенсуса моделей в готовый продукт из коробки, и весьма удачная. Работает так:
1. Вы отправляете один запрос в openrouter/fusion, и OpenRouter на своей стороне запускает панель из нескольких моделей, которые отвечают независимо друг от друга.
2. Затем еще одна модель-судья анализирует результаты и выдает на их основе финальный ответ.
3. Стек самих моделей по умолчанию выглядит как (~anthropic/claude-opus-latest, ~openai/gpt-latest, ~google/gemini-pro-latest), а судья – по дефолту первая из них, то есть claude-opus-latest. Также стек моделей и судью можно задать самостоятельно.
То есть, если выбирать модели по умолчанию, Fusion обычно стоит примерно в 4–5 раз дороже, чем один вызов модели. Есть смысл использовать только для очень сложных задач (буст в качестве действительно заметный, если что).
Но с другой стороны, благодаря возможности задать стек самому, это может быть и неплохой способ сэкономить. Например, OpenRouter пишут, что стек (Gemini 3 Flash, Kimi K2.6, and DeepSeek V4 Pro) превосходит соло запуски GPT-5.5 и Opus 4.8, и оказывается примерно в 1% от результатов Fable 5, а стоимость примерно вдвое ниже. Так что пробуем.
Еще из интересного: фича может работать как тул. То есть можно добавить {"type": "openrouter:fusion"} к вызову обычной модели, и она сможет сама как бы обратиться к совету других моделей, когда посчитает нужным.
Документация
По сути, это попытка превратить ручную сборку консенсуса моделей в готовый продукт из коробки, и весьма удачная. Работает так:
1. Вы отправляете один запрос в openrouter/fusion, и OpenRouter на своей стороне запускает панель из нескольких моделей, которые отвечают независимо друг от друга.
2. Затем еще одна модель-судья анализирует результаты и выдает на их основе финальный ответ.
3. Стек самих моделей по умолчанию выглядит как (~anthropic/claude-opus-latest, ~openai/gpt-latest, ~google/gemini-pro-latest), а судья – по дефолту первая из них, то есть claude-opus-latest. Также стек моделей и судью можно задать самостоятельно.
То есть, если выбирать модели по умолчанию, Fusion обычно стоит примерно в 4–5 раз дороже, чем один вызов модели. Есть смысл использовать только для очень сложных задач (буст в качестве действительно заметный, если что).
Но с другой стороны, благодаря возможности задать стек самому, это может быть и неплохой способ сэкономить. Например, OpenRouter пишут, что стек (Gemini 3 Flash, Kimi K2.6, and DeepSeek V4 Pro) превосходит соло запуски GPT-5.5 и Opus 4.8, и оказывается примерно в 1% от результатов Fable 5, а стоимость примерно вдвое ниже. Так что пробуем.
Еще из интересного: фича может работать как тул. То есть можно добавить {"type": "openrouter:fusion"} к вызову обычной модели, и она сможет сама как бы обратиться к совету других моделей, когда посчитает нужным.
Документация
🤔2
Forwarded from Анализ данных (Data analysis)
🇧🇷 Мэрия Рио-де-Жанейро (через свою муниципальную ит-компанию IplanRIO) только что выпустила модель под названием Rio 3.5 Open 397B
Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
Forwarded from Data Secrets
DeepMind выпустили большое исследование о том, что ждет нас после AGI
Статья (кстати, под интересным названием «От AGI к ASI») получилась очень небанальной и, скорее, философской. Основная идея авторов в том, что AGI – никакой не предел мечтаний, как мы привыкли считать благодаря маркетингу, а только начало.
Что такое AGI? Это Artificial General Intelligence, ИИ уровня человека. Но человеческий интеллект, на деле, очень ограничен. Ян Лекун вообще говорит, что AGI как термин он считает вводящей в заблуждение идеей, потому что человеческий интеллект никакой не «общий», а во многом специализированный и сформированный эволюцией, и люди универсальны только в тех задачах, которые мы способны вообразить.
Google следуют примерно той же логике, и проводят аналогию с физической силой. Если бы прогресс машин остановился на уровне человеческой силы, подумайте, каким был бы мир. Тут то же самое: человеческий мозг ограничен биологией, а машинные знания, память и способности можно масштабировать и ускорять.
Поэтому, на самом деле, мы стремимся к ASI, а не AGI – Artificial Superintelligence. Это уже система, которая превосходит даже не одного человека, а целые организации.
Путей к ASI несколько. Либо масштабирование текущих систем, либо какой-то парадигмальный скачок, либо самоулучшение ИИ, либо, и это самое интересное, сверхинтеллект как коллектив.
Причем для последнего варианта даже не требуется никакого сверх-развития. Например, прогресс моделей остановился на уровне AGI. Но при этом мы все еще можем наращивать вычислительные ресурсы, и тогда через несколько лет вместо тысячи экземпляров AGI можно будет запускать миллионы или сотни миллионов экземпляров. Чем не ASI?
В общем, чтиво занятное. Футуристам и любителям научной фантастики ссылка на полный текст: https://arxiv.org/pdf/2606.12683.
Статья (кстати, под интересным названием «От AGI к ASI») получилась очень небанальной и, скорее, философской. Основная идея авторов в том, что AGI – никакой не предел мечтаний, как мы привыкли считать благодаря маркетингу, а только начало.
Что такое AGI? Это Artificial General Intelligence, ИИ уровня человека. Но человеческий интеллект, на деле, очень ограничен. Ян Лекун вообще говорит, что AGI как термин он считает вводящей в заблуждение идеей, потому что человеческий интеллект никакой не «общий», а во многом специализированный и сформированный эволюцией, и люди универсальны только в тех задачах, которые мы способны вообразить.
Google следуют примерно той же логике, и проводят аналогию с физической силой. Если бы прогресс машин остановился на уровне человеческой силы, подумайте, каким был бы мир. Тут то же самое: человеческий мозг ограничен биологией, а машинные знания, память и способности можно масштабировать и ускорять.
Поэтому, на самом деле, мы стремимся к ASI, а не AGI – Artificial Superintelligence. Это уже система, которая превосходит даже не одного человека, а целые организации.
Путей к ASI несколько. Либо масштабирование текущих систем, либо какой-то парадигмальный скачок, либо самоулучшение ИИ, либо, и это самое интересное, сверхинтеллект как коллектив.
Причем для последнего варианта даже не требуется никакого сверх-развития. Например, прогресс моделей остановился на уровне AGI. Но при этом мы все еще можем наращивать вычислительные ресурсы, и тогда через несколько лет вместо тысячи экземпляров AGI можно будет запускать миллионы или сотни миллионов экземпляров. Чем не ASI?
В общем, чтиво занятное. Футуристам и любителям научной фантастики ссылка на полный текст: https://arxiv.org/pdf/2606.12683.
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
NatureOS
Принес позалипать. Что будет, если собрать всевозможные датчики и данные и отобразить это поверх Земной поверхности.
Данные о самолетах, судах, спутниках, дикой природе, качестве воздуха, пожарах, изображения с камер и собственная «грибная» вычислительная структура Mycosoft — все это транслируется из MINDEX, обрабатывается в Earth Simulator и интегрируется в каждый инструмент NatureOS.
Я залип на грибах. Они явно нами управляют.
Нужен хороший интернетик.
https://mycosoft.com/natureos/earth-simulator
@cgevent
Принес позалипать. Что будет, если собрать всевозможные датчики и данные и отобразить это поверх Земной поверхности.
Данные о самолетах, судах, спутниках, дикой природе, качестве воздуха, пожарах, изображения с камер и собственная «грибная» вычислительная структура Mycosoft — все это транслируется из MINDEX, обрабатывается в Earth Simulator и интегрируется в каждый инструмент NatureOS.
Я залип на грибах. Они явно нами управляют.
Нужен хороший интернетик.
https://mycosoft.com/natureos/earth-simulator
@cgevent
Forwarded from TechSparks
Агенты в интернете становятся все многочисленней и разнообразней, и под них активно строится своя параллельная инфраструктура, охватывающая базовые интернет-сервисы. Платежными системами, например, вовсю занимаются банки.
Фундаментальная инфраструктура интернета — это, как мы знаем, поиск. И тут за последние недели была парочка интересных анонсов (удивительно, но не от Гугла).
Microsoft анонсировал (пока в виде листа ожидания) сервис Web IQ: пакет AI-native APIs к индексу Бинга, оптимизированный под запросы агентов. Суть сформулирована соблазнительно: Fewer tokens in, better answers out, lower cost per call; и это выглядит разумно: для проверки какой-то информации агенту нет нужды читать всю страницу, умный API отдаст лишь необходимый фрагмент и в итоге агент потратит меньше токенов.
Perplexity изначально строился как поиск ИИ-эры, и у него тоже объявлена новация. В зависимости от задачи, у агентов могут быть совершенно различные и подчас сложные стратегии извлечения информации из интернета, совсем не похожие на человеческие запросы.
Впечатляет, с какой скоростью под новые реалии подстраиваются, казалось бы, уже давно устаканившиеся инфраструктурные сервисы интернета. И немножко завидую агентам: вот бы под нас так оперативно подлаживались… Хорошо быть ИИ-агентом, наверное
https://www.microsoft.com/en-us/webiq
А вот статья от Perplexity:
https://research.perplexity.ai/articles/rethinking-search-as-code-generation
Фундаментальная инфраструктура интернета — это, как мы знаем, поиск. И тут за последние недели была парочка интересных анонсов (удивительно, но не от Гугла).
Microsoft анонсировал (пока в виде листа ожидания) сервис Web IQ: пакет AI-native APIs к индексу Бинга, оптимизированный под запросы агентов. Суть сформулирована соблазнительно: Fewer tokens in, better answers out, lower cost per call; и это выглядит разумно: для проверки какой-то информации агенту нет нужды читать всю страницу, умный API отдаст лишь необходимый фрагмент и в итоге агент потратит меньше токенов.
Perplexity изначально строился как поиск ИИ-эры, и у него тоже объявлена новация. В зависимости от задачи, у агентов могут быть совершенно различные и подчас сложные стратегии извлечения информации из интернета, совсем не похожие на человеческие запросы.
we are introducing a new search architecture across our products: Search as Code (SaC). This new architecture empowers models to reach into the search stack itself rather than merely consume its final outputs
Впечатляет, с какой скоростью под новые реалии подстраиваются, казалось бы, уже давно устаканившиеся инфраструктурные сервисы интернета. И немножко завидую агентам: вот бы под нас так оперативно подлаживались… Хорошо быть ИИ-агентом, наверное
https://www.microsoft.com/en-us/webiq
А вот статья от Perplexity:
https://research.perplexity.ai/articles/rethinking-search-as-code-generation
Forwarded from gonzo-обзоры ML статей
Помните AI 2027, который съехал на 2031? (свежая версия показывает 2028/29 для того, что в новый год было 2031/2034)
Вот вышел пессимистичный [если не опомниться] сценарий Europe 2031 про будущее Европы и ИИ: https://europe2031.ai/
Короткое саммари тут.
Вот вышел пессимистичный [если не опомниться] сценарий Europe 2031 про будущее Европы и ИИ: https://europe2031.ai/
Короткое саммари тут.
Europe 2031
Europe 2031 — What getting AI wrong means for us
A five-year scenario about AI and Europe's impending slide into irrelevance, with a 2034 epilogue that describes how the collapse of the European model could have been prevented.
Не только я люблю делать агентов под RS PI. Squeez Labs выкатили демку CrankGPT: полностью офлайн голосовой AI-ассистент на Raspberry Pi 5 8 GB, без облака. Но парни совсем угорели и он работает еще и без аккумулятора и питается от ручного генератора. Самая важная инженерная часть — питание. Raspberry Pi 5 капризен по напряжению: ему нужно примерно 4.8–5.3 V, а под inference бывают пики. Поэтому просто ручки недостаточно: они добавили кастомную плату с конденсаторами, которая сглаживает просадки и даёт около 20 секунд энергетического буфера. Крутишь ручку — Pi загружается, говоришь вопрос и локальные модели делают ASR → LLM → TTS. Из приколов LLM + TTS около 15 W. Это важная цифра: человек рукой 15 W может выдавать минут 10-15, так что сильно не позависаешь.
@maxrepost👾
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 🤖 The Bell Tech
SpaceX все-таки покупает разработчика ИИ-ассистента Cursor за $60 млрд
НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+
SpaceX подтвердила покупку за $60 млрд стартапа Anysphere, разработчика популярного среди программистов ИИ-ассистента Cursor. Cделка объявлена спустя четыре дня после рекордного IPO SpaceX на Nasdaq, в ходе которого компания привлекла $85,7 млрд при капитализации более $2 трлн.
Акционеры Cursor могут получить оплату акциями SpaceX исходя из оценки стартапа в $60 млрд, уточняет Bloomberg. Стартап продолжит работать как дочерняя компания SpaceX. Закрытие сделки ожидается в третьем квартале 2026 года.
SpaceX получила опцион на покупку Cursor еще в апреле — тогда компании объявили о партнерстве в сфере вычислительных мощностей и обучения ИИ-моделей. По условиям соглашения SpaceX могла либо купить стартап за $60 млрд, либо заплатить $10 млрд за совместную работу. Реализацию опциона откладывали из-за готовившегося IPO.
Для SpaceX сделка усиливает позиции объединенной с ней в феврале 2026 года компании xAI, разработчика чат-бота Grok, которая конкурирует с OpenAI и Anthropic на рынке ИИ-инструментов для программистов. Гендиректор SpaceX Илон Маск ранее признавал, что xAI отстает от соперников именно в этом сегменте. Cursor, в свою очередь, получит доступ к вычислительной инфраструктуре SpaceX для обучения своих моделей.
Cursor основали в 2022 году четыре выпускника Массачусетского технологического института. Компания стала одной из наиболее быстро растущих в истории технологической отрасли: выручка в годовом исчислении (ARR) выросла со $100 млн в январе 2025 года до $1 млрд к ноябрю и до $2 млрд к февралю 2026-го. При последнем раунде финансирования в ноябре 2025 года стартап оценивался в $29,3 млрд — вдвое ниже цены нынешней сделки.
НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+
SpaceX подтвердила покупку за $60 млрд стартапа Anysphere, разработчика популярного среди программистов ИИ-ассистента Cursor. Cделка объявлена спустя четыре дня после рекордного IPO SpaceX на Nasdaq, в ходе которого компания привлекла $85,7 млрд при капитализации более $2 трлн.
Акционеры Cursor могут получить оплату акциями SpaceX исходя из оценки стартапа в $60 млрд, уточняет Bloomberg. Стартап продолжит работать как дочерняя компания SpaceX. Закрытие сделки ожидается в третьем квартале 2026 года.
SpaceX получила опцион на покупку Cursor еще в апреле — тогда компании объявили о партнерстве в сфере вычислительных мощностей и обучения ИИ-моделей. По условиям соглашения SpaceX могла либо купить стартап за $60 млрд, либо заплатить $10 млрд за совместную работу. Реализацию опциона откладывали из-за готовившегося IPO.
Для SpaceX сделка усиливает позиции объединенной с ней в феврале 2026 года компании xAI, разработчика чат-бота Grok, которая конкурирует с OpenAI и Anthropic на рынке ИИ-инструментов для программистов. Гендиректор SpaceX Илон Маск ранее признавал, что xAI отстает от соперников именно в этом сегменте. Cursor, в свою очередь, получит доступ к вычислительной инфраструктуре SpaceX для обучения своих моделей.
Cursor основали в 2022 году четыре выпускника Массачусетского технологического института. Компания стала одной из наиболее быстро растущих в истории технологической отрасли: выручка в годовом исчислении (ARR) выросла со $100 млн в январе 2025 года до $1 млрд к ноябрю и до $2 млрд к февралю 2026-го. При последнем раунде финансирования в ноябре 2025 года стартап оценивался в $29,3 млрд — вдвое ниже цены нынешней сделки.
Forwarded from TechSparks
Тут Сатья Наделла написал (почему-то в Х, я уже отвык) длинное эссе про устройство ИИ-экономики. Он вводит помимо привычного термина “человеческий капитал” еще и “токенный капитал”: token capital is the firm’s AI capability it builds and owns. Нужно это ему, чтобы описать экономику, в которой впервые в истории возникает петля когнитивной обратной связи между людьми и цифровыми системами.
Наделла считает, что именно такая обратная связь обеспечивает сохранение потребности в человеческом капитале, который обеспечивает целеполагание, междисциплинарную экспертизу и выстраивание разных отношений между людьми.
Поэтому основная проблема не в выборе и освоении новых моделей, а в том, что Companies need to turn their workflows, domain knowledge, and accumulated judgment into AI systems that improve with each use. Ну, то есть организационная и административная трансформация, то самое, что у бизнеса хуже и медленнее всего получается.
Он вполне разумно предлагает создавать не только фронтирные модели, но и фронтирные экосистемы. Посмотрим, как это будет выглядеть на практике, опыт цифровой трансформации показывает, что тут десятилетия могут потребоваться, так что скорее начнется расслоение компаний, чем поголовная трансформация по Наделле.
https://x.com/satyanadella/status/2066182223213293753?s=61&t=rfm2neruKp2c4FhT4XFMNw
Наделла считает, что именно такая обратная связь обеспечивает сохранение потребности в человеческом капитале, который обеспечивает целеполагание, междисциплинарную экспертизу и выстраивание разных отношений между людьми.
Поэтому основная проблема не в выборе и освоении новых моделей, а в том, что Companies need to turn their workflows, domain knowledge, and accumulated judgment into AI systems that improve with each use. Ну, то есть организационная и административная трансформация, то самое, что у бизнеса хуже и медленнее всего получается.
Он вполне разумно предлагает создавать не только фронтирные модели, но и фронтирные экосистемы. Посмотрим, как это будет выглядеть на практике, опыт цифровой трансформации показывает, что тут десятилетия могут потребоваться, так что скорее начнется расслоение компаний, чем поголовная трансформация по Наделле.
https://x.com/satyanadella/status/2066182223213293753?s=61&t=rfm2neruKp2c4FhT4XFMNw
X (formerly Twitter)
Satya Nadella (@satyanadella) on X
A frontier without an ecosystem is not stable
Forwarded from Анализ данных (Data analysis)
Hugging Face выкатили Serge, опенсорсного ИИ-ревьюера для GitHub.
Работает просто: вызываете агента в комментариях к pull request, и он сам проходит по diff, ищет баги, спорные места и оставляет замечания прямо в PR.
Что удобно:
* можно задавать правила ревью прямо в репозитории
* можно указать, на что агент должен обращать внимание
* можно заранее описать, что стоит игнорировать
* ревью запускается через обычный комментарий
* проект open source
Разработчики Hugging Face уже используют Serge внутри компании, в том числе для ревью в diffusers и transformers.
По сути, это ещё один шаг к новой норме: ревью кода становится не только задачей людей, но и постоянным AI-слоем поверх GitHub.
Не замена нормальному code review, а дополнительный фильтр, который может поймать очевидные баги, регрессии и странные решения до того, как до них дойдёт человек.
https://huggingface.co/blog/huggingface/serge
Работает просто: вызываете агента в комментариях к pull request, и он сам проходит по diff, ищет баги, спорные места и оставляет замечания прямо в PR.
Что удобно:
* можно задавать правила ревью прямо в репозитории
* можно указать, на что агент должен обращать внимание
* можно заранее описать, что стоит игнорировать
* ревью запускается через обычный комментарий
* проект open source
Разработчики Hugging Face уже используют Serge внутри компании, в том числе для ревью в diffusers и transformers.
По сути, это ещё один шаг к новой норме: ревью кода становится не только задачей людей, но и постоянным AI-слоем поверх GitHub.
Не замена нормальному code review, а дополнительный фильтр, который может поймать очевидные баги, регрессии и странные решения до того, как до них дойдёт человек.
https://huggingface.co/blog/huggingface/serge
❤3
Forwarded from запуск завтра
Подъехали подробности про блокировку fable 5.
Крестная мать баг-баунти програм (она запустила bug bounty в Microsoft и в Минобороны США, не баран чихнул), Кейти Муссурис, прочитала технический документ, который послужил основой для блокировки.
Говорит, что когда fable 5 дали на вход программу и попросили найти уязвимости, она отказалась. И тогда исследователь попросил модель исправить ошибки в этой программе. И подготовить тесты, чтобы проверить, исправлены ли они на самом деле.
Всё, это весь «взлом».
Можно конечно такое починить, но тогда модель станет абсолютно бесполезной для разработки софта.
🍿🍿
Крестная мать баг-баунти програм (она запустила bug bounty в Microsoft и в Минобороны США, не баран чихнул), Кейти Муссурис, прочитала технический документ, который послужил основой для блокировки.
Говорит, что когда fable 5 дали на вход программу и попросили найти уязвимости, она отказалась. И тогда исследователь попросил модель исправить ошибки в этой программе. И подготовить тесты, чтобы проверить, исправлены ли они на самом деле.
Всё, это весь «взлом».
Можно конечно такое починить, но тогда модель станет абсолютно бесполезной для разработки софта.
🍿🍿
Forwarded from запуск завтра
Кстати, Кейти была экспертом при подготовке Вассенаарских договоренностей, которые определяют, какой софт считается оружием и как его контролировать.
Я в этой связи вспоминаю, как правительство США пыталось запретить публичное распространение криптографии, которую они не могли взломать.
Правительство классифицировало стойкие алгоритмы как вооружение и запрещало их экспорт.
Например, в середине 90-х, было две разных версии браузера Netscape: одна с нормальным 128-битным шифрованием, доступная только в США и Канаде, а остальной мир должен был довольствоваться 40-битным шифрованием.
Активисты, которые боролись с этим безумием, в числе прочего, распространяли алгоритмы и даже исходники RSA и PGP в виде книги. Потому что книги защищены первой поправкой к конституции США о свободе слова.
Вот активистская футболка тех времен, с алгоритмом RSA и крупным предупреждением «эта футболка классифицируется как вооружение и не может быть экспортирована из США или показана иностранцу».
Я в этой связи вспоминаю, как правительство США пыталось запретить публичное распространение криптографии, которую они не могли взломать.
Правительство классифицировало стойкие алгоритмы как вооружение и запрещало их экспорт.
Например, в середине 90-х, было две разных версии браузера Netscape: одна с нормальным 128-битным шифрованием, доступная только в США и Канаде, а остальной мир должен был довольствоваться 40-битным шифрованием.
Активисты, которые боролись с этим безумием, в числе прочего, распространяли алгоритмы и даже исходники RSA и PGP в виде книги. Потому что книги защищены первой поправкой к конституции США о свободе слова.
Вот активистская футболка тех времен, с алгоритмом RSA и крупным предупреждением «эта футболка классифицируется как вооружение и не может быть экспортирована из США или показана иностранцу».
❤1
Обожаю такие истории. Клиент говорит, все обещают агентов и в итоге какая-то херня у всех. Я прямо на звонке: давайте сделаем чат в телеграм с вами и с парой ребят из вашего отдела. Кидаю туда моего Open PiPi office mode и его самого прошу рассказать что он умеет и провести интервью с клиентом. У людей на стороне клиента через 10 минут челюсть лежит на столе. Добавляю, что Пипи просто залетел в чат без онбординга и контекста, и теперь представьте как это будет работать при нормальном онбординге у вас. Сказали, как страшно жить. Хаха. Хорошо работающая фронтирная технология должна вызывать легкий трепет. 😹😹😹
@maxrepost👾
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13
Forwarded from Мы и Жо / медиа и журналистика
Вышел свежий Digital News Report by Reuters Institute
Краткая версия здесь, но учтите, краткая она только в воображении авторов
Главные выводы:
1. Социальные медиа и видеосети побеждают новостные сайты и приложения
2. ИИ-чатботы занимают место посредника в новостном потреблении
3. Онлайновое видео становится главным форматом новостного потребления
4. Видео освоили в первую очередь инфлюенсеры, а не медиа
5. Интерес к новостям падает
6. Доверие к новостям на самом низком уровне за историю наблюдений
7. Так как новости все реже потребляют напрямую, платить за них не хочется
8. Люди выступают за беспристрастность в новостях, но попытка беспристрастного освещения конфликтных вопросов им не нравится
Краткая версия здесь, но учтите, краткая она только в воображении авторов
Главные выводы:
1. Социальные медиа и видеосети побеждают новостные сайты и приложения
2. ИИ-чатботы занимают место посредника в новостном потреблении
3. Онлайновое видео становится главным форматом новостного потребления
4. Видео освоили в первую очередь инфлюенсеры, а не медиа
5. Интерес к новостям падает
6. Доверие к новостям на самом низком уровне за историю наблюдений
7. Так как новости все реже потребляют напрямую, платить за них не хочется
8. Люди выступают за беспристрастность в новостях, но попытка беспристрастного освещения конфликтных вопросов им не нравится
Reuters Institute for the Study of Journalism
Overview and key findings of the 2026 Digital News Report
Our 2026 report finds news audiences around the world reacting with growing unease to successive episodes of political, economic, and technological turbulence. Assumptions about the way the world works are being questioned as longstanding international alliances…