This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA показала CPO-switch, сделанный вместе с Lambda.
CPO, или co-packaged optics, переносит оптическую связь ближе к главному сетевому чипу. Путь сигнала становится короче, потерь меньше, энергопотребление ниже, а потенциальных точек отказа меньше.
NVIDIA объясняет это через экономику токенов: сеть сама токены не генерирует, но без неё GPU простаивают. Чем больше энергии и сбоев в сети, тем дороже каждый токен.
Для масштаба: дата-центр на 128 000 GPU с обычными оптическими модулями требует около 655 000 трансиверов. Каждый из них может сломаться. CPO убирает этот класс компонентов.
CPO, или co-packaged optics, переносит оптическую связь ближе к главному сетевому чипу. Путь сигнала становится короче, потерь меньше, энергопотребление ниже, а потенциальных точек отказа меньше.
NVIDIA объясняет это через экономику токенов: сеть сама токены не генерирует, но без неё GPU простаивают. Чем больше энергии и сбоев в сети, тем дороже каждый токен.
Для масштаба: дата-центр на 128 000 GPU с обычными оптическими модулями требует около 655 000 трансиверов. Каждый из них может сломаться. CPO убирает этот класс компонентов.
🔥14❤4👍3😁2🤯2
NVIDIA представила Vera CPU как процессор для новой волны AI-фабрик
Раньше масштабирование ИИ в основном крутилось вокруг обучения, инференса и test-time compute. Теперь растёт другой тип нагрузки: агентные системы и reinforcement learning.
Такие модели планируют, вызывают инструменты, запускают проверки, работают с окружениями, делают больше шагов и постоянно гоняют данные между CPU, GPU, памятью и сетью.
По данным NVIDIA, Vera должна ускорять выполнение агентных задач до 1,8 раза по сравнению с x86 CPU, сокращать CPU-время и повышать общий throughput AI-фабрики. Идея простая: если CPU медленно готовит данные и обслуживает окружение, дорогие GPU ждут и не генерируют токены.
Vera делает ставку на высокую пропускную способность памяти, быструю связку CPU-GPU через NVLink-C2C и более предсказуемое перемещение данных. Для агентных workloads это важно, потому что там стоимость считается не только в FLOPS, а в том, сколько задач система успевает завершить за единицу времени.
NVIDIA усердно двигает идею продажи AI-фабрики целиком: GPU, CPU, сеть, память и софт как одну систему.
https://developer.nvidia.com/blog/nvidia-vera-cpu-sets-a-new-standard-for-agentic-workloads-in-ai-factories/
Раньше масштабирование ИИ в основном крутилось вокруг обучения, инференса и test-time compute. Теперь растёт другой тип нагрузки: агентные системы и reinforcement learning.
Такие модели планируют, вызывают инструменты, запускают проверки, работают с окружениями, делают больше шагов и постоянно гоняют данные между CPU, GPU, памятью и сетью.
По данным NVIDIA, Vera должна ускорять выполнение агентных задач до 1,8 раза по сравнению с x86 CPU, сокращать CPU-время и повышать общий throughput AI-фабрики. Идея простая: если CPU медленно готовит данные и обслуживает окружение, дорогие GPU ждут и не генерируют токены.
Vera делает ставку на высокую пропускную способность памяти, быструю связку CPU-GPU через NVLink-C2C и более предсказуемое перемещение данных. Для агентных workloads это важно, потому что там стоимость считается не только в FLOPS, а в том, сколько задач система успевает завершить за единицу времени.
NVIDIA усердно двигает идею продажи AI-фабрики целиком: GPU, CPU, сеть, память и софт как одну систему.
https://developer.nvidia.com/blog/nvidia-vera-cpu-sets-a-new-standard-for-agentic-workloads-in-ai-factories/
👍18🔥8❤5
Moonshot AI выпустила и открыла Kimi-K2.7-Code - новую модель для кодинга и агентных задач.
По сравнению с K2.6 модель стала заметно сильнее в задачах разработки:
* +21.8% на Kimi Code Bench v2
* +11.0% на Program Bench
* +31.5% на MLS Bench Lite
Отдельно улучшили эффективность рассуждений. Kimi-K2.7-Code меньше «думает вслух» и тратит примерно на 30% меньше reasoning-токенов, чем K2.6. Для кодинг-агентов это важно: меньше лишнего перебора, быстрее выполнение, ниже стоимость.
Ещё один акцент - long-horizon coding. Модель лучше держит длинные инструкции и чаще доводит end-to-end задачи до рабочего результата, а не ломается где-то посередине.
Скоро обещают 6x High-Speed Mode.
Доступна через Kimi API и Kimi Code:
Kimi Code: https://kimi.com/code
API: https://platform.moonshot.ai
По сравнению с K2.6 модель стала заметно сильнее в задачах разработки:
* +21.8% на Kimi Code Bench v2
* +11.0% на Program Bench
* +31.5% на MLS Bench Lite
Отдельно улучшили эффективность рассуждений. Kimi-K2.7-Code меньше «думает вслух» и тратит примерно на 30% меньше reasoning-токенов, чем K2.6. Для кодинг-агентов это важно: меньше лишнего перебора, быстрее выполнение, ниже стоимость.
Ещё один акцент - long-horizon coding. Модель лучше держит длинные инструкции и чаще доводит end-to-end задачи до рабочего результата, а не ломается где-то посередине.
Скоро обещают 6x High-Speed Mode.
Доступна через Kimi API и Kimi Code:
Kimi Code: https://kimi.com/code
API: https://platform.moonshot.ai
❤13👍9🔥5
Быстрый старт в AI-аналитику с DataLens
Обзор AI в DataLens: агентский режим, новые сценарии и on-premises
16 июня в 12:00 мск проведём вебинар о том, как AI-возможности меняют работу с аналитикой в DataLens.
Покажем агентский режим Нейроаналитика, новые сценарии в дашбордах, виджетах, рассылках и встройках, а также разберём, как использовать DataLens в облаке и on-premises.
О чём поговорим:
* большое обновление Нейроаналитика и как устроен агентский режим под капотом
* новые сценарии: виджеты дашборда, рассылки, встройки и публикации
* как подключать внешние AI-инструменты и ускорять работу с DataLens
* доступность AI-возможностей в облаке и on-premises
* планы развития встроенного AI в DataLens и инфраструктуры для внешних AI- инструментов
Вебинар будет полезен аналитикам, BI-специалистам, дата-командам и всем, кто хочет быстрее получать инсайты из данных без лишней ручной работы.
Обзор AI в DataLens: агентский режим, новые сценарии и on-premises
16 июня в 12:00 мск проведём вебинар о том, как AI-возможности меняют работу с аналитикой в DataLens.
Покажем агентский режим Нейроаналитика, новые сценарии в дашбордах, виджетах, рассылках и встройках, а также разберём, как использовать DataLens в облаке и on-premises.
О чём поговорим:
* большое обновление Нейроаналитика и как устроен агентский режим под капотом
* новые сценарии: виджеты дашборда, рассылки, встройки и публикации
* как подключать внешние AI-инструменты и ускорять работу с DataLens
* доступность AI-возможностей в облаке и on-premises
* планы развития встроенного AI в DataLens и инфраструктуры для внешних AI- инструментов
Вебинар будет полезен аналитикам, BI-специалистам, дата-командам и всем, кто хочет быстрее получать инсайты из данных без лишней ручной работы.
❤3👍2🙏2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя.
Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений.
Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами.
openai.com
Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса.
Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи.
Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года.
До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений.
thealliance.ai
Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов.
Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры.
Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы.
bloomberg.com
Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту.
OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций.
Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ.
visa.com
Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков.
По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка.
Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок.
deezer.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤4🔥2
Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
😱32❤5👍3🔥3😁2🥴2👏1
Китай может решить главную проблему зелёной энергетики уже к 2030 году
Главная слабость возобновляемой энергетики, то что энергия появляется не тогда, когда она нужна, а когда есть солнце или ветер.
Китай сейчас старается решить это проблему этот разрыв с помощью grid storage -накопителей энергии, подключённых прямо к электросети.
Они работают как огромный буфер: забирают электричество, когда генерации много и цена низкая, а потом возвращают его в сеть вечером, ночью или в часы пикового спроса.
И темпы у Китая уже почти неприличные.
Только за декабрь 2025 года Китай установил 65,4 ГВт·ч сетевых батарей. Это больше, чем США установили за весь 2025 год - 46,5 ГВт·ч.
При этом США остаются вторым крупнейшим рынком накопителей после Китая.
Батареи превращают солнечную и ветровую энергетику из «нестабильной» в управляемую. Сеть получает возможность сохранять избыток дешёвой энергии и отдавать её тогда, когда она реально нужна.
Китай одновременно делает три вещи:
- строит огромный избыток солнечной и ветровой генерации;
- рекордными темпами наращивает накопители;
- быстро переводит транспорт, промышленность и города на электричество.
Если такая динамика сохранится, уже к 2030 году Китай может приблизиться к энергосистеме, где потребности в электричестве всё чаще закрываются связкой renewables + storage, а не углём и газом.
https://reneweconomy.com.au/graph-of-the-day-batteries-are-beating-solar-to-deliver-the-fastest-energy-transition-in-human-history/
Главная слабость возобновляемой энергетики, то что энергия появляется не тогда, когда она нужна, а когда есть солнце или ветер.
Китай сейчас старается решить это проблему этот разрыв с помощью grid storage -накопителей энергии, подключённых прямо к электросети.
Они работают как огромный буфер: забирают электричество, когда генерации много и цена низкая, а потом возвращают его в сеть вечером, ночью или в часы пикового спроса.
И темпы у Китая уже почти неприличные.
Только за декабрь 2025 года Китай установил 65,4 ГВт·ч сетевых батарей. Это больше, чем США установили за весь 2025 год - 46,5 ГВт·ч.
При этом США остаются вторым крупнейшим рынком накопителей после Китая.
Батареи превращают солнечную и ветровую энергетику из «нестабильной» в управляемую. Сеть получает возможность сохранять избыток дешёвой энергии и отдавать её тогда, когда она реально нужна.
Китай одновременно делает три вещи:
- строит огромный избыток солнечной и ветровой генерации;
- рекордными темпами наращивает накопители;
- быстро переводит транспорт, промышленность и города на электричество.
Если такая динамика сохранится, уже к 2030 году Китай может приблизиться к энергосистеме, где потребности в электричестве всё чаще закрываются связкой renewables + storage, а не углём и газом.
https://reneweconomy.com.au/graph-of-the-day-batteries-are-beating-solar-to-deliver-the-fastest-energy-transition-in-human-history/
❤22👍14🔥9😁2🤔2🤯1😐1
Forwarded from Машинное обучение RU
OpenRouter запустил Fusion - систему, где на один запрос отвечает не одна модель, а сразу несколько
Суть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.
Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:
* несколько моделей работают одновременно;
* инструменты помогают проверять факты и считать;
* judge отбрасывает слабые ответы;
* synthesizer собирает итоговый результат в один связный ответ.
OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.
https://openrouter.ai/fusion
@machinelearning_ru
Суть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.
Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:
* несколько моделей работают одновременно;
* инструменты помогают проверять факты и считать;
* judge отбрасывает слабые ответы;
* synthesizer собирает итоговый результат в один связный ответ.
OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.
https://openrouter.ai/fusion
@machinelearning_ru
👍10🔥7❤6
🇧🇷 Мэрия Рио-де-Жанейро (через свою муниципальную ит-компанию IplanRIO) только что выпустила модель под названием Rio 3.5 Open 397B
Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
🔥31❤11👍4
Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.
Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.
На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.
BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.
https://x.com/GoogleResearch/status/2065475343205740911
@data_analysis_ml
Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.
На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.
BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.
https://x.com/GoogleResearch/status/2065475343205740911
@data_analysis_ml
👍25🔥11❤7
Теперь официально: SpaceX покупает Cursor в сделке полностью за акции, оценённой в $60 млрд.
Этот шаг моментально даёт ИИ-империи Илона Маска серьёзный enterprise-продукт для программирования и может помочь xAI сократить отставание от Claude Code от Anthropic и Codex от OpenAI.
Однако на практике всё больше похоже, что xAI скорее сдаёт свои дата-центры в аренду и позиционирует себя как hyperscaler, чем реально стремится участвовать в гонке за SOTA-модель.
Этот шаг моментально даёт ИИ-империи Илона Маска серьёзный enterprise-продукт для программирования и может помочь xAI сократить отставание от Claude Code от Anthropic и Codex от OpenAI.
Однако на практике всё больше похоже, что xAI скорее сдаёт свои дата-центры в аренду и позиционирует себя как hyperscaler, чем реально стремится участвовать в гонке за SOTA-модель.
❤17👍5🔥5
Forwarded from Kali Linux
Апдейт по Fable 5 / Anthropic: компания отправила своих ведущих специалистов по безопасности в Вашингтон. Экспортные ограничения всё ещё
Anthropic и администрация Трампа завершили переговоры в понедельник без результата: экспортные ограничения на Claude Fable 5 остаются в силе. Когда их снимут - непонятно.
Компания несколько дней убеждала Вашингтон, что опасения вокруг модели преувеличены. Ту же позицию Anthropic повторила перед исследователями из Министерства торговли США.
Министр торговли Говард Лютник подключился к встрече по телефону с саммита G7 в Эвиане, Франция. Кибердиректор Шон Кэрнкросс в переговорах не участвовал.
Со стороны Anthropic обсуждение вели сооснователь Том Браун и глава внешних связей Сара Хек. Руководитель red teaming Логан Грэм и исследователь безопасности Николас Карлини специально прилетели в Вашингтон для этих переговоров.
Главный спор - можно ли снять защитные ограничения Fable 5 и открыть более мощные возможности Mythos, которые находятся «под капотом». NSA считает, что да. Anthropic утверждает, что риск преувеличен.
Пока нет ясного понимания, какими будут следующие шаги.
@linuxkalii
Anthropic и администрация Трампа завершили переговоры в понедельник без результата: экспортные ограничения на Claude Fable 5 остаются в силе. Когда их снимут - непонятно.
Компания несколько дней убеждала Вашингтон, что опасения вокруг модели преувеличены. Ту же позицию Anthropic повторила перед исследователями из Министерства торговли США.
Министр торговли Говард Лютник подключился к встрече по телефону с саммита G7 в Эвиане, Франция. Кибердиректор Шон Кэрнкросс в переговорах не участвовал.
Со стороны Anthropic обсуждение вели сооснователь Том Браун и глава внешних связей Сара Хек. Руководитель red teaming Логан Грэм и исследователь безопасности Николас Карлини специально прилетели в Вашингтон для этих переговоров.
Главный спор - можно ли снять защитные ограничения Fable 5 и открыть более мощные возможности Mythos, которые находятся «под капотом». NSA считает, что да. Anthropic утверждает, что риск преувеличен.
Пока нет ясного понимания, какими будут следующие шаги.
@linuxkalii
🔥7❤5👍3🌭2
DeepSeek провела первый раунд внешнего финансирования и привлекла более 50 млрд юаней, примерно $7,4 млрд. Оценка компании, по сообщениям, превысила $50 млрд.
Инвесторы заходят не напрямую в DeepSeek, а через limited partnership, которым управляет CEO компании Лян Вэньфэн. Такая структура позволяет ему сохранить полный контроль над компанией.
Единственное исключение - China National AI Industry Investment Fund. Этот фонд инвестирует напрямую в DeepSeek и получает право голоса. Его вклад составляет 1 млрд юаней.
Обычные инвесторы не получают права голоса, но получают доступ к финансовой информации и приоритетное право участия в будущих раундах. Все доли инвесторов заблокированы на пять лет, чтобы снизить риск краткосрочной спекуляции.
Крупные инвесторы:
* Лян Вэньфэн — 20 млрд юаней
* Tencent — 10 млрд юаней
* CATL — 5 млрд юаней
* JD.com — 3 млрд юаней
* NetEase — 3 млрд юаней
* IDG Capital — 3 млрд юаней
Сообщается, что менеджмент DeepSeek тщательно проверяет личности LP-инвесторов, которые стоят за инвестиционными фондами.
Раньше DeepSeek работала без внешнего финансирования, но растущие расходы на вычисления и усиливающаяся борьба за AI-таланты сделали привлечение капитала необходимым.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍6
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤣2🌚1
Hugging Face выкатили Serge, опенсорсного ИИ-ревьюера для GitHub.
Работает просто: вызываете агента в комментариях к pull request, и он сам проходит по diff, ищет баги, спорные места и оставляет замечания прямо в PR.
Что удобно:
* можно задавать правила ревью прямо в репозитории
* можно указать, на что агент должен обращать внимание
* можно заранее описать, что стоит игнорировать
* ревью запускается через обычный комментарий
* проект open source
Разработчики Hugging Face уже используют Serge внутри компании, в том числе для ревью в diffusers и transformers.
По сути, это ещё один шаг к новой норме: ревью кода становится не только задачей людей, но и постоянным AI-слоем поверх GitHub.
Не замена нормальному code review, а дополнительный фильтр, который может поймать очевидные баги, регрессии и странные решения до того, как до них дойдёт человек.
https://huggingface.co/blog/huggingface/serge
Работает просто: вызываете агента в комментариях к pull request, и он сам проходит по diff, ищет баги, спорные места и оставляет замечания прямо в PR.
Что удобно:
* можно задавать правила ревью прямо в репозитории
* можно указать, на что агент должен обращать внимание
* можно заранее описать, что стоит игнорировать
* ревью запускается через обычный комментарий
* проект open source
Разработчики Hugging Face уже используют Serge внутри компании, в том числе для ревью в diffusers и transformers.
По сути, это ещё один шаг к новой норме: ревью кода становится не только задачей людей, но и постоянным AI-слоем поверх GitHub.
Не замена нормальному code review, а дополнительный фильтр, который может поймать очевидные баги, регрессии и странные решения до того, как до них дойдёт человек.
https://huggingface.co/blog/huggingface/serge
👍15❤3🔥2