Что умеет:
- работать как гибридный агент с GUI и CLI
- решать задачи с визуальными и текстовыми данными
- помогать в кодинге и продуктивной работе
- принимать входные данные разных форматов
- анализировать изображения, рассуждать по ним и привязывать ответы к конкретным объектам
- использовать поиск для более точных ответов
- переноситься между разными агентными фреймворками
Qwen3.7-Plus доступна через API в Alibaba Cloud Model Studio.
Blog: https://qwen.ai/blog?id=qwen3.7-plus
Qwen Studio: https://chat.qwen.ai/?models=qwen3.7-plus
API: https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.7-plus&serviceSite=international
@ai_machinelearning_big_data
#qwen #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤71👍32🔥12🐳2🍓1
Media is too big
VIEW IN TELEGRAM
Создатель Claude направил финансовому регулятору предварительный проект заявления на проведение IPO. Сроки листинга, объем выпускаемых бумаг и ценовой диапазон не утверждены - выход на биржу зависит от рыночной конъюнктуры.
Заявке предшествовал раунд финансирования на $65 млрд, после которого оценка стартапа приблизилась к $1 трлн.
Юридически Anthropic зарегистрирована как Public Benefit Corporation, что обязывает компанию балансировать между извлечением прибыли и общественной пользой.
anthropic.com
Проект стоимостью 45 млрд евро анонсирован на саммите Choose France.
На первом этапе к 2031 году в регионе О-де-Франс развернут мощности на 3,1 ГВт. К реализации привлекли локальных партнеров: Schneider Electric развернет производственный кластер компонентов для ЦОД, а стартап Sesterce поможет со строительством. Локация выбрана из-за стабильного доступа к энергосети и местной технологической экосистемы.
Новые ЦОД дополнят глобальную инфраструктуру SoftBank. Компания уже участвует в строительстве гигаваттного дата-центра в Абу-Даби, финансирует обучение суверенной модели на 1 трлн параметров в Японии и открывает центры проектирования чипов в Южной Корее.
group.softbank
Инструмент Computer Use, ранее доступный только на macOS, позволяет модели самостоятельно взаимодействовать с файлами и системными ресурсами.
Обновление нацелено на автоматизацию тестирования софта, поиска багов и проверки кода. Навигация и вызов приложений осуществляются через специальные текстовые теги.
Удаленный доступ к Codex интегрировали в мобильное приложение ChatGPT для iOS и Android. Пользователи могут ставить задачи и мониторить процессы на рабочей станции со смартфона.
OpenAI в сети Х
Nvidia анонсировала открытую MoE-модель Nemotron 3 Ultra с архитектурой на 550 млрд параметров, из которых 55 млрд активны при генерации.
По оценке Artificial Analysis, модель обошла Gemma 4 и gpt-oss-120b. Выше в рейтинге остаются китайская Kimi K2.6 и закрытые флагманы уровня Opus 4.8.
Скорость Nemotron 3 Ultra при тестировании через провайдера DeepInfra превышает 300 токенов в секунду. Открытые модели сопоставимого размера от DeepSeek и Moonshot генерируют 50–100 токенов. Релиз на Hugging Face, OpenRouter и других площадках запланирован на 4 июня.
Artificial Analysis в сети Х
Директор по машинному обучению и ИИ Apple Келси Петерсон перешла в OpenAI. По данным журналиста Bloomberg Марка Гурмана, уход состоялся за неделю до WWDC 2026, где планируется презентация обновленного голосового ассистента.
Петерсон работала в Apple с 2015 года и отвечала за внедрение Apple Intelligence в Siri. На WWDC 2024 она проводила первую демонстрацию помощника с поддержкой кросс-апп контекста и многоэтапных задач. Позже релиз перенесли для доработки стандартов качества проекта.
Презентацию новой версии Siri 8 июня проведет другой спикер.
Mark Gurman в сети Х
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍70👏26❤19🔥15🤩5🎉2🤷♂1🦄1
Forwarded from Machine learning Interview
Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ
Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа.
DeepSeek уже показал отличные результаты на чипах NVIDIA до санкций. У компании было рабочее решение, но Вэньфэнг пошел другим путем. Проект занял месяцы, потребовал огромных ресурсов и задержал выпуск новой версии модели. Но результат стоил того.
Что получилось на выходе:
- DeepSeek полностью работает на чипах Huawei Ascend без потери качества
- Доказано, что чипы Huawei способны тянуть полноценные ИИ-нагрузки
- Другие китайские ИИ-компании теперь имеют реальный повод перейти с NVIDIA на Huawei
- Большая часть зависимости от американских поставщиков чипов убрана
Вэньфэнг нес огромное давление, сроки сдвинулись, команда работала без гарантий что выйдет рабочее решение. Но он довел дело до конца и доказал: китайская ИИ-индустрия может строить свой собственный стек, не завися от того, дадут ли следующую партию поставок через Тихий океан.
@machinelearning_interview
Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа.
DeepSeek уже показал отличные результаты на чипах NVIDIA до санкций. У компании было рабочее решение, но Вэньфэнг пошел другим путем. Проект занял месяцы, потребовал огромных ресурсов и задержал выпуск новой версии модели. Но результат стоил того.
Что получилось на выходе:
- DeepSeek полностью работает на чипах Huawei Ascend без потери качества
- Доказано, что чипы Huawei способны тянуть полноценные ИИ-нагрузки
- Другие китайские ИИ-компании теперь имеют реальный повод перейти с NVIDIA на Huawei
- Большая часть зависимости от американских поставщиков чипов убрана
Вэньфэнг нес огромное давление, сроки сдвинулись, команда работала без гарантий что выйдет рабочее решение. Но он довел дело до конца и доказал: китайская ИИ-индустрия может строить свой собственный стек, не завися от того, дадут ли следующую партию поставок через Тихий океан.
@machinelearning_interview
2🔥378👍131❤50👏26🤷♂6😨4⚡3😁3🥱3❤🔥2🎉2
Проект вырос из исследований по симуляции физического мира, к которым присоединилась команда видеогенератора Sora.
На начальном этапе компания сосредоточится на разработке специализированных машин для помощи в строительстве инфраструктуры.
Конечная цель проекта - обеспечить каждого человека персональным роботом, способным выполнять любые бытовые и рабочие поручения.
В 2020 году компания закрыла предыдущие проекты в робототехнике из-за дефицита обучающих данных.
Для перезапуска направления OpenAI открыла наем инженеров по аппаратному обеспечению, системной интеграции и ML.
Возвращение связано с развитием воплощенного ИИ: взаимодействие алгоритмов с физической средой позволит собрать массивы данных, необходимых для обучения AGI.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡113🔥65🤔20😁19🎉18❤14👍4🍓2💔1
2 июня в Сан‑Франциско открылась ежегодная конференция для разработчиков Microsoft Build 2026. Программный доклад провёл гендиректор компании Сатья Наделла, центральная тема - агентные системы.
На открытии выступили: глава Nvidia Дженсен Хуанг (по видеосвязи), гендиректор Qualcomm Кристиано Амон и создатель OpenClaw Питер Штайнбергер.
В первый день компания представила несколько групп продуктов и сервисов.
Гендиректор Microsoft AI Мустафа Сулейман анонсировал семейство из 7 новых моделей MAI для работы с изображениями, голосом, транскрипцией и кодом.
Среди названных - MAI‑Thinking‑1 (ризонинг-модель, обученная без дистилляции с 35 млрд активных параметров и окном контекста 128K), MAI‑Code‑1-Flash (заточена под GitHub и VS Code), а также MAI‑Image‑2.5 и MAI‑-Voice-2.
Microsoft представила новую категорию Autopilots, всегда активных агентов с собственной идентичностью, работающих в фоне и действующих от имени пользователя.
Первым стал Scout - персональный ассистент в Windows, построенный на OpenClaw. Он работает с приложениями Microsoft 365 и предназначен для фоновых задач (ведение календаря, отчётности по расходам и подготовка писем).
Scout доступен в режиме превью для клиентов программы Frontier в США.
Также анонсирован Microsoft IQ, слой контекста для агентов (Work IQ, Fabric IQ, Web IQ), который станет общедоступным в GitHub Copilot, Foundry и Copilot Studio.
Сообщили о запуске десктопного приложения GitHub Copilot (в режиме предварительного доступа), функции Frontier Tuning для дообучения агентов в рамках корпоративных требований (закрытый превью), а также Project Rayfin - управляемого бэкенда на платформе Microsoft Fabric.
Windows получает функции для разработчиков: набор Coreutils (Linux-подобные утилиты командной строки, работающие в Windows 11 нативно), создание и запуск Linux-контейнеров через WSL и новый Intelligent Terminal, передающий контекст ИИ-агенту.
Отдельно показали платформу Project Solara для устройств, которые работают на ИИ‑агентах. Microsoft показала два референс‑дизайна (настольный хаб с распознаванием лица и носимый бейдж с камерой и расшифровкой разговоров).
Анонсировали виртуальные машины Azure Cobalt 200 (сказали о приросте производительности на 50%), ускоритель второго поколения Maia 200, базу данных Azure HorizonDB на основе PostgreSQL, а также Foundry Local на Azure Local для развёртывания суверенного ИИ.
Спустя год после чипа Majorana 1 Наделла представил Majorana 2 - следующее поколение, компания заявляет о кубитах примерно в 1000 раз точнее за счёт нового материала на основе свинца и о цели создать квантовый компьютер к 2029 году.
На второй, заключительный день конференции, ожидаются технические сессии и демонстрации по агентам, Copilot, Azure Foundry и локальному ИИ в Windows.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔60👍57❤18🔥15🎉15👌6🗿1
Media is too big
VIEW IN TELEGRAM
Президент США подписал указ о кибербезопасности в сфере ИИ. Разработчикам передовых закрытых моделей предлагают добровольно предоставлять государству доступ к продуктам за 30 дней до релиза для аудита безопасности и поиска уязвимостей.
Изначальный 90-дневный период проверки сократили по требованию IT-индустрии. Финальный документ прямо запрещает вводить обязательное государственное лицензирование и принудительную премодерацию.
Одновременно Минфин, Пентагон и АНБ создадут совместный координационный центр. Структура займется защитой правительственной IT-инфраструктуры: автоматизирует сканирование федеральных систем и будет координировать противодействие кибератакам с использованием нейросетей.
whitehouse.gov
Компания выпустила обновление Codex для пользователей без технического бэкграунда. В продукт добавили 62 ролевых плагина и 110 функций для аналитиков, дизайнеров, инвестбанкиров и специалистов по продажам.
Среди новых инструментов - Sites для конвертации отчетов в интерактивные веб-страницы и Annotations для редактирования фрагментов текста или таблиц через промпты.
Платформа открыта для сторонних разработчиков. Первыми партнерами по интеграции стали Wix, Figma и Replit. Планируется релиз плагинов для корпоративных финансов, консалтинга и юриспруденции.
Прирост нетехнической аудитории в 3 раза опережает рост базы разработчиков, OpenAI отчиталась о еженедельной аудитории в 5 млн человек.
openai.com
К инициативе по поиску уязвимостей в критической инфраструктуре (энергетике, водоснабжении, здравоохранении и связи) присоединились 150 организаций из 15 стран.
По данным компании, первые 50 участников выявили с её помощью более 10 тысяч багов. Доступ к технологии также может получить Агентство ЕС по кибербезопасности. Anthropic планирует открыть широкий доступ к Mythos в ближайшие недели после внедрения систем защиты.
По прогнозам компании, генеративные модели уровня Mythos от конкурентов появятся через 6–12 месяцев.
anthropic.com
ИИ-поисковик представил архитектуру Search as Code, в которой модели компании работают как планировщики: они анализируют задачу и генерируют Python-код для создания поисковых пайплайнов.
Процесс состоит из 3-х уровней: LLM управляет логикой и пишет код, скрипт выполняется в песочнице для фильтрации, агрегации и дедупликации данных, а за извлечение, парсинг и ранжирование информации отвечает инструмент Agentic Search SDK.
Агенты могут запускать параллельные запросы и динамически корректировать стратегию. Search as Code позволяет обрабатывать сырые данные программными алгоритмами в песочнице до их передачи в языковую модель, что предотвращает перегрузку контекстного окна LLM.
perplexity.ai
Председатель SK Group заявил на конференции Computex, что расширение связано со спросом на высокопроизводительную память для ИИ-ускорителей. По прогнозам руководства, дефицит комплектующих на этом рынке сохранится до 2030 года.
Главным партнером SK Hynix остается Nvidia, южнокорейский вендор планирует стать основным поставщиком HBM для будущей архитектуры Rubin. Сроки внедрения следующего стандарта памяти, HBM4E, также напрямую зависят от Nvidia, которая пока выступает его единственным заказчиком.
Глава чипмейкера также предостерег индустрию от завышения цен на HBM и DRAM. По его словам, резкий рост стоимости памяти подорвет долгосрочное развитие ИИ-экосистемы.
reuters.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93❤25👏23🔥18🤔12😁3
Компания сообщила, что полностью сбросила пятичасовой и недельный лимиты для всех подписчиков тарифов Pro и Max.
Это решение должно компенсировать платным пользователям повышенный расход ресурсов, вызванный программным сбоем.
Причиной проблемы стало то, что некоторые сессии Claude Code ошибочно запускали большое число параллельных субагентов. Из-за этого квоты расходовались заметно быстрее, чем предполагалось.
Пользователи жаловались в соцсетях на аномально быстрое исчерпание квот при работе с Claude Code: в ряде случаев дневной лимит заканчивался уже после нескольких простых запросов.
В сообществе разработчиком высказывались предположения, что резкое сокращение доступных квот связано с новой версией функции Dynamic Workflows. Anthropic это опровергла.
Согласно пояснению, причина кроется в особенностях обработки запросов к Opus 4.8: из-за них модель инициировала больше одновременных вызовов инструментов, чем было заложено.
Сам сбой, как утверждается, уже устранён.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍134❤34👏26🤔17👌10🔥9😁7🤨5👨💻2🎃2
Media is too big
VIEW IN TELEGRAM
DeepMind опубликовала веса мультимодальной модели Gemma 4 12B, которая обрабатывает текст, изображения и аудио без использования отдельных энкодеров.
Отказ от внешних модулей снизил вычислительную задержку и требования к памяти. Модель работает локально на устройствах с 16 ГБ ОЗУ, показывая в бенчмарках результаты на уровне моделей класса 26B.
Веса выложены на Hugging Face, поддержка модели добавлена в Ollama и LM Studio. Лицензия Apache 2.0, допускающая коммерческое применение.
blog.google
Ideogram 4.0 получила поддержку разрешения 2K, создание прозрачного фона и позиционирование объектов через bounding boxes. Сохранен фокус на качественном рендеринге текста для логотипов и постеров.
На DesignArena, модель заняла 1 место среди открытых решений, уступив только проприетарным системам OpenAI и Google.
Код и веса опубликованы в открытом доступе. Для коммерческого применения требуется покупка платной лицензии.
Доступен API стоимостью от $0.03 до $0.10 за генерацию в зависимости от качества. Модель есть на площадках ComfyUI, Replicate и Leonardo AI.
В будущих обновлениях обещают добавить работу со слоями и редактируемый текст.
ideogram.ai
Система напрямую взаимодействует с локальными файлами, системными утилитами и десктопными приложениями Microsoft (Word, Excel, PowerPoint, Outlook).
Архитектура разбивает запросы на подзадачи и распределяет их между пулом агентов. Personal Computer сортирует директории, переносит метрики из локальных таблиц в презентации и сверяет документы с веб-выдачей.
В интеграции с браузером Comet агент управляет интерфейсами сайтов: заполняет формы, бронирует слоты в календаре и работает с корпоративными платформами. Поддерживается синхронизация - запущенную на смартфоне задачу можно продолжить на ПК. Продукт доступен по листу ожидания для подписчиков Max и Enterprise Max.
perplexity.ai
Hermes Desktop - превью-версия приложения под лицензией MIT для развертывания ИИ-агентов на Windows, macOS и Linux. Инструмент работает из терминала, электронной почты и мессенджеров.
Hermes планирует задачи на естественном языке и использует постоянную память для сохранения контекста проектов. Архитектура поддерживает делегирование: система запускает субагентов с отдельными терминалами для выполнения Python-скриптов, веб-поиска, генерации изображений и синтеза речи.
Для изоляции исполняемого кода доступны пять песочниц: локальная среда, Docker, SSH, Singularity и Modal. Обращения к LLM маршрутизируются через платформу Nous Portal, на которой есть более 300 моделей, в том числе по бесплатным тарифам.
nousresearch.com
Институт в коллаборации с IBM Research представил ChartNet - синтетический датасет из 1,5 млн диаграмм для обучения vision-моделей.
Авторы конвертировали существующие графики в исполняемый код, а затем программно модифицировали его для генерации новых примеров.
Датасет включает 24 типа диаграмм на базе 6 библиотек визуализации. Каждый сэмпл содержит сгенерированное изображение, исходный код, таблицу данных и текстовое описание.
По заявлению разработчиков, дообучение на ChartNet позволило компактным моделям превзойти более крупные проприетарные системы в профильных бенчмарках по извлечению визуальной информации.
news.mit.edu
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩96❤22👍21👏21🔥19🎉11💯7
В Яндекс Музыке появилась первая функция ИИ-компаньона люмена
Пользователи могут разбудить своих ИИ-помощников в поиске стриминга, задав туда текстовый запрос, — и получить на его основе гиперконтекстную Мою волну.
Люмен переводит свободную человеческую речь в параметры для рекомендаций, а дальше алгоритмы Моей волны подбирают нужные треки.
Они учитывают предпочтения юзера и характеристики композиций из каталога, а также контекст их прослушивания: время суток, день недели и устройство, с которого пользователь слушает треки.
Похоже, в ИИ-ассистентах все больше ценится именно отзывчивость. По словам разработчиков, люмен со временем начинает лучше понимать юзера, укрепляя эмоциональную связь между слушателем и площадкой.
@ai_machinelearning_big_data
Пользователи могут разбудить своих ИИ-помощников в поиске стриминга, задав туда текстовый запрос, — и получить на его основе гиперконтекстную Мою волну.
Люмен переводит свободную человеческую речь в параметры для рекомендаций, а дальше алгоритмы Моей волны подбирают нужные треки.
Они учитывают предпочтения юзера и характеристики композиций из каталога, а также контекст их прослушивания: время суток, день недели и устройство, с которого пользователь слушает треки.
Похоже, в ИИ-ассистентах все больше ценится именно отзывчивость. По словам разработчиков, люмен со временем начинает лучше понимать юзера, укрепляя эмоциональную связь между слушателем и площадкой.
@ai_machinelearning_big_data
👍77🤣55❤22🎉14👀5🙈4🌚2🤷♂1😈1💘1
Китайская компания проводит первый в своей истории раунд привлечения внешнего капитала около 50 млрд юаней ($7,4 млрд).
По данным агентства Reuters, после вложений компанию оценят в 350–400 млрд юаней ($52–59 млрд).
Крупнейшими внешними инвесторами могут стать интернет-холдинг Tencent и производитель аккумуляторов CATL: первый рассматривает вложение 10 млрд юаней, второй - 5 млрд.
Основатель DeepSeek Liang Wenfeng, по словам источников, внесёт 20 млрд юаней собственных средств (это самый крупный частный взнос в раунде).
Переговоры также ведутся с государственным фондом поддержки ИИ КНР, а также с NetEase и JD.com. Общее число инвесторов, как ожидается, не превысит десяти. Среди возможных участников называют гонконгские IDG Capital и Monolith Management.
На фоне западных сделок раунд выглядит скромно: Anthropic в прошлом месяце привлёк $65 млрд, OpenAI в марте - $122 млрд.
О планах выхода на биржу DeepSeek пока не заявлял.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍93❤41👏16🤔10🔥9🎉9💘2
NVIDIA выкатили Nemotron 3 Ultra (550B-A55B) - свою самую сильную open-weight модель на сегодня, причём вместе с полной схемой обучения.
Главный фокус на эффективность инференса в реальных long-context agentic сценариях, где модель долго держит контекст, работает с инструментами и выполняет многошаговые задачи.
Открыли почти всё:
• base-модель
• post-trained версии
• reward checkpoints
• NVFP4-квантованные версии
• тренировочные данные
• рецепты обучения
Технически внутри тоже интересно:
• 550B параметров всего, 55B активных
• гибридная архитектура Mamba2 + Transformer
• примерно 4:1 в пользу Mamba относительно Attention
• претрейн в NVFP4 на 20T токенов
• LatentMoE-архитектура
• двухэтапный MOPD post-training
• нативная поддержка MTP
🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf
@ai_machinelearning_big_data
Главный фокус на эффективность инференса в реальных long-context agentic сценариях, где модель долго держит контекст, работает с инструментами и выполняет многошаговые задачи.
Открыли почти всё:
• base-модель
• post-trained версии
• reward checkpoints
• NVFP4-квантованные версии
• тренировочные данные
• рецепты обучения
Технически внутри тоже интересно:
• 550B параметров всего, 55B активных
• гибридная архитектура Mamba2 + Transformer
• примерно 4:1 в пользу Mamba относительно Attention
• претрейн в NVFP4 на 20T токенов
• LatentMoE-архитектура
• двухэтапный MOPD post-training
• нативная поддержка MTP
🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf
@ai_machinelearning_big_data
👍77❤63🔥34🌚3😈3🤔1💘1
Media is too big
VIEW IN TELEGRAM
OpenAI начала развертывание автоматической фоновой памяти для ChatGPT в США на тарифах Plus и Pro. В основе системы лежит механизм фоновой организации данных Dreaming.
Модель самостоятельно извлекает контекст, детали рабочих проектов и предпочтения из множества сессий без прямых команд на запоминание. Главное отличие новой архитектуры - динамическое обновление фактов.
Алгоритм актуализирует информацию со временем, понижая значимость устаревших данных. Прежняя реализация памяти полагалась на статичные факты, требовавшие ручного управления.
В ближайшие недели OpenAI расширит географию доступа и откроет функцию для пользователей бесплатных аккаунтов.
openai.com
Компания выпустила превью-версию модели Grok Imagine Video 1.5 для генерации 720p-видео по картинке. Релиз позиционируется как конкурент Seedance и Google Veo.
Модель анимирует изображение по текстовым промптам: задается направление движения камеры, динамика и атмосфера сцены. Алгоритм сохраняет оригинальную детализацию и схему освещения исходника.
Также поддерживается склейка нескольких планов в длинные ролики с сохранением визуальной консистентности. Доступ к новинке открыт через API.
x.ai
Сделка оценивается в 400 млн долларов. Наработки Kumo интегрируют в платформу Nvidia AI Foundry, где корпоративные клиенты смогут обучать кастомные модели на внутренних реляционных базах.
Стек Kumo адаптирован для анализа сложных структур из множества связанных таблиц, которые тяжело обрабатывать классическими LLM. Алгоритмы комбинируют графовое машинное обучение и генерацию синтетических данных. Платформа решает задачи предиктивной аналитики: от прогнозирования оттока пользователей до оценки вероятности финансовых дефолтов.
В рамках сделки в Nvidia перейдет команда стартапа. Среди действующих клиентов Kumo - DoorDash, Reddit, Databricks и Snowflake. Актуальная модель стартапа вышла в апреле этого года.
theinformation.com
Reve представила новый генератор картинок на архитектуре Large Layout Model. Система отходит от классической генерации по тексту и работает через макеты: каждый визуальный элемент получает точные координаты, размер и описание.
Модель прошла дополнительный пространственный претрейн на базе Qwen. Изображение представляется как код, что позволяет управлять результатом через промпт или точечно редактировать JSON-структуру макета.
По заявлению авторов, на обучение ушло в 10 раз меньше вычислительных мощностей по сравнению с корпоративными аналогами. Модель занимает вторую строчку в бенчмарке Text-to-Image ArenaAi, обходя Nano Banana 2 и GPT-Image-1.5.
blog.reve.com
По данным Cloudflare, доля машинного веб-трафика достигла 57,5%, превысив активность людей (42,5%). По словам гендиректора компании Мэттью Принса, рубеж пройден на несколько лет раньше прогнозируемого 2027 года.
Рост обусловлен не классическими скриптами (краулеры, спам, DDoS-сети), а автономными ИИ-агентами. Алгоритмы парсят контент для обучения нейросетей и выполняют многошаговые задачи от лица пользователей: мониторят цены, взаимодействуют со службами поддержки и оформляют заказы.
Cloudflare классифицирует трафик верифицированных ботов и ИИ-агентов отдельно с прошлого года. Точную дату превышения машинного трафика над человеческим определить сложно из-за специфики метрик.
CEO CloudFlare в сети Х
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤46👍20🥰7🔥2👏1😢1🤣1🙈1
Anthropic опубликовала аналитический материал, в котором утверждает, что системы искусственного интеллекта всё активнее участвуют в создании следующих поколений ИИ.
Материал подготовлен исследовательским подразделением Anthropic Institute. Его авторы - Марина Фаваро и сооснователь компании, глава отдела политики Джек Кларк.
Отрасль приближается к рекурсивному самоулучшению
Это состояние, когда ИИ способен самостоятельно проектировать и совершенствовать собственного преемника быстрее, чем к этому будут готовы правительства и институты.
При этом Anthropic оговаривается, что до полностью автономной разработки ещё далеко и что такой сценарий не является неизбежным, люди по-прежнему нужны. Они ставят цели, оценивают результаты и решают, какие направления важны.
На май 2026 года Claude написал более 80% кода, добавляемого в кодовую базу Anthropic.
До запуска Claude Code этот показатель измерялся единицами процентов.
Во втором квартале 2026 года типичный инженер вносил в проекты примерно в 8 раз больше кода в день, чем в 2024-м.
Время выполнения задач, которые модели способны надёжно решать без участия человека, удваивается примерно каждые 4 месяца.
В начале 2024 года Opus 3 справлялся с задачами длиной в несколько минут, годом позже Sonnet 3.7 примерно за полтора часа, а Opus 4.6 - до 12 часов.
На SWE-bench, проверяющем исправление реальных ошибок в коде, передовые модели за два года прошли путь от низких результатов до почти предельных.
Джек Кларк говорит, что компания хочет, чтобы законодатели и институты понимали, что может произойти дальше.
По его словам, цель Anthropic - "заранее обозначить концепцию и дать людям представление о том, что приближается".
Прогресс ИИ, по его оценке, скорее ускоряется, чем замедляется, и может принести значительные результаты в медицине и науке, но требует инструментов для проверки и подтверждения работы, выполненной ИИ.
Anthropic выступает за то, чтобы у мира оставалась возможность при необходимости замедлить или временно приостановить разработку передовых моделей, но понимает, что это потребует согласованных всех игроков индустрии в разных странах и механизмов взаимной проверки.
В ближайшие месяцы компания обсудит эти вопросы с законодателями, исследователями и другими участниками отрасли.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔116❤76👍37👌15🔥14👏8😁6🤩4🤝4👨💻2🥰1