Анализ данных (Data analysis)
50.2K subscribers
3.25K photos
408 videos
1 file
2.69K links
Data science, наука о данных.

@haarrp - админ

РКН: clck.ru/3FmyAp
Download Telegram
Forwarded from Machinelearning
📌ИИ уже ускоряет разработку новых моделей

Anthropic опубликовала аналитический материал, в котором утверждает, что системы искусственного интеллекта всё активнее участвуют в создании следующих поколений ИИ.

Материал подготовлен исследовательским подразделением Anthropic Institute. Его авторы - Марина Фаваро и сооснователь компании, глава отдела политики Джек Кларк.


Отрасль приближается к рекурсивному самоулучшению

Это состояние, когда ИИ способен самостоятельно проектировать и совершенствовать собственного преемника быстрее, чем к этому будут готовы правительства и институты.


При этом Anthropic оговаривается, что до полностью автономной разработки ещё далеко и что такой сценарий не является неизбежным, люди по-прежнему нужны. Они ставят цели, оценивают результаты и решают, какие направления важны.

🟡Внутренние данные

На май 2026 года Claude написал более 80% кода, добавляемого в кодовую базу Anthropic.

До запуска Claude Code этот показатель измерялся единицами процентов.


Во втором квартале 2026 года типичный инженер вносил в проекты примерно в 8 раз больше кода в день, чем в 2024-м.

🟡Публичные тесты

Время выполнения задач, которые модели способны надёжно решать без участия человека, удваивается примерно каждые 4 месяца.

В начале 2024 года Opus 3 справлялся с задачами длиной в несколько минут, годом позже Sonnet 3.7 примерно за полтора часа, а Opus 4.6 - до 12 часов.


На SWE-bench, проверяющем исправление реальных ошибок в коде, передовые модели за два года прошли путь от низких результатов до почти предельных.

Джек Кларк говорит, что компания хочет, чтобы законодатели и институты понимали, что может произойти дальше.

По его словам, цель Anthropic - "заранее обозначить концепцию и дать людям представление о том, что приближается".


Прогресс ИИ, по его оценке, скорее ускоряется, чем замедляется, и может принести значительные результаты в медицине и науке, но требует инструментов для проверки и подтверждения работы, выполненной ИИ.

Anthropic выступает за то, чтобы у мира оставалась возможность при необходимости замедлить или временно приостановить разработку передовых моделей, но понимает, что это потребует согласованных всех игроков индустрии в разных странах и механизмов взаимной проверки.

В ближайшие месяцы компания обсудит эти вопросы с законодателями, исследователями и другими участниками отрасли.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
8🥱5🔥2😱2👍1
Claude догнал профессиональный химический софт в анализе ЯМР - без дообучения под химию.

Anthropic проверили Claude на ЯМР-спектрах - это метод, по которому химики понимают, какую молекулу они синтезировали. Взяли 20 соединений из свежих препринтов, вышедших уже после даты обучения моделей, и сравнили Claude с ChemDraw и MestReNova.

Что получилось:

- в задаче «предсказать спектр по структуре» Opus 4.7 оказался точнее всех по водороду
- по углероду вышел примерно на уровень специализированного софта
- по форме пиков заметно обошёл классические инструменты
- расщепление пиков угадывал примерно в 80% случаев против 26–35% у обычных тулов

Обратная задача ещё интереснее: восстановить структуру молекулы по спектру.

Специализированный софт такое умеет, но обычно требует 2D-ЯМР, лицензий и человека, который понимает, как с этим работать. Claude же справляется по обычному списку пиков и масс-спектру - по сути, по данным, которые химик мог бы просто скинуть в чат.

Результат:

- 8 из 8 простых молекул восстановлены правильно
- 4 из 7 сложных молекул восстановлены идеально

Выборка пока маленькая, и авторы честно подают это как ориентир, а не финальный приговор химикам.


🔗 anthropic.com/research/making-claude-a-chemist
👍19🔥108🥱3🌭2
«Claude-Mythos-5» ненадолго засветился в API. Похоже, скоро релиз.

Интересно, пойдут ли они с ценами из поста про Glasswing: $25 за миллион входных токенов и $125 за миллион выходных.

Если да, это сделает Mythos примерно в 5 раз дороже Opus 4.8.

https://x.com/Machinelearrn/status/2063246572914160053
15🔥10👍6🌚2👏1
😱126👍5💯4😐4
В Юте жители подали в суд из-за гигантского ИИ-дата-центра Stratos, который продвигает Кевин О’Лири.

Проект изначально планировали как кампус на 40 000 акров в Box Elder County. Местные опасаются нагрузки на воду, энергию, экологию и фактически обхода нормального общественного обсуждения. Иск подали пять жителей и Alliance for a Better Utah: они оспаривают роль Military Installation Development Authority, структуры, которая получила слишком широкие полномочия по земле, налогам, безопасности и развитию территории.

На фоне давления О’Лири уже согласился урезать проект почти вдвое и вывести часть земли из застройки, включая участки рядом с Locomotive Springs Waterfowl Management Area. Но даже после сокращения речь всё равно идёт примерно о 20 000 акров - это больше Манхэттена.

История показательная:

- дата-центры продают как вопрос национальной безопасности
- местным обещают рабочие места и налоги
- жители получают риски по воде, земле, шуму, энергии и экологии
- решения часто двигаются быстрее, чем общество успевает понять масштаб

https://www.nbcnews.com/tech/tech-news/utah-residents-sue-officials-kevin-oleary-data-center-plan-rcna348720
👍159🔥6😁5
Google Research показали Agentic RAG для Gemini Enterprise Agent Platform - RAG, который не сдаётся после первого поиска.

Обычный RAG часто ломается на корпоративных вопросах, где ответ лежит не в одном документе, а размазан по нескольким базам. Нашёл кусок про проект, увидел только ID сервера, но не пошёл дальше искать характеристики этого сервера в другой системе - и выдал неполный ответ.

У Google идея такая: превратить RAG в многоагентный процесс.

Что внутри:

- Orchestrator понимает, что запрос не решается за один шаг
- Planner разбивает задачу на маршруты поиска
- Query Rewriter переписывает вопрос в несколько точных запросов
- Search Fanout ищет по разным источникам
- Sufficient Context Agent проверяет, хватает ли данных для ответа

Модель проверяет: закрыты ли все части вопроса. Если данных не хватает, она явно пишет, чего именно не хватает, и отправляет систему искать дальше.

На FramesQA такой подход дал до 34% прироста точности по сравнению со стандартным RAG. В cross-corpus сценарии, где нужно выбрать правильный источник из нескольких, система ответила правильно на 90.1% вопросов.

По сути, Google двигает RAG от «поиска + генерации» к маленькому исследовательскому пайплайну, где есть планирование, маршрутизация, проверка контекста и повторный поиск.

Для enterprise это важнее красивых демо: меньше галлюцинаций, больше трассируемости и понятнее, почему система дала именно такой ответ.

research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/
👍2911🔥6🥱4
This media is not supported in your browser
VIEW IN TELEGRAM
Китайская UBTECH Robotics показала тизеры humanoid-роботов серии U1 для массового рынка.

В линейке две бионические модели:

- старшая версия - 183 см и 42 кг
- младшая версия - 168 см и 35,2 кг
- 88 степеней свободы
- поддержка Wi-Fi
- встроенный ИИ для обучения и взаимодействия с окружением
- автономность до 4 часов

Полная презентация запланирована на 30 июня, но предзаказы уже открыты. По данным компании, зарезервировано 1 943 устройства.
16👍7🔥7😐6
Google, похоже, даёт Intel Foundry самый важный шанс за последние годы.

По данным The Information, Google выбрала Intel для производства 3 млн+ TPU в 2028 году. Для Intel это не просто крупный заказ, а редкий вход в цепочку поставок одного из главных конкурентов Nvidia в ИИ-железе:

- Intel становится потенциальной второй фабрикой для топовых ИИ-чипов
- Google снижает зависимость от TSMC
- рынок получает ещё одного крупного производителя advanced-node чипов
- Nvidia, Apple, Tesla и другие тоже ищут способы не упереться в один производственный узел

Сейчас TSMC фактически держит горлышко бутылки для ИИ-инфраструктуры. Спрос на ускорители растёт быстрее, чем доступные мощности, поэтому даже гигантам приходится искать запасные маршруты.

Для Google это способ масштабировать TPU и меньше зависеть от Nvidia. Для Intel - проверка, сможет ли её foundry-бизнес наконец стать не презентацией для инвесторов, а реальной альтернативой TSMC.

theinformation.com/articles/google-nvidia-consider-intel-backup-chip-manufacturer
🔥135👍3🤔3
Tencent Hunyuan выкатили UniRL - инфраструктуру для RL-посттрейнинга мультимодальных моделей.

Это попытка собрать один общий RL-цикл для разных семейств моделей: LLM, VLM, diffusion, flow matching и unified multimodal.

Обычный пайплайн выглядит знакомо:

- generate
- score
- advantage
- update
- sync

UniRL пытается сделать этот цикл универсальным. Модель и алгоритм разведены как две независимые оси, поэтому можно комбинировать разные model families и RL-алгоритмы без жёстко зашитого сценария.

Покрытие широкое: text-to-image, text/image-to-video, vision-language, text-only LLM, VLM, LLM-to-diffusion prompt enhancer, а также смешанная autoregressive + diffusion генерация вроде Hunyuan-Image 3 и Bagel.

Есть pluggable rollout engines через единый typed contract: train-side, SGLang, vLLM-Omni. Для масштабирования заявлены FSDP2 sharding и несколько deployment-режимов, которые переключаются из одного конфига.

Отдельно Tencent добавили два своих алгоритма:

- Flow-DPPO - policy optimization для flow/diffusion моделей с trust-region masks на основе exact divergence
- DRPO - RL для LLM со сглаженным advantage-weighted quadratic regularizer

UniRL выглядит как шаг к нормальному post-training стеку для моделей, которые одновременно пишут, видят, генерируют и используют разные типы rollout-движков.

Код: http://github.com/Tencent-Hunyuan/UniRL

Статья: arxiv.org/abs/2606.09821
8👍6🔥4
Что выбираете ?)
138🐳28👍8🌚6🔥5
Что сегодня определяет сильную BI-платформу? Уже не только красивые дашборды.

CNewsMarket опубликовал рейтинг российских BI-систем 2026 года. Аналитики сравнили решения более чем по 130 параметрам: от интеграции с источниками данных и возможностей визуализации до поддержки пользователей, партнерской экосистемы и инструментов self-service аналитики.

Главный вывод исследования — рынок BI продолжает смещаться от отчетности к принятию решений. Компаниям важно не просто собирать данные, а быстро находить инсайты, проверять гипотезы, выявлять аномалии и делать аналитику доступной для бизнес-пользователей без постоянного участия ИТ-команд.

Отдельное внимание в рейтинге уделено ИИ-функциям, работе с разнородными источниками данных и возможностям самостоятельного создания аналитики. По итогам исследования первое место занял DataLens, за ним расположились PIX BI и Luxms BI.

Похоже, что в 2026 году конкуренция между BI-платформами идет уже не столько за количество функций, сколько за скорость получения ответа на бизнес-вопрос.
👍53
😁38🤣10💯32😢2👍1🔥1
Claude 5 Fable - кратко:

- почти на всех проверенных бенчмарках модель показывает уровень SOTA
- особенно сильна в разработке, работе со знаниями, vision-задачах и научных исследованиях
- чем длиннее и сложнее задача, тем сильнее Fable 5 отрывается от других моделей Claude
- модель эффективнее расходует токены, чем прошлые версии Claude
- Fable 5 удерживает фокус на задачах длиной в миллионы токенов и улучшает результат, используя собственные заметки

Fable 5 - это не просто «лучше бенчмарки». Она эффективнее, дольше работает без потери контекста, лучше управляет длинными задачами и даёт больше возможностей для сложных агентных сценариев.

GPT-5.6 уже близко.

Интересно, выпустит ли OpenAI свой аналог Mythos.

Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.

https://www.anthropic.com/news/claude-fable-5-mythos-5
🔥1710👍9
Готов к космическому разгону AI‑продукта? 
Приходи на One Day Offer для Product Analysts! 🚀

20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.

Ты будешь:

✔️ анализировать поведение пользователей;  
✔️ проводить A/B‑тесты; 
✔️ создавать дашборды; 
✔️ работать с метриками. 

А ещё ты станешь частью крупнейшего IT‑комьюнити.

Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас!
2😁2👍1
CUDA 13.3 - это не просто очередной апдейт тулкита NVIDIA, а шаг к более высокоуровневому GPU-программированию.

Главное изменение - CUDA Tile теперь доступен в C++. Это модель, где разработчик описывает вычисления через тайлы, а низкоуровневые детали вроде параллелизма, перемещения данных, асинхронности и работы с памятью берёт на себя компилятор. Для C++-команд это важно: можно встраивать tile-подход в существующие CUDA-кодовые базы, не переписывая всё вокруг нового DSL.

Что ещё добавили:

- CUDA Tile C++ для более компактных и переносимых GPU-кернелов
- поддержку Hopper с Compute Capability 9.0
- CompileIQ - автонастройку компилятора под конкретные кернелы
- CUDA Python 1.0 как стабильную версию Python-интерфейса к CUDA
- обновления для checkpointing, IPC и работы с контекстами
- улучшения для tensor interoperability

Самое интересное здесь не «ещё немного быстрее», а смена уровня абстракции. NVIDIA постепенно двигает CUDA от ручного управления потоками, памятью и синхронизацией к модели, где разработчик описывает вычисления, а компилятор сам ищет эффективный путь к железу.

Для AI-инфраструктуры это особенно важно. Кастомные кернелы для attention, GEMM и инференса остаются узким местом, но писать их руками дорого и сложно. CUDA 13.3 делает этот слой доступнее для C++, Python и production-команд, которые хотят выжимать производительность без полного погружения в низкоуровневую CUDA-магию.

NVIDIA явно строит не просто GPU, а полный стек: язык, компилятор, runtime, Python-интерфейсы и инструменты автооптимизации.

https://developer.nvidia.com/blog/nvidia-cuda-13-3-enhances-gpu-development-with-tile-programming-in-c-compiler-autotuning-and-python-updates
15🔥7🥰3
Отличные новости из нового исследования, опубликованного в Nature. Слово «историческое» тут действительно уместно.

Пациент впервые получил генную терапию, которая должна заставить повреждённые нейроны глаза снова вести себя как молодые клетки.

Важно, что речь не об обычных клетках глаза. Мишень терапии — нейроны центральной нервной системы, похожие на клетки мозга. Обычно после повреждения они почти не восстанавливаются.

Если подход сработает, это станет ранним признаком того, что медицина может научиться чинить нервную ткань, которую раньше считали необратимо повреждённой.

https://www.nature.com/articles/d41586-026-01836-7
43🔥12👍9