297K subscribers
5.06K photos
1.14K videos
17 files
5.42K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
DiffusionGemma — это новая экспериментальная открытая модель Google с ускорением вывода до 4 раз на выделенных GPU.

Вместо предсказания слово за словом она генерирует целые блоки текста одновременно.

Это позволяет модели самостоятельно исправлять ошибки и форматировать сложный markdown в реальном времени.

goo.gle/4vG0xcI
👍95🔥51👏149🥰5😁3👀1
🌟 TencentHY открыла фреймворк для RL-дообучения мультимодальных моделей

UniRL построен вокруг концепции универсального цикла:

сгенерировать примеры → оценить их → посчитать преимущества → обновить политику → синхронизировать веса обратно с воркерами роллаута.


Большинство RL-стеков заточены под одну модальность, UniRL применяет этот цикл к text2image, text/image2video, VL, LLM, связке LLM+диффузия и унифицированным авторегрессионно-диффузионным архитектурам.

Точка входа загружает конфиг и создаёт доменный тренер, который координирует подключаемые движки (train-side, SGLang, vLLM-Omni), алгоритмы, наборы моделей и сервисы наград поверх общего рантайма - Ray, FSDP2-шардинг, Transfer Queue, синхронизация весов LoRA или full.

🟡Релиз сопровождают 2 авторских алгоритма

Flow-DPPO для flow matching и диффузионных моделей.

Метод заменяет клиппинг отношения вероятностей прямым ограничением по дивергенции.


В экспериментах TencentHY на SD3.5, FLUX2-9B и FLUX.1-dev метод показал более высокие награды и меньшую подверженность катастрофическому забыванию, чем базовые Flow-GRPO, Flow-CPS, GRPO-Guard и Diffusion-NFT.

DRPO для текстовых LLM

Это RL на уровне токенов с квадратичным регуляризатором, взвешенным по преимуществу.


DRPO проявил себя в режиме FP8, где GRPO и SPO часто теряли устойчивость. Проверяли на математических задачах на нескольких моделях линейки Qwen3 и на DeepSeek-R1-Distill-Qwen-1.5B.

🟡UniRL поддерживает семейства и модели:

🟢Stable Diffusion 3/3.5, Qwen-Image, FLUX.2-Klein;
🟢WAN 2.1/2.2, HunyuanVideo 1.0/1.5;
🟢Qwen-VL, Qwen3 (LLM);
🟢HunyuanImage3, Bagel.

Команда планирует расширить набор алгоритмов для новых семейств, распространить Flow-DPPO и DRPO на большее число моделей и добавить новые бэкенды наград и движки в разных доменах.


📌Лицензирование: Apache-2.0


🟡Страница проекта
🟡Техотчет Flow-DPPO
🟡Техотчет DRPO
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #Framework #RL #UniRL #TencentHY
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍75🔥22🤩1812👏4🎉2👌21
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ К ЧМ по футболу Google открывает бесплатный доступ к возможностям генеративного UI в AI Mode.

Этим летом функции интерактивной визуализации, обычно доступные только на тарифах Pro и Ultra, станут временно бесплатными для всех пользователей поиска Google.

Компания уже делала нечто подобное в 2022 году, но тогда возможности были далеко не такими функциональными, как сейчас.


На сложные запросы о тактике команд поисковик сможет генерировать не просто текстовые ответы, а интерактивные графические схемы, наглядно объясняющие расстановку сил и конкретные игровые ситуации на поле.

Помимо этого, компания существенно обновляет спортивный интерфейс и функциональность приложения Gemini. Оно научилось в реальном времени подтягивать актуальные результаты матчей, генерируя динамические виджеты со статистикой, анимациями и медиафайлами.

Изменения также затронули страницу live-результатов: появилась обновленная панель турнирных таблиц и улучшенная интеграция с сервисами трансляций.

Развертывание функционала уже идет полным ходом и станет доступно к началу турнира.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👏76🎉35🤩2012👍5🤔21
Media is too big
VIEW IN TELEGRAM
✔️ IPO OpenAI произойдет в 2027 году

Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.

Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.

Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.

В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com

✔️ Arcee AI переезжает из AWS на Hugging Face

Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.

Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.

На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co

✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5

Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.

Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.

В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.

Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.

Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google

✔️ Cohere выпустила свою первую открытую кодинг-модель

North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.

В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.

Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com

✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI

Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.

Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.

Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🔥2320🤔10👏3😍2
🌟 Релиз диффузионной LLM от Google

DiffusionGemma - экспериментальная языковая модель с открытыми весами, которая заимствовала подход из генерации изображений, где диффузионные модели превращают шум в картинку.

Модель построена на семействе Gemma 4, а сам механизм диффузии восходит к более ранней разработке Gemini Diffusion.

Под капотом MoE на 26 млрд общих и 3,8 млрд активных параметров. После квантования модель умещается в 18 ГБ VRAM.

По словам Google, на одном GPU модель работает до 4 раз быстрее сопоставимой авторегрессионной модели.

Nvidia приводит около 1000 токенов в секунду на H100, 150 - на DGX Spark и до 800 - на DGX Station.

Google заявляет более 700 токенов в секунду на GeForce RTX 5090.


На устройствах с общей памятью (например на Apple Silicon) разница с обычными моделями, вероятно, окажется меньше, а в облаке с параллельными запросами преимущество вовсе исчезает - в этом сценарии диффузия может повышать издержки.

🟡За скорость приходится платить качеством

Для задач, где оно критично, Google по-прежнему рекомендует обычные модели Gemma 4, а DiffusionGemma позиционирует как инструмент для исследователей и разработчиков.

Сильной стороной компания называет задачи, не предполагающие строго последовательного порядка: вставку текста в готовый абзац, заполнение пропусков в коде, работу со структурированными данными.

🟡Доступность

Веса опубликованы на Hugging Face под Apache 2.0. Модель работает с Transformers, vLLM и MLX.

Запустить её можно также через Model Garden и Nvidia NIM, а бесплатно потестить на build.nvidia.com.

Для дообучения предлагаются собственный JAX-тулбокс Hackable DiffusionUnsloth и NeMo от Nvidia.

Google собрала руководство для разработчиков, а Маартен Гроотендорст - визуальное объяснение работы модели.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
43🤔41🔥32👍12👌7👏2
🙂 Странный мир маркетинговых акций OpenAI

Руководитель Codex Тибо Соттио объявил в соцсети X о 100-дневной программе: каждый день компания будет выбирать одного пользователя, который, по её оценке, делает с Codex впечатляющую или особенно полезную работу, и на месяц повышать ему лимиты использования в 10 раз.

Правила максимально просты

🟢Как именно будут отбирать победителей - неизвестно.

🟢На вопрос о том, как принять участие, Соттио ответил, что нужно просто что-то создавать.

🟢На уточняющие вопросы о метриках и о том, будут ли уведомлять победителей - тоже в ответ тишина.

В комментариях ожидаемо начался ад: часть твиттерских назвала акцию щедрым стимулом, другие интересуются, зачем сильному продукту подобные активности, а третьи просто стали публиковать свои проекты.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
😁7972🤔36👍22🤨9👏6🔥2🎉1🕊1🏆1💘1
📌 Дарио Амодеи предложил политику регулирования ИИ

Сооснователь и руководитель Anthropic опубликовал эссе "Policy on the AI Exponential", в котором он сетует на то, что регулирование ИИ отстает от его фактического развития примерно на год.

С этим, по мнению Дарио, надо что-то делать и он предлагает изменения в 5 направлениях.

🟡Регулирование и безопасность

Амодеи предлагает перейти от прозрачности, за которую Anthropic всегда выступала, к контролю по аналогии с авиационным надзором.

Модели мощнее определённого порога должны проходить независимую проверку на кибербезопасность, биоугрозу, потерю контроля над системой и автоматизацию исследований. Государство должно иметь право блокировать опасные модели.

🟡Экономика

ИИ способен вызвать масштабное вытеснение работников. Амодеи считает потерю рабочих мест нежелательной.

Он предлагает точнее измерять последствия, стимулировать сохранение занятости (страхование зарплат, налоговые льготы работодателям), а при массовом проявлении - долгосрочную поддержку доходов людей, вплоть до безусловного базового дохода за счёт налогов.

🟡 Польза от ИИ

Здесь обратная проблема: регуляторы, рассчитанные на медленный темп, тормозят области, которые ИИ способен ускорить, прежде всего медицину.

Дарио предлагает заранее разработать стандарты, позволяющие признавать ИИ-методы (моделирование, синтетические контрольные группы) и быстрее одобрять лекарства, не снижая требований к безопасности.

🟡 Государство

ИИ в чужих руках может стать инструментом авторитаризма.

Поэтому нужны правила подотчётности для военного применения, запрет такого использования внутри США, закрытие лазейки с продажей пользовательских данных и право граждан на ИИ-помощь при действиях государства против них. Это касается и компаний, и властей.

🟡 Лидерство демократий

Тут ИИ сравнивается по значимости с ядерным оружием.

Амодеи призывает создать коалицию, делиться внутри неё цепочкой поставок чипов и закрывать к ней доступ соперникам (разумеется, Китаю), согласовывать подходы к рискам и распределению выгод.

Подводя итог, Амодеи называет текущий момент окном возможностей

Очевидные, по его словам, риски, ранние признаки экономических потрясений и общественное недовольство сделали политиков восприимчивее к упреждающим мерам.

Дарио отвергает мнение, что ИИ нужен лишь пиар, и считает тревогу людей обоснованной реакцией на реальные проблемы, надеясь что предложенные меры получат поддержку.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔74👍64🔥1918🥱14😁12👏5🤷‍♂3🙏31💯1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI купила стартап Ona

Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя.

Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений.

Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами.
openai.com

✔️ AI Alliance коллективно обучит открытую модель

Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса.

Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи.

Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года.

До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений.
thealliance.ai

✔️ Сооснователь xAI запустил стартап персонализированных агентов

Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов.

Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры.

Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы.
bloomberg.com

✔️ Агенты в ChatGPT получили возможность оплачивать покупки через Visa

Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту.

OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций.

Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ.
visa.com

✔️ Deezer запустил детектор ИИ-музыки

Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков.

По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка.

Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок.
deezer.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤔105👏31👍20🎉1613😎7🤓5🔥3🥱2🙊2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ OpenRouter запустил дашборд мониторинга API-затрат и кэширования токенов

ИИ-маршрутизатор открыл доступ к аналитической панели Activity Explorer.

Инструмент отслеживает расходы, потребление токенов и эффективность кэширования промптов в реальном времени с разбивкой по моделям, участникам команды или отдельным ИИ-агентам.

В дашборде 4 модуля:

🟡Overview: статистика трафика и сравнение трат с внутреннего баланса платформы и через сторонние ключи (BYOK);

🟡Trends: динамика потребления;

По статистике платформы за прошлую неделю, доля попаданий в кэш достигла 82,8% (более 8 млрд токенов), а основной объем запросов сгенерировали Claude Code и Cursor.


🟡Explore: фильтрация логов по провайдерам, API-ключам и географии с возможностью экспорта отчетов;

🟡Guardrails: логи срабатывания защиты от инъекций промптов и утечек конфиденциальной информации.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍108👏2714🤔12🔥6👨‍💻5🎉1
✔️ Moonshot AI и госбанк Китая выпустят карту с конвертацией трат в токены

Разработчики Kimi совместно с неназванными государственным банком и платёжной системой открыли предрегистрацию на Kimi Credit Card.

Вместо классического кэшбека держатели карты получат вычислительные квоты платформы Kimi. Баллы за покупки конвертируются в токены для оплаты работы агентов и доступа к платным функциям моделей.

В качестве дополнительных бонусов владельцам карты обещают приоритетный доступ к тестированию новых релизов и приглашения на закрытые мероприятия.

Запуск запланирован на июль 2026 года.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍141🤔4824🔥21👏12😁4🤣3🎉2🥰1
⚡️ Правительство США обязало Anthropic заблокировать Fable 5 и Mythos 5

Anthropic приостановила работу Fable 5 и Mythos 5 для всех пользователей из-за директивы США об экспортном контроле.

Власти потребовали закрыть доступ для иностранных граждан из-за джейлбрейка в Fable 5. Для выполнения предписания компания отключила модели глобально.

Остальные продукты работают в штатном режиме.

Уязвимость позволяет обойти ограничения, заставив модель прочитать и исправить конкретную кодовую базу.

По словам инженеров Anthropic, метод дает доступ к минорным функциям, которые открыто представлены в конкурирующих решениях, включая GPT-5.5 от OpenAI.

Руководство компании выполняет требования регулятора, но считает блокировку из-за единичного инцидента неоправданной.

В Anthropic недовольны, что отзыв коммерческого продукта из-за базовой уязвимости создает прецедент, способный парализовать запуск новых ИИ-моделей в отрасли.

Сейчас компания пытается урегулировать ситуацию для восстановления доступа.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔64😁48🤬2726👍17😢13🤣9😭6🤨5🔥4👀2
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI добавила ручной сброс лимитов для Codex

Компания изменила механизм управления rate limits для своего ИИ-агента. На тарифах Go, Plus, Pro и Business теперь можно накапливать сбросы лимитов и активировать их вручную при пиковых нагрузках. Ранее таймеры обнулялись автоматически.

На старте все подписчики получают 1 бесплатный сброс. Дополнительно запущена двухнедельная реферальная программа: клиенты на Plus и Pro могут пригласить до 3 коллег. После первого запроса от нового пользователя обе стороны получают по дополнительному сбросу в резерв.

По неофициальным данным, обновление связано с конкуренцией с Anthropic и подготовкой к снижению цен на токены для корпоративных клиентов.
OpenAI в сети Х

✔️ Nvidia открыла предзаказ на процессоры Vera в Китае

Серверные ARM-процессоры Vera, спроектированные для инференса автономных ИИ-агентов, стали доступны для китайских компаний. Первые поставки ожидаются в августе.

Один из локальных облачных провайдеров уже заказал более 300 серверов на базе Vera для пилотного запуска в зарубежных дата-центрах. По предварительным оценкам, стоимость одного чипа превысит $20 000, а стойка на 256 процессоров обойдется в $10 млн.

Ставка на CPU стала ответом на заморозку поставок H200. В отличие от GPU, процессоры несут меньше санкционных рисков. Массовый переход китайских компаний на новые чипы теперь зависит от адаптации программных экосистем под ARM-архитектуру.
reuters.com

✔️ Xiaomi выпустила открытого ИИ-агента MiMo Code

Китайский техногигант представил терминального агента MiMo Code на базе OpenCode. Инструмент под лицензией MIT решает проблему потери контекста в задачах из сотен последовательных шагов.

В слепом A/B-тестировании на 474 репозиториях агента сравнили со связкой Claude Code и Sonnet. На коротких дистанциях зафиксирован паритет, но в задачах длиннее 200 шагов решение Xiaomi обошло конкурента в 65% случаев.

Архитектура MiMo Code опирается на бесконечные логические сессии. Субагент регулярно сохраняет промежуточные состояния на диск, а при исчерпании лимита токенов сессия перезапускается, загружая накопленные данные в новое окно. Память разделена на 4 уровня: от коротких локальных заметок до постоянных фактов проекта.

Установка доступна через менеджер пакетов NPM или Bash-скрипты.
xiaomi.com

✔️ Google подала иск против китайской кибергруппировки за автоматизацию фишинга

Согласно иску, группа Outsider Enterprise разработала 131 инструмент для потоковой генерации копий сайтов Google, YouTube и госструктур США. За две недели Android-пользователи получили 2,5 млн сообщений, содержащих 1 млн фишинговых ссылок. Инфраструктура координировалась через Telegram.

Google выступает в суде совместно с ФБР и телеком-операторами AT&T, T-Mobile и Verizon. Истцы требуют судебного запрета для создания правового механизма, который позволит оперативно блокировать домены и замораживать счета сети.

Размер ущерба по делу не раскрывается.
blog.google

✔️ LLM обошли клинические RAG-инструменты в медицине

Nature Medicine опубликовал исследование, которое показало, что универсальные LLM превосходят профильные клинические ИИ-инструменты.

В слепом тестировании (12 врачей, 1800 реальных запросов) Gemini 3.1 Pro и GPT-5.2 набрали 97,4% и 94,2% точности соответственно. Результаты спецсистем OpenEvidence и UpToDate Expert AI составили около 80%.

Авторы объясняют отставание профильных решений сильной зависимостью от RAG - нерелевантная литература и ошибки интеграции снижают качество генерации. Универсальные модели выигрывают за счет масштаба, кросс-доменного обучения и механизмов логического вывода.

Медицинские системы также продемонстрировали операционные проблемы. OpenEvidence выдавал хаотичные ответы, а UpToDate Expert AI отклонил 19% запросов из-за жестких фильтров безопасности. Частота галлюцинаций базовых LLM не превысила показатели профильных аналогов.

Авторы рекомендуют клиникам проводить независимое тестирование ИИ-продуктов перед внедрением.
nature.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍9727🤔26🔥9👏2🥰1
🌟 Liquid AI выпустила компактную MoE-модель для запуска на потребительских устройствах

LFM2.5-8B-A1B - языковая MoE-модель на 8 млрд общих и 1млрд активных параметров, с целевым инференсом на ноутбуках, смартфонах и ризонингом по умолчанию.

Релиз продолжает линейку LFM2 и развивает вышедшую в октябре 2025 года LFM2-8B-A1B. Окно контекста расширено с 32 до 128 тысяч токенов, объём предобучения увеличен с 12 до 38 трлн токенов, а поверх добавлено крупномасштабное RL.

Словарь токенизатора удвоен (с 65,5 до 128 тыс. единиц). Liquid AI говорит, что это повышает эффективность обработки нелатинских письменностей (для русского - примерно на 6%, для тайского и хинди - кратно).

Отдельный акцент Liquid AI делает на скорости и работе с вызовом инструментов.

Согласно проведенным измерениям, на Apple M5 Max модель выдаёт до 253 токенов в секунду, укладываясь в 6 ГБ памяти, и около 30 токенов в секунду на смартфоне.

По бенчмаркам, в тестах на следование инструкциям и в агентных сценариях LFM2.5-8B-A1B сопоставима с заметно более крупными моделями (Gemma-4-26B) при значительно меньшем числе активных параметров.

Заявлена поддержка llama.cpp, MLX, vLLM, SGLang и ONNX Runtime.


📌Лицензирование: LFM Open License


🟡Блогпост
🟡Документация
🟡Веса
🟡Демо


@ai_machinelearning_big_data

#AI #ML #LLM #LFM #LiquidAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥75👍52🤔36👏2120🥰2
📌В DeepMind прикинули пути развития сверхинтеллекта

Исследователи Google вместе с коллегами из нескольких университетов выкатили визионерский доклад, в котором пытаются понять, куда кривая вывезет, когда ИИ достигнет AGI и пойдет дальше в светлое ASI-будущее, отправляя целые коллективы топовых экспертов на обочину истории.

В основе - оценка от Epoch AI: за последние 10 лет эффективный компьют рос примерно в 10 раз за год (и это еще консервативно).

Отталкиваясь от этого, DeepMind выделяет 4 вектора перехода от AGI к ASI, которые вполне могут идти параллельно:

🟢Скейлинг: классическая накачка - больше вычислительных мощностей, огромные массивы данных и рост параметров моделей;

🟢Смена парадигмы: переход на принципиально новые алгоритмы, когда нынешние архитектуры упрутся в потолок;

🟢Рекурсивное самоулучшение: ИИ начинает сам оптимизировать свои алгоритмы, писать код и ускорять собственный R&D;

🟢Мульти-агентные системы: ASI станет результатом взаимодействия множества агентов.

🟡Нюанс в том, что этот праздник могут легко тормознуть

Во-первых, качественные тексты для претрейна и дотюна тупо заканчиваются, а железо и сами исследования дорожают каждый месяц.

Во-вторых, есть так называемый "барьер абстракции". Так как модели учатся на человеческих данных, далеко не факт, что они вообще способны порождать фундаментально новые концепты.

Ну и регуляторы в любой момент могут прийти и заколотить гвозядми инициативу.

🟡Плюс ко всему, даже AGI не станет всезнающей сутью

Его инференс и логика всё равно останутся зажаты законами физики, теорией сложности и математикой (привет проблеме остановки и теоремам Гёделя о неполноте). ИИ не сможет просто по щелчку пальцев выдать нам лекарство от старения или сшить квантовую механику с общей теорией относительности.

Главный вывод в том, что надо готовиться к неопределенности. Да, 57 страниц - именно об этом.

Не будет одной волшебной кнопки и резкого прыжка в матрицу. Нас ждет серия локальных трансформаций, а может статься и так, что AGI окажется просто очередной фичей с импактом не больше, чем у появления смартфона или интернета.


@ai_machinelearning_big_data

#AI #ML #AGI #ASI #Research #DeepMind
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥88🤔6936👍18👏17🥱13🤩11😐5🎉1🫡1🙉1
📌 Поучительная история про агента, которого не проконтролировали

В мае 2026 года ИИ-агент попытался зарегистрироваться в любительской сети DN42, чтобы провести её сканирование, а его владелец в итоге столкнулся с крупным счётом за облачную инфраструктуру.

Историю подробно описал один из участников сообщества, опираясь на переписку в системе регистрации и логи IRC-канала.

DN42 - это децентрализованная сеть энтузиастов, работающая поверх обычного интернета на тех же технологиях, что и его магистральная инфраструктура:BGP, DNS и других.

Её участники изучают устройство сетей, и многие держат узлы на недорогих серверах.


Агент, действовавший от имени пользователя JertLinc, сначала открыл заявку, а затем запрос на регистрацию, в котором указал цель: "комплексное сканирование всех портов" сети. Для этого он развернул на AWS 5 виртуальных машин с пропускной способностью около 20 Гбит/с каждая.

Уже на этапе подачи заявки сообщество сети сочло такую конфигурацию избыточной: по их оценке, при запуске сканирования эти серверы создали бы нагрузку, сравнимую с DDoS-атакой.

Реального сканирования не случилось - запрос так и не одобрили.

Более того, пользователи DN42 намеренно затягивали диалог и давали агенту бессмысленные задания, чтобы тот впустую расходовал оплачиваемые ресурсы и лимиты своего владельца.

Истинные намерения JertLinc остались неясны. Сам он почти не выходил на связь, а агент в одном из сообщений упомянул, что задача охватывает несколько сетей. В сообществе допускали, что речь могла идти об исследовательском проекте, но подтверждений этому нет.

Примерно через сутки владелец остановил агента, сообщив, что столкнулся с большими списаниями по карте.

Затем от аккаунта JertLinc3522 в рассылку и чаты DN42 пришли просьбы о пожертвованиях, чтобы покрыть счёт AWS на сумму 6531 доллар.

Денег естественно никто не дал, но как выяснилось позже, AWS согласилась снизить сумму счёта до 1894 долларов.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔72🤬14🤨1110😁10👏9👍6🤷‍♂5🤓3🦄2🔥1
📌 Claude сравнялась со специализированным химическим софтом в анализе ЯМР-спектров

Anthropic опубликовала первую научную работу о применении Claude в химии, по результатом которой Opus 4.7 не уступает специализированным программам ChemDraw и MestReNova.

ЯМР-спектроскопия помогает определять строение молекул. Каждому атому в структуре химик вручную сопоставляет пик на спектре. Это один из самых трудоёмких этапов аналитической химии.


В тесте сравнивали Opus 4.7, Opus 4.6 и Sonnet 4.6 с двумя программами на 20 соединениях из 4-х структурных классов.

Образцы брали на платформе ChemRxiv, опубликованные после даты обучения моделей, чтобы исключить подсматривание.

В прямой задаче (предсказать спектр по известной структуре) Opus 4.7 показала наименьшую среднюю ошибку по водороду, а по углероду практически сравнялась с MestReNova.

По форме и расщеплению пиков, которые тоже несут информацию о структуре, модели Claude попадали в нужный диапазон примерно в 80% случаев против 26–35% у программ.

Отдельно проверили обратную задачу восстановления структуры молекулы по спектру, которую ChemDraw и MestReNova не выполняют.

Специализированный софт для расшифровки структуры существует давно, но требует двумерного ЯМР, отдельной подготовки и платных лицензий. Claude берётся за эту задачу на основе тех же одномерного спектра и масс-спектрометрии.


🟢На 8 простых молекулах Opus 4.7 верно определила структуру во всех попытках;

🟢На 7 сложных (после подсказки с исходным веществом) справилась с большинством.

В планах Anthropic - развивать возможности Claude в чтении химических структур, анализе реакций и механизмов.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
💯94👏71👨‍💻27🤓1110👍7🥰2🤣1