Роман Тетюркин | Доктрина ИИ
1.43K subscribers
182 photos
100 videos
2 files
57 links
Doctrina на латыни - знание, обучение, система взглядов.
Здесь я разбираю, как ИИ становится новой средой жизни: работа, бизнес, образование, власть, медиа и человеческие привычки.
Download Telegram
Промпт-инжиниринг уходит. Наступает эра луп-инжиниринга.

Последние два года все говорили о навыке написания лучших промптов для ИИ. Теперь некоторые из создателей самых продвинутых кодирующих агентов заявляют, что эта эра заканчивается.

Создатель OpenClaw подытожил это в вирусном посте: «Вам больше не нужно промптить кодирующих агентов. Вам нужно проектировать циклы, которые промптят ваших агентов».

Месяцем ранее Борис Черный высказал схожую мысль. Он сказал, что Claude написал практически весь его код за последние шесть месяцев.

Его работа больше не заключается в написании промптов. Его работа — написание циклов.

Вместо того чтобы пошагово указывать ИИ, что делать, разработчики все чаще ставят системе цель и позволяют ей выполнять автономный цикл:

• Разбить проблему на подзадачи
• Распределить работу между специализированными агентами
• Проверить результаты
• Найти ошибки
• Отправить исправления для следующей итерации
• Повторять до достижения цели

Сдвиг незаметен, но важен. Промпт-инжиниринг — это создание инструкций. Луп-инжиниринг — это проектирование систем.
🔥84
Media is too big
VIEW IN TELEGRAM
У них сверхчеловеческая скорость и маневренность
В соревнованиях людей с ИИ в управлении дронами, шансов у людей мало уже сейчас, а через год шансы станут нулевыми
Чтобы оценить сверхинтеллект существующих ИИ, недостаточно поговорить о теории струн с ИИ-чатботом. Чтобы физически ощутить сверхчеловеческие способности ИИ, нужно увидеть их в реальном физическом мире.

 
Исследователи из Цюрихского университета и Google DeepMind продемонстрировали, как обучить дроны соревноваться друг с другом и превосходить самых опытных пилотов-людей. Это исследование имеет довольно пугающие последствия для будущего войны. Оно на практике показывает, что люди не смогут соперничать в контурах управления военными действиями с ИИ-системами из-за своих физических ограничений. И дроны будут лишь началом процесса замещения людей на войне.
 
В этом исследовании ИИ соревновались не со средним FPV-оператором дрона (от англ. First Person View «вид от первого лица» - это дрон, управляемый оператором, который видит полет «глазами дрона» благодаря камере на борту, передающей видео в реальном времени на специальные очки, шлем или экран).
Человечество в этих соревнованиях представлял Марвин Шеппер - пятикратный чемпион Швейцарии, занимающий 4-е место в мировом рейтинге. Одну из испытательных гонок Шеппера против 3-х ИИ вы видите на приложенном видео.
 
Итог соревнований: ИИ-агенты превосходят пилота-чемпиона в многоагентных гонках:
• по скорости (через отношение скоростей): на 19.6% по лучшему кругу и на 6.5% по полному финишу;
• а по устойчивости к столкновениям и срывам (по % “недопройденной части гонки”) аж в 5 раз.
 
Вывод таков: ИИ уже превосходит чемпиона-человека в одном из ключевых компонентов будущих битв дронов - короткой высокоскоростной многоагентной навигации с избеганием столкновений; но до абсолютной победы ИИ ещё не хватает переносимости на новые трассы и устойчивости в долгом бою.
 
Что особенно важно для замены людей ИИ-системами на войне (и не только применительно к дронам): человеческая слабость, проявляется в азарте и ярости. Оператор-человек предпринимал более рискованные действия, пытаясь не проиграть. Как пишут исследователи «пилот-человек, отстающий от автономных агентов, пытался совершать все более агрессивные маневры, чтобы сократить отставание, что часто приводило к столкновениям или потере управления».
А ведь это относится к любому бою.
 
Материалы и несколько видео гонок на сайте проекта.
 
#БПЛА
🔥42🤪1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователь долголетия из Гарварда Дэвид Синклер: "У нас уже есть доказательство концепции" для обратного преобразования клеток кожи 92-летнего человека в состояние 20-летнего.
2🔥94
Вайбкодер составил топ неприятных коллег с помощью фитнес-трекера Whoop.

Парень выгрузил детальные данные о своем пульсе с браслета и скормил Claude Fable 5. Нейронка сопоставила всплески стресса с расписанием встреч в рабочем календаре и собрала антирейтинг коллег.

Вот это реально полезное применение ИИ-агентов.
2🤣11🏆3
Сколько новостей публиковать в день?
Anonymous Poll
54%
2⃣новости
17%
3⃣новости
28%
4⃣+
1
Media is too big
VIEW IN TELEGRAM
Каждый третий ИИ-скилл мешает, а не помогает.

Увидел разбор автора e/acc: он собрал публичные ИИ-скиллы с GitHub и прогнал их через проверочные тесты — где сравнивают результат модели с дополнительной инструкцией и без неё.

Главная цифра из его проверки: примерно 1 из 3 скиллов ухудшал результат.

Это хорошо ложится на более широкую картину.

В свежем исследовании про ИИ-агентов проверяли 34 тысячи реальных скиллов из открытых репозиториев. Вывод похожий: в идеальных условиях скиллы помогают, но как только агенту нужно самому найти нужный скилл среди большого шума, польза быстро падает почти до результата без скиллов.

Есть ещё исследование про худшие формулировки запросов: у Llama-2-70B разница между лучшей и худшей формулировкой доходила до 45 пунктов по доле побед.

Проблема не в том, что скиллы не нужны.

А в том, что любой скилл — это дополнительный контекст. А плохой контекст не усиливает модель. Он сбивает её.

Поэтому библиотека из 1000 чужих скиллов — не актив.

Актив — это 20–50 своих скиллов, проверенных на реальных задачах.
1🔥64👍1
Google предложил хранить знания для агентов в markdown-файлах.

Markdown — это обычный текст с простой разметкой. Не база данных, не Notion, не закрытая платформа. Файл, который можно открыть, положить в репозиторий и дать прочитать ИИ.

12 июня Google представил Open Knowledge Format — черновик открытого стандарта для таких папок знаний.

Зачем это вообще нужно?

Потому что главный лимит агентов сегодня не “модель тупая”. Часто проблема проще: агент не знает, где лежит правда.

Правила в чатах. Метрики в таблицах. Процессы в документах. Часть знаний — в коде. Часть — в голове человека, который “всё помнит”.

OKF предлагает собрать это в нормальную структуру: один объект — один файл. У файла есть тип, описание, теги, дата, ссылки на другие файлы.

Так знания можно читать, проверять, версионировать и переносить между системами.

Google не сделал мозг для агентов.

Но показал, что мозг начинается не с новой модели, а с порядка в знаниях.
6👌1
Городские власти начинают делать свои ИИ-модели. Не сервисы поверх ChatGPT, а собственные открытые модели.

В Рио-де-Жанейро выложили Rio 3.5 Open 397B. Это не анонс в пресс-релизе, а реальный репозиторий на Hugging Face от аккаунта prefeitura-rio, то есть Prefeitura do Rio de Janeiro.

По карточке модели: база — Qwen 3.5 397B-A17B от Alibaba, архитектура — Mixture-of-Experts, около 397 млрд параметров всего и около 17 млрд активных на токен. Весит всё это примерно 807 GB. Лицензия — MIT. Заявлен контекст до 1 млн токенов, мультимодальность и поддержка португальского/английского.

Разработчиком указана IplanRIO — муниципальная ИТ-компания Рио. Официально она отвечает за ИТ- и коммуникационные ресурсы города.

Самый громкий лозунг: Rio 3.5 якобы обгоняет Qwen 3.7 Plus. Тут я бы не спешил. В карточке модели действительно есть таблицы, где Rio выше Qwen 3.7 Plus на части тестов:
Главное: независимого аудита бенчмарков пока нет, только заявления разработчика.

Но новость всё равно важная.

Потому что это показывает новый сценарий суверенного ИИ: не строить “свой OpenAI” с нуля, а брать сильную открытую модель, дообучать её под свои задачи и выпускать как городской технологический слой.

Раньше в гонке моделей были корпорации и государства.

Теперь туда заходят города
4🔥1👌1
На днях снимался в программе НТВ. Выйдет осенью, тема — технологии.

Я рассказывал про своих ИИ-ассистентов для здоровья. Но самое интересное случилось ещё до съёмки.

Продюсер передачи нашла меня через ИИ.

Не через знакомых. Не через Google. Не через PR-агента.

Она просто спросила ИИ, кого можно позвать как эксперта по теме.

Решил проанализировать как чаще попадать в такой интересный и медийный трек.

В итоге в комментариях коротко расписал алгоритм, как начать это делать.

Напишите комментарий к посту — скину в личку более расширенный сценарий.
3🔥12🆒4
Подписки на ИИ могут оказаться одной из худших сделок в технологиях для компаний-продавцов.

Новый анализ от SemiAnalysis показал, что активные пользователи могут извлекать гораздо больше ценности из токенов ИИ, чем они за них платят.

• ChatGPT Plus ($20/месяц) предоставляет примерно $700 стоимости использования токенов на своих лимитах.
• ChatGPT Pro ($200/месяц) может обеспечить около $14,000 стоимости токенов.
• Claude Max ($100/месяц) показывает около $2,000 в стоимости токенов.

Проблема в том, что компании ИИ взимают фиксированную ежемесячную плату, в то время как их затраты растут в зависимости от того, сколько пользователи фактически используют модели.

Согласно анализу, подписки OpenAI становятся убыточными, когда пользователи потребляют не менее 15% своей выделенной мощности, в то время как порог Anthropic составляет около 20%.

Самый большой сюрприз: самые дорогие тарифы могут иметь худшую экономику. При высоком уровне использования некоторые премиум-тарифы, по сообщениям, генерируют убытки в сотни процентов на пользователя.
3😱3
This media is not supported in your browser
VIEW IN TELEGRAM
«Окно закрылось»

Прочитал пост Каррана( Andrew Curran / @AndrewCurran_ — автор, который пишет в основном про ИИ, модели, Anthropic/OpenAI/xAI, regulation и AI race. У него около 55k подписчиков, его регулярно репостят в AI-тусовке, но воспринимать его надо как сильного обозревателя/аналитика из X, а не как первоисточник_) пишет, что Fable был особенной моделью не по бенчмаркам, а по ощущению: насколько глубоко модель понимает намерение пользователя, думает дальше исходного запроса и кажется «живой». По его словам, многие после отключения Fable отреагировали так, будто у них отняли резко усилившийся инструмент.

Главный тезис: с ноября гонка ИИ стала ускоряться, а после Fable стало ясно, что дело не только в Claude Code и Codex, а в появлении Mythos после февральского тренировочного цикла. Теперь лучшие модели начинают помогать создавать следующие лучшие модели. Это порог, о котором давно говорили, и, по мнению автора, он уже пройден.

Дальше он делает жёсткий вывод: если страна хотела быть на фронтире ИИ, окно было примерно с февраля 2023 по февраль 2026. Теперь оно закрыто. xAI Илона Маска успела почти догнать фронтир за 26 месяцев, а многие государства, особенно Европа, это время потратили на барьеры и регулирование вместо строительства собственных моделей.

Его претензия к Европе такая: у неё были деньги, время и возможность собрать таланты, но она не построила суверенные frontier-модели. Поэтому теперь будет зависеть от систем, которыми не владеет, которые не контролирует, не может полностью проверить и которые у неё могут отключить в любой момент.

Отключение Fable и Mythos, по Каррану, разбудило многих: теперь все заговорили о суверенном ИИ. Но он считает, что поздно. Проблема уже не только в моделях, а в чипах, дата-центрах и вычислительных мощностях становятся стратегическим ресурсом, который будут дозировать, лицензировать и охранять почти как уран.

Самый сильный образ в тексте: представьте страну, где экономика, школы, армия, больницы и инфраструктура завязаны на «национальную» ИИ-модель, которая на деле просто обёртка над американской или китайской лабораторией. А потом эту модель отключают мгновенно, как Fable. Эффект будет похож на воздушный удар: паралич систем.

Финальный вывод автора: второго шанса, скорее всего, не будет. Open source поможет, но не спасёт страны без собственного оборудования, талантов и frontier-моделей. По мере приближения open-source моделей к уровню Mythos начнётся глобальное давление и регулирование. А Fable, даже если его удалось попробовать один день, должен был сократить ваши таймлайны: это уже не про кодинг, копирайт, арт или математику, а про трансформацию цивилизации.

Источник: https://x.com/AndrewCurran_/status/2066332670817456584
2🔥5👀42😱2
Антистарение и улучшение человека стали геополитической гонкой.

Государства рассматривают долголетие как стратегическую технологию.

Россия вложила 26 миллиардов долларов. У нас сделан упор на долголетие как национальный приоритет: печать органов, генетика, криотерапия.

Китайская биотехнологическая программа нацелена на генную терапию, интерфейсы мозг-компьютер и лекарства, разработанные с помощью ИИ.

ОАЭ запустили национальную инициативу по долголетию, поддержанную суверенным фондом, предлагая одни из самых быстрых клинических одобрений в мире.

Сингапур финансирует исследования в области долголетия и привлекает элитных основателей биотехнологий со всего мира.

Тем временем частный сектор движется еще быстрее:

• Life Biosciences ввела первую терапию обратного старения человеку.
• NewLimit привлекла 435 миллионов долларов для разработки программирования возраста.
• Retro Biosciences обеспечила 1,8 миллиарда долларов для продления здоровой жизни.
• Isomorphic Labs собрала 2,1 миллиарда долларов для использования ИИ в открытии лекарств.
• Neuralink уже имеет 21 имплантат у человека. Merge Labs вошла в гонку с 252 миллионами долларов.
• Altos Labs стартовала с 3 миллиарда долларов на клеточное омоложение.

Каждая крупная держава. Каждый ведущий основатель биотехнологий. Каждая серьезная лаборатория ИИ. Все они стремятся к одной цели: продлению человеческих возможностей и здоровой жизни.

Гонка за долголетием официально началась.
15👍4🔥3
Я перестал просить ИИ писать короче.

Не потому что люблю простыни. Просто понял, что когда агент всё ужимает, вместе с водой часто уезжает и контекст.

А у меня сейчас этого текста очень много. Обычно 5–7 страниц ресерча от 10 моделей. С выводами и данными. И таких ответов за день набирается столько, что к вечеру там уже почти маленькая книга.

И вопрос не в том, как всё это «прочитать быстрее».

Вопрос в другом: как из этого быстрее собрать картину в голове и понять, что делать дальше. А что точно не делать.

Сделал ресёрч для себя. В комментарии приложу систему, которую я собрал для себя.

P.S. Думаю для обучения себя сделаю ИИ-ассистента, который будет моим инструкторов и будет задавать вопросы по усвоенной информации.
1👍7🔥64
Не пугайтесь, поменял название канала.

Все просто, после анализа как попадать в выдачу ИИ, я понял,
что MainHero Lab ни разу не помогает какой-то узнаваемости для меня.

Поэтому начинаю с небольших шагов: привожу все к одной структуре, все соц сети и т.п.

Напомню, что писал по поводу этого тут:
https://tg-me.sbs/mainherolab/366
Разумеется, я сам все пробую о чем пишу 🍊🍊🍊
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥11👌5👏2
This media is not supported in your browser
VIEW IN TELEGRAM
Япония будет использовать человекоподобных роботов в уходе за пожилыми людьми, так как одиночество стало настоящим кризисом.
Купили бы своим бабушке/дедушке такого помощника?🤣🤣
🌚5👍3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Один человек за два дня собрал браузерную многопользовательскую ролевую игру с помощью ИИ.

Проект называется «Мир Клодкрафта». И важная поправка сразу: это не новая большая коммерческая игра и не конкурент крупным студиям. Это ранний игровой прототип. Но очень показательный.

Внутри уже есть то, что обычно отличает такую игру от простой демки: 9 классов, примерно 60 заданий, 3 зоны, прокачка, экипировка, торговля, дуэли, чат, группы до 5 человек и подземелья для совместного прохождения.

Играть можно прямо из браузера. Есть сетевой режим с сохранением персонажа и отдельный режим без регистрации. Код открыт.

Автор пишет, что первая версия заняла 2 дня с моделью Клод Фейбл 5. По затратам — не месяцы команды, а почти весь месячный лимит тарифа Клод Макс 20, который стоит 200 долларов.


Главный сигнал — как быстро теперь можно собрать сложный интерактивный прототип, который не надо объяснять на слайдах. Его можно открыть и потрогать.
🔥41