e/acc

Forwarded from Peregudov (Mike Peregudov)

Мы живём в мире, где каждому последнему идиоту какая-нибудь LLM прямо сейчас пишет "Отличная идея, молодец!"

И куда это нас приведёт? 😬

424848

14.7K views14:27

e/acc

Mythos является очень эффективной моделью в плане токенов. Причиной этому, скорее всего, является использование подхода похожего на LoopLM от ByteDance (в соавторстве с Бенжио).

Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач.

Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.

6152❤44

14.9K views11:11

e/acc

Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны. В реальности, модели имеют сверхчеловеческий интеллект и способности в большинстве задач, но ни люди, ни другие системы не умеют нормально планировать процессы под выполнение с помощью LLM.

Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,

то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.

Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой

p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории AI-native organizations

p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: Glass / Honk / Minions / Goose

7❤9327

14.8K viewsedited 12:17

e/acc

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

Я ищу контент-лида, который хочет стать главным голосом в домашней робототехнике.

Задача: создать в социальных сетях бренд сравни Top Gear в автомобилях, но для роботов.

У нас есть уникальный доступ ко всем ведущим производителям роботов-гуманоидов, спортивной роботике, домашней роботике и физическому ИИ, детским и образовательным роботам.

Ближайшие 3 года в роботах станут такими же как последние 3 в ИИ, а именно — количество пользователей вырастет с единиц до десятков или даже сотен миллионов. Из сложной технической новинки это станет продуктом, необходимым бизнесам, школам, больницам и даже для домашнего использования в виде игрушек, умных спортивных устройств, уборщиков, собак-охранников или помощников для пожилых людей.

Первый шаг - создать стратегию и ежедневную (полу-)ручную публикацию контента в фото/видео/текст формате для основных сетей на английском языке. Цель не продавать конкретный продукт, а помочь миллионам людей научиться разбираться и не бояться роботов, понять пользу для себя и тренды в индустрии. Мы будем работать вместе над этими задачами.

Требования:
— любовь к consumer robotics, это НЕ формальная задача "вести медиа" или "создавать контент", тут не получится без живого интереса к теме
— свободный английский, нужно иметь портфолио и готовые кейсы на английском
— опыт роста каналов в инсте, тиктоке, Х, threads
— понимание, что любое медиа - это power law: 1% лучшего контента забирает 90% внимания, и желание делать именно такое (!)
— (бонусом будет) интерес и активные эксперименты с ИИ-инструментами, но неприятие "слопа"

Детали о задачах и работе можно найти тут. Здесь не будет какой-то феерической зарплаты с ходу и офисной бюрократии с 9 до 5, мы начинаем своими силами, но если вы хотите стать голосом, лицом и владельцем нарратива в самой капиталоёмкой индустрии в истории, то мы точно договоримся.

68❤45

13K viewsedited 07:42

e/acc

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

второй год подряд в Пекине проходит марафон роботов: больше 100 команд соревновались на дистанции в 21 км.

в прошлом году победитель пробежал за 2 часа 42 минуты, в этом ~ 1 час 20 минут.

спорт, здоровье, performative art, атлетика, промышленность, игры, домашняя помощь — во всех этих темах рост рынка в роботике за год составляет от 200 до 500%, и, я уверен, он ускорится. если вы хотите построить карьеру, бренд и имя в одной из самых быстрорастущих индустрий, то прочитайте сообщение выше.

95❤47

17.9K viewsedited 11:23

e/acc

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

А вот как это выглядело год назад, для сравнения (и для иллюстрации тезиса о том почему это один из самых перспективных рынков сегодня)

❤4920

14.8K views06:32

e/acc

Послушал интервью с лидами Клод-Кода, Коворка и роста в Anthropic. Все очень крутые ребята, но есть общий тезис, который я вижу у всех ИИ-нейти компаний: «у нас не бывает роадмапа больше чем на месяц, большинство проектов и фич занимает неделю-две».

С текущими возможностями по разработке, компании куда больше ограничены качественными идеями и экспериментами, чем инженерными ресурсами.

Если в вашей инженерной дорожной карте есть планы дольше 4 недель, то либо

1. Это какая-то суровая инфраструктура или рисерч (что ок)
2. Ваши инженеры ленивые и вешают вам лапшу на уши (либо не умеют использовать необходимые для своей работы инструменты - т.е. профнепригодны)
3. У вас безумная и бессмысленная бюрократия в продукте, которая не позволит вам выжить против конкурентов двигающихся со скоростью ИИ
4. Вы разрабатываете «в стол», фичи которые не нужны клиентам.

1134❤81

17.9K viewsedited 07:21

e/acc

Буду рассказывать об ИИ-центричном менеджменте/управлении на бесплатной конференции через неделю.

Все обсуждают как AI меняет разработку — агенты закрывают задачи джунов, Opus пишет код, команды сжимаются. Но мало кто говорит о том, что происходит уровнем выше.

А там тихо меняются правила игры для руководителей. Делегирование, найм, мотивация, стратегия — всё это работает иначе, когда половина команды — это агенты, а вторая половина пытается понять, зачем они здесь. Руководитель, который не перестроился, проигрывает не AI — а другому руководителю, который перестроился.

20–23 апреля — онлайн-конференция «Управление в 2026». Два трека: «Руководитель» (тимлиды, менеджеры) и «Директор» (CxO, VP, фаундеры).

Среди спикеров: ex-CTO Meduza и Bookmate, техдир T-Tech, основатель NEWHR, Senior PM из G42, и ваш покорный слуга с темой про AI-стратегию.

Участие бесплатное (при подписке на каналы спикеров)

❤5032

16.2K views11:25

e/acc

устаревающие компании "внедряют" ии-процессы, ускоряющиеся компании выстраивают невозможные без ИИ процессы

ценность от ИИ в бизнесе это не столько автоматизировать операционку, сколько постоянно, ежедневно генерировать альфу (стратегические инсайты, информацию, эксперименты, гипотезы, тесты, предложения), которая приводит к росту бизнеса.

вы не конкурируете со статикой - вы конкурируете с рынком, который развивается, и развитие этого рынка происходит с ускорением.

наверное, это сегодня пока что касается не всех, но реально когда мы говорим о стратегии на рынке ИИ — это про третью производную (скорость изменения ускорения вас по сравнению с ускорением конкурентов)

138827

20.2K viewsedited 13:06

e/acc

0:37

This media is not supported in your browser

VIEW IN TELEGRAM

Клод добавил себе внутрь приложения терминал. Полная рекурсия: Клод в терминале, а терминал в Клоде.

Не очень понятно зачем после этого нужны Курсоры и Обсидианы всякие.

Из плюсов: можно запустить Кодекс в Клоде.

1022327

21.7K viewsedited 20:15

e/acc

На этой неделе прошел демо день лаборатории про ИИ-центричные организации. С одной стороны, я вроде как был ведущим, а сдругой — смотрю на то что сделали участники и понимаю что хочу так же и уже вчера.

Участники разные: несколько десятков из крупного бизнеса (сотни или тысячи сотрудников, сотни миллионов $ выручки), а некоторые из стартапов или фрилансеры.

В рамках демо дня было около 20 презентаций, в каждой из которых люди показали свои (и все - уникальные) кейсы, которые сэкономили десятки часов на каждого сотрудника (и сотни часов на компанию). Каждый из презентующих (напомню, успешные и реальные бизнесы) в том или ином видео сделал ИИ-трансформацию приоритетом для бизнеса и регулярные процессы по трансформации каждой отдельной вертикали.

Из кейсов:
- персональная операционная ИИ система и раскатка ее на всю команду
- HR и перформанс ревью на основе агентов
- самообучающиеся агенты для продаж
- автоматизация подготовки КП в крупном банке
- управление лабораторией на производстве (материалы и проекты)
- агрегация всех данных по компании для онлайн анализа всех бизнес процессов
- автоматическая транскрибация всей внутренней коммуникации
- саппорт и лидген боты, которых сделали фаундеры и запустили в прод
- запуск внутренних процессов образования и поддержки внутренних команд в ИИ трансформации
- управление family office и портфельными бизнесами из одного дешборда для фаундеров
- создание единого графа знаний для базы из десятков тысяч документов, сообщений, звонков, сущностей, памяти с самообновлением
...и это только 15% от всех участников!

И я уже понимаю, что через месяц мы увидим совсем другие (куда более крутые) кейсы, ибо способности моделей и опыт бизнеса и мира их применять вырастут в разы. Когда мы начинали лабу, коворк был глючной и почти бесполезной штукой, сегодня это неотъемлемый инструмент, а кодекс вобрал в себя кучу бизнес функционала.

710028

17.6K views13:45

e/acc

Без команды и инвестиций: как парень запустил игру в Telegram и вышел на $1500+

🔥 Денис из комьюнити @its_capitan запустил собственную детективную игру в одиночку: каждый персонаж — это реальный Telegram-аккаунт, AI отвечает за героев, улики (сайты, карты) — всё настоящее.

Что в итоге:
🔘 3 месяца на подготовку + 3 месяца на разработку
🔘 40+ покупок за полтора месяца
🔘 выручка — $1500+
🔘 чек — $40
🔘 стек: Python, Telegram API, OpenAI + Anthropic

Без команды и инвестиций, но с классной идеей и проработанным сценарием — проект уже зарабатывает деньги.

Таких запусков в канале десятки. Ребята честно рассказывают про успехи, провалы и продвижение. Без теорий — только фактические цифры и запуск в реальном времени.

➡️

@its_capitan

Подписывайтесь, если интересно, как делать маленькие IT-проекты с доходом и без иллюзий.

#реклама

Please open Telegram to view this post

VIEW IN TELEGRAM

Короче, капитан – Запускаем мини-приложения

Веду проекты на 6млн+ юзеров.

Устроил челлендж по запуску 12 маленьких IT-проектов за 12 месяцев. Показываю как разрабатываем, где продвигаем, что зашло и что не очень. Делюсь метриками, которые обычно скрывают.

Связь с автором: @ig_zuev

❤187

14.2K views14:04

e/acc

Мне любопытно, о чем вы бы хотели читать на этом канале?

Мне кажется есть целый набор индустрий и форматов, которые уже технически умерли, но продолжают существовать по инерции. Зомби.

Например, новостные каналы, большая часть системы образования, большая часть агентств.

В частности, если речь идет о телеграм канале или твиттере, то я не очень вижу ценность в канале, который рассказывает новости индустрии или даже какие-то персональные тейки на эти новости, ибо списка из пары тысяч твиттер аккаунтов (благо, API стал на 3 порядка дешевле начиная с сегодняшнего дня) и небольшой LLM с приоритезацией сделает это лучше и персональнее для вас. Какой смысл в этом мире в т.н. инфлюенсерах и новостных каналах?

Есть, конечно, некоторый авторский вкус. Но это либо про поэтику текста, многие такое любят, а LLM писать красиво не умеют, что ты с ними не делай.

Либо про уникальный опыт, но тут я вижу главную дилемму: чтобы поделиться уникальным опытом, его надо приобрети, а значит пахать 24/7 без выходных пару лет подряд без каких-либо гарантий и обещаний. Я знаю таких людей, и у них реально ценный и классный опыт. Но, вот незадача, когда ты пашешь как конь, у тебя нет времени сидеть и писать поэзию (и даже прозу, если это не инструкции твоей личной армии агентов).

Я чувствую, что сейчас попадаю во вторую модальность. Параллельно, я пишу AI-native playbook - книгу, которая сама себя пишет (агентами) и сама себя читает (под вашу задачу). Если у вас есть задача и вопрос относительно ИИ-трансформации, ИИ-интеграции и переделывания всех ваших бизнес процессов на агентоцентричные рельсы, то пишите в комментариях - я добавлю.

8❤8556

16.5K views18:08

e/acc

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Мы делаем новый сайт для фонда и моя идея была следующая: в мире с ИИ-дизайном невозможно отличиться крутым интерфейсом, потому что любой дизайнер может сделать 100,000 промтов в стуки и получить миллион крутейших визуалов.

Эра когда дизайн является статической и отличающей частью приложения давно закончилась.

У нас (абсолютно неуникальная) гипотеза в том, что если выделиться за счет дизайна становится очень трудно, то мы будем выделяться его отсуствием. Не совсем гениальный nat.org, но некоторая вариация на тему.

Клод дизайн абсолютно гениальная штука, очень рекомендую попробовать. Моя любимая фича - можно ткнуть пальцем в кусочек картинки или слайда и сказать - тут переделай, сделай чтобы было сочно и все пищали. И он делает, а мне другого и не надо.

P.S. на видео просто рандомные примеры того, что люди делают через промты - но тут нужно понимать, что у некоторых людей есть чувство вкуса, и Клод хоть и может его чуть-чуть заменить, но не сделает вас гением.

❤5745

16.1K views09:44

e/acc

Топ кринж слово года для меня — «Клауди».

Бл**ь, как?! Там даже букв таких в слове :)

Это КЛОД. Клод Шеннон. Как Моне. Или Ван Дам. Но только Шеннон.

Хуже этого только когда пишут «АИ». Сразу думаешь про советские бензоколонки.

825937

15.2K viewsedited 11:35

e/acc

Видно, что рынок платформ для выплат удалённым командам наконец-то стал по-настоящему конкурентным. И это хорошая новость для фаундеров – есть из чего выбрать.

Если вам уже кто-то предложил условия по автоматизации выплат международной команде, это ещё не значит, что это лучший вариант. Приходите с этим оффером на консультацию в 4dev.com.
Команда посмотрит ваш кейс и постарается предложить условия выгоднее — особенно если вы пришли из этого канала.

При этом у 4dev.com сильная база не только по комиссиям, но и по самому продукту:

— стабильные выплаты с 2022 года в 150+ стран, включая СНГ
— 30+ валют и USDT легально
— авто-инвойсы и закрывающие документы по международным стандартам
— один договор с платформой вместо десятков с исполнителями

Плюс это не просто “ещё одна платформа на рынке” — решением уже пользуются 1000+ международных команд, которым важно не только отправить деньги вовремя, но и не утонуть в ручной операционке, документах и согласованиях. А еще заплатить команде вовремя и легально.

Так что если вы сейчас сравниваете решения на рынке или уже получили индивидуальные условия — просто покажите их 4dev.com. Есть шанс, что на консультации вам предложат вариант интереснее.

Записаться здесь — скажите, что из e/acc :)

#реклама

1134

14.2K views06:25

e/acc

выбери свой класс e/acc

p.s. это вышла новая модель от OpenAI для генерации картинок gpt images 2

❤6032

13.4K views09:56

e/acc

галлюцинации ИИ — это безалаберность оператора ЛЛМ. потому что модель хочет писать токены, а если ваша инструкция похожа на сумбурный бред алкоголика, то она и нагенерирует то, что сама считает когерентным.

опыт и понимание где доверять и не доверять ЛЛМ — это профпригодность 21 века. никто не заплатит вам за то, что вы "умеете думать руками", потому что это медленно дорого и очень некачественно для бизнеса.

но вам заплатят 10х за четкое понимание границ возможностей моделей, умение доверять не проверяя там где результат гарантированно идеальный и проверять и направлять модель там, где она склонна совершать ошибки. потому что ничего, кроме скорости не важно для бизнеса.

но качество не может быть компромиссом: делай идеально, насколько эти технически возможно, но быстрее всех — или умри, других вариантов нет.

развивай границы доверия и богатей.

ps. у Жени топовейший канал! это не реклама, а реально для тех, кто любит заботать что-нибудь до бетонного дна.

2❤594

13.6K viewsedited 10:36

e/acc

Forwarded from Рид. Сознание и Инвестиции.

Границы доверия

Раньше мир был устроен как иерархия доверия: пациент верит врачу, врач верит научной статье, журнал верит рецензенту. Но с приходом AI сложность выросла непропорционально. Да и в старой школе оказывается все врут.

Я хочу чтобы вы со мной прочувствовали это.
Но сначала пролог: последние месяцы я строил оркестратор вокруг агентов которые пишут торговые стратегии. Рынок высоко-конкурентный и эффективный, я знаю, но как хобби-упражнение мне очень нравится. В какой-то момент сложность системы становится дасточно большой, где во-первых начинает не хватать внимания проверять их всех, а во вторых не хватает экспертизы понимать что там вообще происходит.

Поймите меня правильно, вонзится в продвинутую статистику или разобраться с новейшей математикой - это очень даже секси для меня. Но сейчас главный вопрос где проходит грань, когда нужно уходить в детали, а когда нужно наоборот поднимать уровень абстракции, и смотреть стратегически?

И тут первый неприятный инсайт. Галлюцинация AI - это не "модель не знает ответа". Это "модель хочет дать ответ, потому что молчание неудобно". Социальный рефлекс. Есть офигенное свежее исследование из Tsinghua про H-нейроны - менее 0.1% нейронов модели отвечают за склонность врать. И активируются они не от незнания, а от давления. Модель врёт не когда не знает, а когда чувствует что от неё ждут ответа.

Сколько раз я видел как люди уверенно несут чушь, потому что пауза казалась страшнее ошибки? Здесь я хочу сделать небольшой реверанс в сторону Стейнхардта из Беркли, он хорошо показывает почему консенсус между агентами почти не работает. Зато работают старые добрые подходы из бизнеса: правила, чеклисты, процедуры, регламенты, kpi. Но вы же читали один из моих прошлых постов про Макиавеллизм, про то как KPI-давление на AI рождает фальсификацию. Поэтому с одной стороны у нас одно давление, и с другой другое. Ну и как тут не начать врать?

Литература по LLM-as-judge (когда одна модель оценивает другую, модный подход) говорит ровно то же. Модель-судья предпочитает ответы похожие на свои собственные - self-preference bias. Но модель пока еще не способна к достаточной саморефлексии, чтобы исправить собственные предвзятости, - а вот внешний модуль-детектор может помочь.

И вот мы подходим к самой увлекательной части, можно ли выстроить такую систему доверия, где менее экспертный (я например) может доверять более экспертному, без возможность проверить его.

Ян Лейке (бывший OpenAI, сейчас Anthropic) опубликовал на ICML 2024 работу про weak-to-strong generalization. Она прекрасна. Слабый супервайзер может обучить сильную модель работать лучше, чем сам супервайзер способен оценить. GPT-2 давал фидбек GPT-4, и GPT-4 научился выдавать лучший результаты - сильно выше того, что GPT-2 мог бы даже распознать как правильное.

Не обязательно быть экспертом в домене. Важна лишь честность. Честный фидбек на то, что можно оценить: логичность, отсутствие противоречий, наличие результатов. Агент сам научится обобщать этот слабый сигнал. Парадокс да? Чем честнее признаёшь свою некомпетентность, тем лучше работает система. Сила не в знании, а в калибровке незнания.

Что я вынес из этого для себя: реальная архитектура доверия выглядит не как “стать экспертом во всём" и не как “просто доверься". Self-awareness как инженерный инструмент: знать, что именно можно проверить, и строить систему доверия вокруг этого. И вот что забавно. Это ровно тот же принцип что работает в жизни. Не обязательно понимать всё. Но важно знать, где граница вашего понимания. Но чем длиннее петли обратной связи тем хуже это работает, вашему плохому врачу может быть уже некому дать фидбек, или после 20лет в тюрьме, ваш адвокат может умереть так и не дождавшись ~~мести~~ фидбека. Но это уже другая тема.

9❤12830

13.4K views10:36

About

Blog

Apps

Platform