Силиконовый Мешок
Ну что, ждём сегодня или завтра?
Так, про GPT-5.6 не подтвердился прогноз. Хотя я их прекрасно понимаю - релизить новую модель на падении рынка, такая себе идея.
Но меня сильно смущает, что Polymarket дает больше 70%, что релиз новой модели Mythos от антропиков случится сегодня и 82%, что завтра.
Вообще, они, конечно, должны выкатить ее до конца месяца, дальше уже нет смысла тянуть.
Но думаю, что это будет урезанный со всех сторон Mythos - совсем не то, чем восторгается та небольшая группа компаний, что гоняет модель уже второй месяц.
Как бы то ни было - лето будет жаркое (лишь бы хватило воды для охлаждения датацентров).
Но меня сильно смущает, что Polymarket дает больше 70%, что релиз новой модели Mythos от антропиков случится сегодня и 82%, что завтра.
Вообще, они, конечно, должны выкатить ее до конца месяца, дальше уже нет смысла тянуть.
Но думаю, что это будет урезанный со всех сторон Mythos - совсем не то, чем восторгается та небольшая группа компаний, что гоняет модель уже второй месяц.
Как бы то ни было - лето будет жаркое (лишь бы хватило воды для охлаждения датацентров).
1🔥34❤11💯6👍4😁4⚡1👏1😍1🍌1🤗1
Силиконовый Мешок
Помните, я про Олега и его курс по визуальным нейросетям писал? Вот это то, о чем я всегда говорю, когда задвигаю тезис, что нейросети - это как экзоскелет для мозга, который усиливает сигналы, но если их нет - он бесполезен. Например, если у тебя есть понимание…
Media is too big
VIEW IN TELEGRAM
Наш конкурс подошел к концу, объявляем победителя. Олег выбрал работу Николая: «Сын нарисовал семью. Папу — карандашом. На всякий случай».
Кстати, все те, кто принимал участие, получают скидку - 15% на курс «Нейросети в кино. Мастерская короткого фильма», который стартует уже через 20 минут.
Бегите к Олегу (@tserbaev) за скидкой в личку. Всем спасибо!
Кстати, все те, кто принимал участие, получают скидку - 15% на курс «Нейросети в кино. Мастерская короткого фильма», который стартует уже через 20 минут.
Бегите к Олегу (@tserbaev) за скидкой в личку. Всем спасибо!
❤13🔥9👏8🙏2💯2🦄2⚡1🤯1👀1🤝1🤗1
hacks_ru.pdf
192.8 KB
Все хаки агентного инжиниринга, что я знаю
Вот правду говорят - «искал медь, а нашел золото», так и я искал решение для поиска по Reddit, X, YouTube, TikTok, Instagram, HN, Polymarket, GitHub, а нашел офигенные лайфхаки от Мэтта Ван Хорна.
Я постарался перевести их максимально близко к авторскому стилю, но, если что, там в документе есть ссылка на оригинальный тред, а еще сделал .MD для вашего агента - он в комментариях к посту.
В общем, гайд и для новичков, и для бывалых пользователей агентов (Hermes, Claude, Codex и т.д.), особенно мне зашел его подход в работе с Wiki-LLM и plan.md - многое себе забрал. Так что мои рекомендации!
Вот правду говорят - «искал медь, а нашел золото», так и я искал решение для поиска по Reddit, X, YouTube, TikTok, Instagram, HN, Polymarket, GitHub, а нашел офигенные лайфхаки от Мэтта Ван Хорна.
Я постарался перевести их максимально близко к авторскому стилю, но, если что, там в документе есть ссылка на оригинальный тред, а еще сделал .MD для вашего агента - он в комментариях к посту.
В общем, гайд и для новичков, и для бывалых пользователей агентов (Hermes, Claude, Codex и т.д.), особенно мне зашел его подход в работе с Wiki-LLM и plan.md - многое себе забрал. Так что мои рекомендации!
5❤106🔥49👏17👍9🙏6⚡1💯1🤣1🤗1😘1
Силиконовый Мешок
Так, про GPT-5.6 не подтвердился прогноз. Хотя я их прекрасно понимаю - релизить новую модель на падении рынка, такая себе идея. Но меня сильно смущает, что Polymarket дает больше 70%, что релиз новой модели Mythos от антропиков случится сегодня и 82%, что…
На этот раз не промахнулся с прогнозом. Антропики выпустили Fable 5 (тот же Mythos, но с защитой от дураков).
Уже раскатывают по Claude Code в подписках за $20, $100 и $200. Но есть и нюансы: доступна она там будет только до 22 июня, а после будет только по API-ценам для всех ($10 за миллион входных токенов и $50 за миллион выходных, что в два раза дороже Opus).
А еще все ваши запросы к Fable будут в течение 30 дней храниться на серверах и анализироваться, чтобы можно было вылавливать тех, кто как-то незаконно использует модель, дистиллирует - короче, балуется.
Уже раскатывают по Claude Code в подписках за $20, $100 и $200. Но есть и нюансы: доступна она там будет только до 22 июня, а после будет только по API-ценам для всех ($10 за миллион входных токенов и $50 за миллион выходных, что в два раза дороже Opus).
А еще все ваши запросы к Fable будут в течение 30 дней храниться на серверах и анализироваться, чтобы можно было вылавливать тех, кто как-то незаконно использует модель, дистиллирует - короче, балуется.
1🔥45❤17👍10👀8👏6🦄2✍1😁1💯1🤗1
Поспать сегодня не получилось, всю ночь ковырял новый Fable. И знаете, мне пока все нравится. Да, кушает он хорошо, даже думал еще одну подписку сделать (не скажу, какую по счету). И вот мои мыслишки по свежим (вообще нет) следам:
1) Вот, теперь стало понятно, для чего антропики сделали режим Workflow. В Fable он раскрылся на полную: попросил сделать полное код-ревью, после чего модель подняла сотни агентов параллельно. Мне показалось, что она для каждого файла в проекте назначила отдельного агента. Как итог, нашла баги, пробелы в документации, даже к UX проекта у нее справедливые претензии возникли
2) Раньше большую задачу приходилось резать на куски и скармливать модели по частям, иначе она тупила и галлюцинировала. Теперь лучше отдавать всю задачу целиком, и Fable будет работать над ней часами, пока не доделает. Из нескольких больших задач пока ни одну не бросил на полпути
3) Даже подход к работе с моделью стал другой. Раньше: написал промпт, получил ответ, поправил, снова промпт. С Fable лучше один раз объяснить, какой результат нужен и как понять, что он достигнут, и отпустить. Дальше он сам проверяет свою работу, находит косяки, исправляет и повторяет, пока не получится
4) Хотя есть нюанс, мне не понравилось, как внутри одной сессии модель оценивает свою же работу. Поэтому лучше, если проверку делает вторая модель, которая не видела процесс работы и смотрит только на результат
5) Отдельное удовольствие, как теперь работает память между сессиями. Раньше мне казалось, что модель все свои записи в процессе работы совсем не перечитывала. А Fable на своих ошибках реально учится: разбирается, почему ошибся, делает вывод и в следующий раз этот вывод использует. Сам, без напоминаний
6) Чем конкретнее список требований, тем лучше результат. Не «сделай хорошо», а буквально чек-лист: пункт 1, пункт 2, пункт 3. Модель не остановится, пока не закроет каждый пункт. С таким чек-листом Fable у меня работал всю ночь без перерыва
7) У модели есть настройка «сколько думать над ответом» (Effort). Совет: ставьте меньше, чем кажется нужным. Даже на минимуме (Low) он умнее всего, что я видел, а на средних (Medium) настройках может пять минут размышлять над простым вопросом
8) Бесит, что он такой болтливый стал. Объясняет так подробно и много, что я пару раз почувствовал себя тупым. И обожает уточняющие вопросы: вместо того чтобы просто сделать, сначала устроит допрос и попросит подтвердить каждый шаг. Лечится просьбой «объясняй проще и решай сам», но не до конца. Обещают починить
1) Вот, теперь стало понятно, для чего антропики сделали режим Workflow. В Fable он раскрылся на полную: попросил сделать полное код-ревью, после чего модель подняла сотни агентов параллельно. Мне показалось, что она для каждого файла в проекте назначила отдельного агента. Как итог, нашла баги, пробелы в документации, даже к UX проекта у нее справедливые претензии возникли
2) Раньше большую задачу приходилось резать на куски и скармливать модели по частям, иначе она тупила и галлюцинировала. Теперь лучше отдавать всю задачу целиком, и Fable будет работать над ней часами, пока не доделает. Из нескольких больших задач пока ни одну не бросил на полпути
3) Даже подход к работе с моделью стал другой. Раньше: написал промпт, получил ответ, поправил, снова промпт. С Fable лучше один раз объяснить, какой результат нужен и как понять, что он достигнут, и отпустить. Дальше он сам проверяет свою работу, находит косяки, исправляет и повторяет, пока не получится
4) Хотя есть нюанс, мне не понравилось, как внутри одной сессии модель оценивает свою же работу. Поэтому лучше, если проверку делает вторая модель, которая не видела процесс работы и смотрит только на результат
5) Отдельное удовольствие, как теперь работает память между сессиями. Раньше мне казалось, что модель все свои записи в процессе работы совсем не перечитывала. А Fable на своих ошибках реально учится: разбирается, почему ошибся, делает вывод и в следующий раз этот вывод использует. Сам, без напоминаний
6) Чем конкретнее список требований, тем лучше результат. Не «сделай хорошо», а буквально чек-лист: пункт 1, пункт 2, пункт 3. Модель не остановится, пока не закроет каждый пункт. С таким чек-листом Fable у меня работал всю ночь без перерыва
7) У модели есть настройка «сколько думать над ответом» (Effort). Совет: ставьте меньше, чем кажется нужным. Даже на минимуме (Low) он умнее всего, что я видел, а на средних (Medium) настройках может пять минут размышлять над простым вопросом
8) Бесит, что он такой болтливый стал. Объясняет так подробно и много, что я пару раз почувствовал себя тупым. И обожает уточняющие вопросы: вместо того чтобы просто сделать, сначала устроит допрос и попросит подтвердить каждый шаг. Лечится просьбой «объясняй проще и решай сам», но не до конца. Обещают починить
🔥60❤42👍21😢4🦄4 4✍2👏2🙏2💯2🤗1
Знаете, как я понимаю, что у участников сообщества ИИзнанка случается все больше и больше успешных кейсов? Да, периодически кто-то хвастается успехами - и мы вместе радуемся. Но главный признак успешных проектов - это когда все больше участников просят поделиться контактами хороших юристов. Потому что если проект приносит ощутимую прибыль, начинаешь более усердно чесаться и думать, все ли в порядке в моем палисадничке.
Мы даже решили завтра пригласить к нам на «полезный звонок» (есть у нас и такой формат) юриста по персональным данным, чтобы помучить его вопросами:
— Как работать с персональными данными, когда вы создаете приложение или сервис?
— Где главные риски: формы, авторизация, аналитика, нейросети, передача данных?
— Что произошло в регулировании за год и куда все движется?
Так что если вы раздумывали, залететь ли в закрытое сообщество ИИзнанка - вот вам знак. Смотрите сами, по цене сытного завтрака вы получаете кучу всего: приходите завтра в 19:00 на бесплатный воркшоп с юристом, бронируете слот со мной на удобное вам время (обсудим ваш проект или задачи), получаете вечный доступ в сообщество Research Mastermind, целый месяц резвитесь в чатике с крутыми ИИ-билдерами, задаете вопросы нашему боту (например: «познакомь меня со всеми, кто делает ИИ-автоматизации»), а еще можете выступить в одну из сред со своим проектом на хорошую аудиторию. Кайф.
Мы даже решили завтра пригласить к нам на «полезный звонок» (есть у нас и такой формат) юриста по персональным данным, чтобы помучить его вопросами:
— Как работать с персональными данными, когда вы создаете приложение или сервис?
— Где главные риски: формы, авторизация, аналитика, нейросети, передача данных?
— Что произошло в регулировании за год и куда все движется?
Так что если вы раздумывали, залететь ли в закрытое сообщество ИИзнанка - вот вам знак. Смотрите сами, по цене сытного завтрака вы получаете кучу всего: приходите завтра в 19:00 на бесплатный воркшоп с юристом, бронируете слот со мной на удобное вам время (обсудим ваш проект или задачи), получаете вечный доступ в сообщество Research Mastermind, целый месяц резвитесь в чатике с крутыми ИИ-билдерами, задаете вопросы нашему боту (например: «познакомь меня со всеми, кто делает ИИ-автоматизации»), а еще можете выступить в одну из сред со своим проектом на хорошую аудиторию. Кайф.
❤27👍8🔥2👏2🤣2❤🔥1😁1💯1
Media is too big
VIEW IN TELEGRAM
Вау, Claude Fable 5 — это безумие!!
Он только что воссоздал игру 2011 года (и, вероятно, одну из лучших игр, когда-либо созданных) The Elder Scrolls V: Skyrim за ОДИН промпт.
Промпт:make skyrim
Игровым студиям теперь конец!
——
Он только что воссоздал игру 2011 года (и, вероятно, одну из лучших игр, когда-либо созданных) The Elder Scrolls V: Skyrim за ОДИН промпт.
Промпт:
Игровым студиям теперь конец!
——
P.S простите меня за эту шутку, но именно так сегодня выглядит весь твиттер, реддит и остальные. Когда у них уже лимиты закончатся...
2🤣231😁23💯15❤8⚡5🤯5😡4🤝3👍2👏2😱2
И еще немного о Fable 5 (вы уж потерпите, скоро отключат). В недавнем плейбуке писал про скилл, хотя я бы назвал его поисковым движком, который интегрирован у меня и в Claude Code, и в Hermes для сбора трендов из Reddit, X, YouTube, TikTok, Instagram, Hacker News и Polymarket. Называется /last30days. И всю неделю я его нещадно эксплуатирую в поисках новых хаков или других интересностей в Fable. Но, видимо, я уже давно подключен к коллективному ИИ-бессознательному, ну или это доступ в сообщество ИИзнанка так влияет, но большая часть хаков выглядит как само собой разумеющееся:
1) Первое и главное. Модель реально на голову круче того, что было раньше, поэтому если вы привыкли писать кучерявые промпты с указанием ограничений, пояснениями, что и как делать, то тут такое избыточно и ухудшает результат. Сформулируйте, как должен выглядеть итог задачи, и отойдите. И никогда не просите ее пересказывать свои внутренние рассуждения: даже в официальном гайде написано, что это провоцирует отказы.
2) Сначала непривычно, что не нужно вести модель за руку по шагам. Я почти всегда стал применять команду /goal для непрерывной работы агента. Но тут есть нюансы: недаром Fable прозвали самой «медленной, дорогой и способной» моделью, поэтому токены сжигает только в путь. Вписывайте жесткое условие остановки в каждый длинный прогон: потолок бюджета, потолок времени или условие «готово».
3) ИИ-сообщество, не сговариваясь, пришло к тому, что Fable - отличный оркестратор, а не исполнитель (ну не должен топ-менеджер со своей зарплатой гайки крутить). Моя схема маршрутизации выглядит так: Fable планирует, Sonnet пишет код, Haiku тестирует. Половина агентов делает, половина проверяет, и именно проверяющие решают, доедет ли коммит до репозитория.
4) Крутите ручку Effort. Я уже писал выше и еще раз повторю: для многих задач режима «Medium» более чем достаточно. Читал чувака, который доказал, что Fable на medium обходит Opus 4.8 на high и max, и токенов при этом уходит меньше.
5) Бесит, что сраный классификатор безопасности Fable 5 молча переключает «подозрительные» сессии на Opus 4.8. Кстати, задумывалось это для запросов про кибератаки, биологию и химию, но на деле агрится на все что угодно. Поэтому следите за словами.
6) У модели офигенное «зрение»! А в бенчмарках это как-то упустили. Поэтому если делаете что-то с интерфейсом, попробуйте следующий формат работы: сначала скриншот, потом уже описание словами. Один скриншот стоит десятка прилагательных, картинку модель понимает лучше, чем ваши попытки описать интерфейс терминами.
1) Первое и главное. Модель реально на голову круче того, что было раньше, поэтому если вы привыкли писать кучерявые промпты с указанием ограничений, пояснениями, что и как делать, то тут такое избыточно и ухудшает результат. Сформулируйте, как должен выглядеть итог задачи, и отойдите. И никогда не просите ее пересказывать свои внутренние рассуждения: даже в официальном гайде написано, что это провоцирует отказы.
2) Сначала непривычно, что не нужно вести модель за руку по шагам. Я почти всегда стал применять команду /goal для непрерывной работы агента. Но тут есть нюансы: недаром Fable прозвали самой «медленной, дорогой и способной» моделью, поэтому токены сжигает только в путь. Вписывайте жесткое условие остановки в каждый длинный прогон: потолок бюджета, потолок времени или условие «готово».
3) ИИ-сообщество, не сговариваясь, пришло к тому, что Fable - отличный оркестратор, а не исполнитель (ну не должен топ-менеджер со своей зарплатой гайки крутить). Моя схема маршрутизации выглядит так: Fable планирует, Sonnet пишет код, Haiku тестирует. Половина агентов делает, половина проверяет, и именно проверяющие решают, доедет ли коммит до репозитория.
4) Крутите ручку Effort. Я уже писал выше и еще раз повторю: для многих задач режима «Medium» более чем достаточно. Читал чувака, который доказал, что Fable на medium обходит Opus 4.8 на high и max, и токенов при этом уходит меньше.
5) Бесит, что сраный классификатор безопасности Fable 5 молча переключает «подозрительные» сессии на Opus 4.8. Кстати, задумывалось это для запросов про кибератаки, биологию и химию, но на деле агрится на все что угодно. Поэтому следите за словами.
6) У модели офигенное «зрение»! А в бенчмарках это как-то упустили. Поэтому если делаете что-то с интерфейсом, попробуйте следующий формат работы: сначала скриншот, потом уже описание словами. Один скриншот стоит десятка прилагательных, картинку модель понимает лучше, чем ваши попытки описать интерфейс терминами.
9❤69👍40💯11👏9🔥7🙏3👾3⚡2😘2🦄1
Ребята, многие из вас днем и ночью гоняют Fable 5, потому что до 22 июня на тарифах Pro, Max и Team бесплатный, а потом только по API за 50 баксов (за миллион выходных токенов, что вдвое дороже Opus). Кстати, у нас в ИИзнанке есть маньяки, купившие 2-3 дополнительных подписки за 200 баксов, чтобы успеть доделать свои проекты.
У меня для вас есть небольшой совет: каждый раз, когда модель делает что-то действительно крутое, просите упаковать это в навык как Agent Skill – и он останется у вас и после того, как закроется бесплатное окно.
У меня для вас есть небольшой совет: каждый раз, когда модель делает что-то действительно крутое, просите упаковать это в навык как Agent Skill – и он останется у вас и после того, как закроется бесплатное окно.
🔥119👍16❤13🤣7💯5😘5🙏2👏1😁1🤗1🦄1
Отличные новости! В Claude Code скинули лимиты, но есть нюансы…
Правительство США приказало заблокировать доступ к Fable и Mythos для всех неграждан, включая сотрудников Anthropic без синего паспорта.
Поэтому доступ к Fable закрыли вообще всем пользователям Claude…
https://www.anthropic.com/news/fable-mythos-access
Правительство США приказало заблокировать доступ к Fable и Mythos для всех неграждан, включая сотрудников Anthropic без синего паспорта.
Поэтому доступ к Fable закрыли вообще всем пользователям Claude…
https://www.anthropic.com/news/fable-mythos-access
🤣116😱25🔥15❤6👾3😡3🤯2⚡1💯1😈1🦄1
Сегодня объявляется день страданий по будущему искусственного интеллекта и обсуждения теорий заговора в нашем чате @prompt_chat - залетайте, кто еще не
1🤣57👍6💯5🦄4❤2🔥2❤🔥1🤝1
Я тут прям разогнался в сторьках про всю это движуху с ИИ компаниями. Мне даже стало нравиться их публиковать…
🤣20🔥6❤3⚡2👍2 2👏1💯1
Весь день анализировал новостной поток о блокировке Fable, и каждый раз, когда натыкался на слово «неграждан», меня что-то триггерило. Было ощущение, что где-то я уже это видел, но не мог вспомнить, где.
Весь извелся и пошел шерстить свою личную вики, секонд брейн, блин. А, точно! Почему я (и все остальные) забыли про гениальный сценарий Дэниела Кокотайло - «AI 2027», в этом форсайте он довольно подробно описал, как, по его мнению, будет развиваться вся эта история с искусственным интеллектом с 2025 по 2027 год.
Конечно, он не пишет про конкретные компании, а заменяет их на собирательные образы: OpenBrain - американский лидер с фронтирной моделью и DeepCent - китайский конкурент. Год назад все думали, что OpenBrain - это OpenAI, но в этом году можно сделать допущение и посчитать, что это Anthropic.
Так вот, в мае 2027 Кокотайло спрогнозировал, что будет введена директива «Security clearances», по которой часть сотрудников-неамериканцев компании OpenBrain отстранят от работы с фронтирной моделью.
Ого, нифига себе, прямо как во вчерашнем письме министра торговли Говарда Латника Дарио Амодеи, где он требует ввести запрет на доступ к Fable 5 и Mythos 5 «любого иностранного гражданина» - внутри и вне США, включая собственных сотрудников-неграждан Anthropic. Интересно девки пляшут.
Так, стоп. Письмо от министра торговли? Не от военных? Почему? А тут все просто: поставку Fable 5 и Mythos 5 решили зарегулировать тем же инструментом экспортного контроля, что и продвинутые чипы. Другими словами, Минторг требует у Anthropic лицензию на экспорт, реэкспорт и внутренний трансфер моделей. Ой, а мы не знали, что и для доступа к нашей модели нужна лицензия - подумал Дарио (наверно).
Напомню, что с января прошлого года к экспортно-контролируемым товарам в США, помимо чипов, относят и веса моделей - за это, кстати, больше всех топил Anthropic, но вот что «доступ» к коммерческому фронтиру подпадет под такое регулирование, для Дарио, видимо, стало сюрпризом.
Так что добро пожаловать в новый дивный мир, в котором все фронтир-модели будут считаться стратегическим экспортным товаром, как и продвинутые полупроводники.
Весь извелся и пошел шерстить свою личную вики, секонд брейн, блин. А, точно! Почему я (и все остальные) забыли про гениальный сценарий Дэниела Кокотайло - «AI 2027», в этом форсайте он довольно подробно описал, как, по его мнению, будет развиваться вся эта история с искусственным интеллектом с 2025 по 2027 год.
Конечно, он не пишет про конкретные компании, а заменяет их на собирательные образы: OpenBrain - американский лидер с фронтирной моделью и DeepCent - китайский конкурент. Год назад все думали, что OpenBrain - это OpenAI, но в этом году можно сделать допущение и посчитать, что это Anthropic.
Так вот, в мае 2027 Кокотайло спрогнозировал, что будет введена директива «Security clearances», по которой часть сотрудников-неамериканцев компании OpenBrain отстранят от работы с фронтирной моделью.
Ого, нифига себе, прямо как во вчерашнем письме министра торговли Говарда Латника Дарио Амодеи, где он требует ввести запрет на доступ к Fable 5 и Mythos 5 «любого иностранного гражданина» - внутри и вне США, включая собственных сотрудников-неграждан Anthropic. Интересно девки пляшут.
Так, стоп. Письмо от министра торговли? Не от военных? Почему? А тут все просто: поставку Fable 5 и Mythos 5 решили зарегулировать тем же инструментом экспортного контроля, что и продвинутые чипы. Другими словами, Минторг требует у Anthropic лицензию на экспорт, реэкспорт и внутренний трансфер моделей. Ой, а мы не знали, что и для доступа к нашей модели нужна лицензия - подумал Дарио (наверно).
Напомню, что с января прошлого года к экспортно-контролируемым товарам в США, помимо чипов, относят и веса моделей - за это, кстати, больше всех топил Anthropic, но вот что «доступ» к коммерческому фронтиру подпадет под такое регулирование, для Дарио, видимо, стало сюрпризом.
Так что добро пожаловать в новый дивный мир, в котором все фронтир-модели будут считаться стратегическим экспортным товаром, как и продвинутые полупроводники.
1🔥69❤37👏20🤯15👍8💯7🤗2😘2😁1🙏1🦄1
А вот это уже интересно. Пока мы хоронили Fable 5 и Mythos 5, которых США приравняли к национальному достоянию и запретили раздавать кому попало, OpenRouter обнаружил, что синтез результатов нескольких моделей может значительно превзойти возможности отдельных моделей.
Например, бюджетная связка (Gemini 3 Flash, Kimi K2.6 и DeepSeek V4 Pro) обошла GPT-5.5 и Opus 4.8. Она оказалась в пределах 1% от результата Fable 5, стоя при этом вдвое дешевле.
OpenRouter назвали свой продукт Fusion - инструмент, позволяющий получать такие комбинированные результаты так же легко, как при обращении к одной модели.
Уже можно тестировать: https://openrouter.ai/fusion
Например, бюджетная связка (Gemini 3 Flash, Kimi K2.6 и DeepSeek V4 Pro) обошла GPT-5.5 и Opus 4.8. Она оказалась в пределах 1% от результата Fable 5, стоя при этом вдвое дешевле.
OpenRouter назвали свой продукт Fusion - инструмент, позволяющий получать такие комбинированные результаты так же легко, как при обращении к одной модели.
Чтобы оценить преимущества Fusion, они использовали бенчмарк глубокого исследования (deep research), который проверяет сочетание рассуждения, использования инструментов и знаний. Они выяснили, что:
1) Панели стабильно превосходят отдельные модели
2) Производительность за пределами фронтира достижима с помощью фронтирных панелей
3) Панели бюджетных моделей могут превзойти фронтирные модели и приблизиться к производительности фронтирных панелей
Уже можно тестировать: https://openrouter.ai/fusion
🔥146❤25👏18👍9✍5⚡4💯3🤣3🤗3
Каждый раз заходя в Obsidian, радуюсь, что моя LLM-вики напоминает Звезду Смерти из Звездных Войн. А вот эта «фокусирующая линза суперлазера», круглая хреновина посередине, это память моего агента на базе Hermes. Давно хотел рассказать, как она работает и для чего я ее использую.
Уже писал, что запоминаю информацию, как облако тегов - не могу держать в голове какие-то конкретные данные типа названия сервисов, районов и компаний, а вот прилагательных у меня сколько угодно.
Поэтому общение с моим агентом происходит в формате: «напомни о чем говорил спикер пару недель назад, который рассказывал про классный сервис для обработки объемных документов» и этого хватает, чтобы выдать мне готовый ответ или несколько зацепок, по которым я доберусь до нужной информации. Но как вы понимаете, чтобы получать ответы, LLM-вики нужно наполнять контекстом.
И для этого я использую несколько носимых устройств и парочку ботов (один сидит в телеграме, а другой на звонках в Zoom и Google Meet). Так как же все это работает?
Мой Hermes живет на VPS, я общаюсь с ним через Телеграм. Его единственная задача - вести мой второй мозг: личную базу знаний, которую пишет и поддерживает не человек, а сама модель. Паттерн придумал Андрей Карпатый и назвал это LLM-вики: вики, автором которой выступает LLM.
Внутри два слоя, один работает, как дневник, а второй, как конспект.
1) Первый слой - raw. Это дневник. Сюда дословно и навсегда падает все, что произошло: транскрипты голоса, заметки, пересланные статьи. Эти файлы никогда не редактируются. Дневник нельзя переписать задним числом, иначе он перестанет быть свидетельством.
2) Второй слой - wiki. Это живой конспект. Не свалка заметок, а аккуратные атомарные страницы: одна сущность или концепт на страницу, перекрестные ссылки между ними, мастер-каталог и хронологический лог. И этот конспект мой агент держит в актуальном виде сам.
Дневник отвечает на вопрос что было. Конспект - на вопрос что это значит. Первый дословный и неизменный, второй структурированный и постоянно актуализируется.
Как сырье превращается в память. Когда что-то прилетает, оно мгновенно ложится одним файлом в raw и помечается в реестре как не обработано, мне в Телеграм падает подтверждение. Голос по дороге проходит распознавание и становится дословным транскриптом. На этом шаге ничего не осмысляется, задача только поймать и зафиксировать.
Дальше, по расписанию включается переваривание. Агент читает все необработанное, вытаскивает оттуда сущности, концепты, утверждения и открытые вопросы, и вливает это в вики. Не плодит дубли, а обновляет существующие страницы. Когда я потом задаю вопрос, он идет не в сырье, а в конспект: читает каталог, открывает нужные страницы, синтезирует ответ со ссылками на источники.
Важная штука во всем этом - провенанс. Каждое утверждение в вики помечается: extracted - дословно из источника, inferred - это уже вывод самой модели, ambiguous - источники расходятся. То есть всегда видно, что факт, а что догадка ассистента. Память честно говорит о степени своей уверенности и не выдает свои выводы за мои.
Чем это все кормится:
1) Телеграм - голосовые (через Groq), текст, форварды статей и PDF.
2) TicNote от Mobvoi - ИИ-диктофон на звонки и разговоры: его облако расшифровывает, мой скрипт забирает транскрипт в raw.
3) Omi - опенсорсный рекордер (DevKit2), пишет звук непрерывно на microSD. Я переделал его на свой стек, без облака компании: вынимаю карту, вставляю в Мак, приложение читает только новые записи, Silero VAD режет тишину, Groq Whisper расшифровывает, транскрипт падает в raw. Оттуда агент ингестит в вики.
Что в итоге. Два носимых устройства, одно проприетарное, второе полностью мое, льются в одну трубу. Окружающий захват жизни - разговоры, идеи вслух, звонки - дистиллируется в перелинкованную память, по которой ассистент отвечает на мои СДВГ'шные вопросы.
Уже писал, что запоминаю информацию, как облако тегов - не могу держать в голове какие-то конкретные данные типа названия сервисов, районов и компаний, а вот прилагательных у меня сколько угодно.
Поэтому общение с моим агентом происходит в формате: «напомни о чем говорил спикер пару недель назад, который рассказывал про классный сервис для обработки объемных документов» и этого хватает, чтобы выдать мне готовый ответ или несколько зацепок, по которым я доберусь до нужной информации. Но как вы понимаете, чтобы получать ответы, LLM-вики нужно наполнять контекстом.
И для этого я использую несколько носимых устройств и парочку ботов (один сидит в телеграме, а другой на звонках в Zoom и Google Meet). Так как же все это работает?
Мой Hermes живет на VPS, я общаюсь с ним через Телеграм. Его единственная задача - вести мой второй мозг: личную базу знаний, которую пишет и поддерживает не человек, а сама модель. Паттерн придумал Андрей Карпатый и назвал это LLM-вики: вики, автором которой выступает LLM.
Внутри два слоя, один работает, как дневник, а второй, как конспект.
1) Первый слой - raw. Это дневник. Сюда дословно и навсегда падает все, что произошло: транскрипты голоса, заметки, пересланные статьи. Эти файлы никогда не редактируются. Дневник нельзя переписать задним числом, иначе он перестанет быть свидетельством.
2) Второй слой - wiki. Это живой конспект. Не свалка заметок, а аккуратные атомарные страницы: одна сущность или концепт на страницу, перекрестные ссылки между ними, мастер-каталог и хронологический лог. И этот конспект мой агент держит в актуальном виде сам.
Дневник отвечает на вопрос что было. Конспект - на вопрос что это значит. Первый дословный и неизменный, второй структурированный и постоянно актуализируется.
Как сырье превращается в память. Когда что-то прилетает, оно мгновенно ложится одним файлом в raw и помечается в реестре как не обработано, мне в Телеграм падает подтверждение. Голос по дороге проходит распознавание и становится дословным транскриптом. На этом шаге ничего не осмысляется, задача только поймать и зафиксировать.
Дальше, по расписанию включается переваривание. Агент читает все необработанное, вытаскивает оттуда сущности, концепты, утверждения и открытые вопросы, и вливает это в вики. Не плодит дубли, а обновляет существующие страницы. Когда я потом задаю вопрос, он идет не в сырье, а в конспект: читает каталог, открывает нужные страницы, синтезирует ответ со ссылками на источники.
Важная штука во всем этом - провенанс. Каждое утверждение в вики помечается: extracted - дословно из источника, inferred - это уже вывод самой модели, ambiguous - источники расходятся. То есть всегда видно, что факт, а что догадка ассистента. Память честно говорит о степени своей уверенности и не выдает свои выводы за мои.
Чем это все кормится:
1) Телеграм - голосовые (через Groq), текст, форварды статей и PDF.
2) TicNote от Mobvoi - ИИ-диктофон на звонки и разговоры: его облако расшифровывает, мой скрипт забирает транскрипт в raw.
3) Omi - опенсорсный рекордер (DevKit2), пишет звук непрерывно на microSD. Я переделал его на свой стек, без облака компании: вынимаю карту, вставляю в Мак, приложение читает только новые записи, Silero VAD режет тишину, Groq Whisper расшифровывает, транскрипт падает в raw. Оттуда агент ингестит в вики.
Что в итоге. Два носимых устройства, одно проприетарное, второе полностью мое, льются в одну трубу. Окружающий захват жизни - разговоры, идеи вслух, звонки - дистиллируется в перелинкованную память, по которой ассистент отвечает на мои СДВГ'шные вопросы.
4🔥91❤27👍21🤯11⚡4👏3🙏2🤣1
Media is too big
VIEW IN TELEGRAM
На видео - визуальная модель того, как в «Силиконовый мешок» приходит и выходит трафик
Я же три дня почти не спал. Всё началось с Fable, когда я думал, о какую же большую задачу мне зубы поточить до 22 июня, пока эту шайтан-лавочку не прикрыли. Ну и решил собрать всю статистику по своему каналу и наконец-то увидеть свою «медиаимперию» через макрообъектив реальности цифр.
Когда лавочка с Fable внезапно прикрылась, мой процесс был в самом разгаре, и мне уже было сложно остановиться (гиперфиксация, сами понимаете), поэтому все выходные я ковырял статистику и спамил в ИИзнанку скриншотами своих инсайтов (я там часто делюсь показателями и выводами по ним, вообще не понимаю, почему вы все ещё не там). А ковырять было что - вот только часть стат, которые я смог вытащить (список раскрывается):
Итогом работы стал документ на 2700 строк, с таким количеством инсайтов по написанию контента, утечек в воронке, новых доноров для трафика и кучей разной мякотки, что я не понимаю, почему начал делать это только сейчас.
Не знаю, есть ли смысл какие-то моменты тут писать, всё же тематика не совсем ИИшная, но если накидаете огоньков🔥 - я вам немного технички закину. А кому интересно понять, как это для своих проектов применить, - хватайте слот в ИИзнанке, я вам расскажу.
Я же три дня почти не спал. Всё началось с Fable, когда я думал, о какую же большую задачу мне зубы поточить до 22 июня, пока эту шайтан-лавочку не прикрыли. Ну и решил собрать всю статистику по своему каналу и наконец-то увидеть свою «медиаимперию» через макрообъектив реальности цифр.
Когда лавочка с Fable внезапно прикрылась, мой процесс был в самом разгаре, и мне уже было сложно остановиться (гиперфиксация, сами понимаете), поэтому все выходные я ковырял статистику и спамил в ИИзнанку скриншотами своих инсайтов (я там часто делюсь показателями и выводами по ним, вообще не понимаю, почему вы все ещё не там). А ковырять было что - вот только часть стат, которые я смог вытащить (список раскрывается):
-- TG посты (jsonl) за период 02.2023-06.2026, объем 1,703 поста, поля: дата, текст, просмотры, реакции, ссылка, id поста, канал
-- TG вступления (TGStat Premium, 9 файлов-окон) за период 02.2023-06.2026, объем 84,499 событий вступления по 83,085 уникальным пользователям, из них 26,555 с датой выхода, поля: № п/п, id пользователя, дата вступления, дата выхода, имя, юзернейм, пригласительная ссылка
-- TG авто-отчет канала (PDF) за всю историю, объем 1 отчет (10.9М просмотров, ER 9.46%), поля: сводные показатели канала
-- Threads посты (Threads API) за период 07.2023-06.2026, объем 2,115 постов, поля: id, текст, дата, просмотры, лайки, ответы, репосты, цитаты, тип медиа, ссылка
-- FB активность по дням (csv) за период 01.01-12.06.2026, объем 163 дня, поля: дата, показы, взаимодействия, подписки нетто, реакции, репосты, комментарии, зрители, просмотры
-- FB посты (csv) за период 01-06.2026, объем 159 постов, поля: id публикации, название, тип публикации, время публикации, ссылка, показы, просмотры, взаимодействия, реакции, сохранения, репосты, комментарии, распространение, среднее время просмотра, время просмотра
-- YouTube итоги по видео (csv) за период публикаций 05.2023-06.2026, объем 58 видео, поля: название видео, дата публикации, длительность, просмотры, время просмотра (часы), подписчики, показы, CTR %
-- YouTube просмотры видео по дням (csv) за период 12.06.2025-11.06.2026, объем 1,825 строк, поля: дата, видео, название видео, дата публикации, длительность, просмотры
-- Анкета аудитории (Google Forms, xlsx) за период 02-06.2026, объем 639 ответов, поля: отметка времени, пол, возраст, давность подписки, деятельность, опыт обучения нейросетям, уверенность (1-5), проблемы доступа, актуальные задачи, готовность платить, главные проблемы, интерес к продуктам, тема курса, вопрос для консультации
Итогом работы стал документ на 2700 строк, с таким количеством инсайтов по написанию контента, утечек в воронке, новых доноров для трафика и кучей разной мякотки, что я не понимаю, почему начал делать это только сейчас.
Не знаю, есть ли смысл какие-то моменты тут писать, всё же тематика не совсем ИИшная, но если накидаете огоньков
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥227❤9👍4🤯2😘2⚡1✍1😁1🦄1
Не жили хорошо - нечего и начинать. Антропики вводят верификацию личности для доступа к своим моделям с 8 июля.
Погодите паниковать.
Хотя многие и пишут, что доступ неверифицированным пользователям будет запрещён, я такого в официальной информации от компании не нашёл.
И вообще, они пишут, что верификация выборочная: например, вы захотите насладиться Fable 5:
Касается это пока только личных аккаунтов (Free, Pro, Max):
Хотя если вы увидите у себя в интерфейсе кнопочку "пройти верификацию", отказаться от этого удовольствия уже будет нельзя.
В общем, давайте подождём немного и пока не будем паниковать
Погодите паниковать.
Хотя многие и пишут, что доступ неверифицированным пользователям будет запрещён, я такого в официальной информации от компании не нашёл.
И вообще, они пишут, что верификация выборочная: например, вы захотите насладиться Fable 5:
"you might see a verification prompt when accessing certain capabilities, as part of our routine platform integrity checks, or other safety and compliance measures".
Касается это пока только личных аккаунтов (Free, Pro, Max):
"These updates apply only to consumer accounts… They don't apply if you use Claude Team or Enterprise Plans, the Claude Developer Platform…".
Хотя если вы увидите у себя в интерфейсе кнопочку "пройти верификацию", отказаться от этого удовольствия уже будет нельзя.
В общем, давайте подождём немного и пока не будем паниковать
😡32🤯16❤13😁11🔥5😱4⚡3😢3🤣3👍2👏1
Силиконовый Мешок
Не жили хорошо - нечего и начинать. Антропики вводят верификацию личности для доступа к своим моделям с 8 июля. Погодите паниковать. Хотя многие и пишут, что доступ неверифицированным пользователям будет запрещён, я такого в официальной информации от компании…
Вот мы тут расстраиваемся, ищем обходные пути, а представляете, как Андрей Карпатый страдает.
Только в конце мая Антропики перетащили его к себе работать над LLM, и уже три дня он вынужден обходиться без Fable - и непонятно, сколько ещё будет: американского паспорта у него нет, только грин-карта.
Только в конце мая Антропики перетащили его к себе работать над LLM, и уже три дня он вынужден обходиться без Fable - и непонятно, сколько ещё будет: американского паспорта у него нет, только грин-карта.
🤣118🔥12💯6😁3❤2👍2👏2😢2
Совсем забыл рассказать, что буду журить на фестивале «Креативная премия G8 Creative Awards» в категории Искусственный интеллект (хм, логично).
И там много номинаций: Агенты, ИИ-опыт, ИИ-видео, ИИ в музыке и др., так что если вам есть чем похвастаться, обязательно подавайтесь. Но я буду беспристрастен. Наверно.
И там много номинаций: Агенты, ИИ-опыт, ИИ-видео, ИИ в музыке и др., так что если вам есть чем похвастаться, обязательно подавайтесь. Но я буду беспристрастен. Наверно.
🔥14🤣7❤5👍3👾2⚡1👏1💯1