О, а вы знали, что я начал пулять сторьки в инстушку, чтобы тут не спамить короткими тейками? Так что подписывайтесь.
Сейчас, например, накидываю мыслишки с одного мероприятия, где много рассказывают про ИИ.
Сейчас, например, накидываю мыслишки с одного мероприятия, где много рассказывают про ИИ.
👍11🤩3❤2🔥2😱2🤣2💯1🍌1🗿1 1
Обратил внимание, что ребята из Anthropic Institute (исследовательская лаба Антропиков) очень аккуратно начинают нас готовить к тому, что в ближайшем будущем Клод будет рекурсивно улучшать сам себя.
Это значит, что текущая модель будет создавать следующую и так далее. Собственно, это и есть путь к сингулярности.
Например, в 2026 году инженеры Anthropic в среднем выпускают в 8 раз больше кода за квартал, чем в 2021-2025 годах. И это не только о количестве кода (тут все понятно - жги токены, заливай в гит), там еще и автономность растет.
Например, на открытых задачах по программированию, где заранее неясно, как выглядит решение, доля успешных ответов Клода теперь достигает 76% - рост на 50 пунктов всего за 6 месяцев. Ну и качество кода модели уже сравнялось с тем, что выдает человек.
В общем, нам осторожно намекают, что если все будет идти, как идет сейчас, то в течение пяти лет мы придем к рекурсивному самоулучшению моделей. А это уже совсем другая история…
В комментариях выложу перевод статьи.
Это значит, что текущая модель будет создавать следующую и так далее. Собственно, это и есть путь к сингулярности.
Например, в 2026 году инженеры Anthropic в среднем выпускают в 8 раз больше кода за квартал, чем в 2021-2025 годах. И это не только о количестве кода (тут все понятно - жги токены, заливай в гит), там еще и автономность растет.
Например, на открытых задачах по программированию, где заранее неясно, как выглядит решение, доля успешных ответов Клода теперь достигает 76% - рост на 50 пунктов всего за 6 месяцев. Ну и качество кода модели уже сравнялось с тем, что выдает человек.
В общем, нам осторожно намекают, что если все будет идти, как идет сейчас, то в течение пяти лет мы придем к рекурсивному самоулучшению моделей. А это уже совсем другая история…
В комментариях выложу перевод статьи.
🔥54❤21💯8👍7😢6❤🔥3😈2⚡1🍌1🤝1👾1
Не скучали? У меня тут «Bank Run» случился (умммм, какая шуточка) - в общем, бегал по банковским конференциям, давно было интересно, как большие дяди ИИ внедряют. Сразу скажу - ничего нового, все так же, как и у всех: начальство требует больше ИИ, средний персонал пытается понять, где его взять, младший недоумевает, как с этим работать. Это, конечно же, не касается ML (машинное обучение) - там банки давно ковыряют и активно внедряют в процессы.
В конце недели удалось заскочить в «Т-Двор», где, помимо банковских ребят, выступали представители телекомов и других корпораций. И я не знаю, это феномен Баадера-Майнхоф (когда ты узнал что-то новое и вдруг стал замечать это повсюду) или общий информационный пузырь, но все выдают примерно одинаковые тейки:
— Погружаться, изучать, применять ИИ - нужно прямо сейчас
— Лучшее применение ИИ - это улучшение навыков, приобретенных раньше (удлинение ручек)
— ИИ - это инструмент, а не волшебная палочка. Поэтому важно понимать, как должен выглядеть результат работы еще до первого промпта
— ИИ не заменит специалиста, но специалист с ИИ заменит специалиста без него - банально, но до многих это только доходит
— Промпт - это новое ТЗ. Кто не умел ставить задачу человеку, тот не поставит ее и нейронке. Удивительно, как много спикеров эту мысль разгоняли
— Нет смысла нанимать промпт-инженеров, промптологов, автоматизаторов - лучше выращивать внутри из тех, кто уже давно разбирается в процессах компании
— Многие заметили, что ИИ отлично вскрывает бардак - если процесс не описан и не оцифрован, автоматизировать там нечего
В конце недели удалось заскочить в «Т-Двор», где, помимо банковских ребят, выступали представители телекомов и других корпораций. И я не знаю, это феномен Баадера-Майнхоф (когда ты узнал что-то новое и вдруг стал замечать это повсюду) или общий информационный пузырь, но все выдают примерно одинаковые тейки:
— Погружаться, изучать, применять ИИ - нужно прямо сейчас
— Лучшее применение ИИ - это улучшение навыков, приобретенных раньше (удлинение ручек)
— ИИ - это инструмент, а не волшебная палочка. Поэтому важно понимать, как должен выглядеть результат работы еще до первого промпта
— ИИ не заменит специалиста, но специалист с ИИ заменит специалиста без него - банально, но до многих это только доходит
— Промпт - это новое ТЗ. Кто не умел ставить задачу человеку, тот не поставит ее и нейронке. Удивительно, как много спикеров эту мысль разгоняли
— Нет смысла нанимать промпт-инженеров, промптологов, автоматизаторов - лучше выращивать внутри из тех, кто уже давно разбирается в процессах компании
— Многие заметили, что ИИ отлично вскрывает бардак - если процесс не описан и не оцифрован, автоматизировать там нечего
🔥41👍19💯19❤11😁2⚡1👏1🙏1🍌1
Помните, я про Олега и его курс по визуальным нейросетям писал? Вот это то, о чем я всегда говорю, когда задвигаю тезис, что нейросети - это как экзоскелет для мозга, который усиливает сигналы, но если их нет - он бесполезен.
Например, если у тебя есть понимание, что такое композиция в кадре, кадрирование, как строится сцена, то не так важно, выставляешь ты это настройками фотоаппарата или описываешь в промпте. И вот именно такой подход у Олега - он не учит «нажимать кнопочки» или «искать промпты», а настраивает ваш мозг для работы с нейросетями.
Кстати, завтра стартует его следующий курс «Нейросети в кино. Мастерская короткого фильма», вот тут можете ознакомиться: https://tserbaev.ru/ai-video
А еще мы решили сделать конкурс и разыграть место на курсе Олега:
Помните, как по легенде, Хемингуэй однажды поспорил, что напишет рассказ из четырех слов, который тронет любого. И написал: «Продаются детские ботиночки. Неношеные» или, как Сценарист Тонино Гуэрра выиграл спор у Федерико Феллини, придумал фильм длиной в десять секунд: «...Женщина смотрит трансляцию запуска ракеты. Обратный отсчет: десять, девять, восемь... Она набирает номер. Ракета взлетает. Женщина говорит в трубку: "Приезжай. Он улетел"».
Так что задание простое: придумайте свою историю длиной примерно в десять слов.
Не нужно быть сценаристом. Не нужно знать, что такое логлайн, синопсис и «второй акт». Просто опишите одну сцену, одну картинку, один момент - обычными словами, как рассказали бы другу. Ваша сцена - как зарисовка, как маленькая картинка, в которой есть глубина.
Например:
— «Когда он проснулся, динозавр все еще был там» (Аугусто Монтерросо)
— «Последний человек на Земле сидел в комнате. В дверь постучали...» (Фредрик Браун).
— «Компьютер, мы взяли батарейки? Компьютер?» (фантаст Эйлин Ганн).
Три подсказки, как придумать свою:
Начните с конца. Покажите результат события.
Столкните два факта, которые не должны быть рядом.
Уберите объяснения.
Что разыгрываем:
Место на курсе «Нейросети в кино. Мастерская короткого фильма» - 10 занятий, не видео, а путь от первой картинки до настоящего минутного фильма: драматургия, киноязык, монтаж, звук.
Как участвовать:
— история 10-15 слов, в комментарии к этому посту. Чем короче, тем лучше.
— прием работ до 9-го июня 15.00 мск.
— итоги 9-го июня 18.00 мск. здесь, в канале.
— старт курса 9-го июня 19.00 мск.
Например, если у тебя есть понимание, что такое композиция в кадре, кадрирование, как строится сцена, то не так важно, выставляешь ты это настройками фотоаппарата или описываешь в промпте. И вот именно такой подход у Олега - он не учит «нажимать кнопочки» или «искать промпты», а настраивает ваш мозг для работы с нейросетями.
Кстати, завтра стартует его следующий курс «Нейросети в кино. Мастерская короткого фильма», вот тут можете ознакомиться: https://tserbaev.ru/ai-video
А еще мы решили сделать конкурс и разыграть место на курсе Олега:
Помните, как по легенде, Хемингуэй однажды поспорил, что напишет рассказ из четырех слов, который тронет любого. И написал: «Продаются детские ботиночки. Неношеные» или, как Сценарист Тонино Гуэрра выиграл спор у Федерико Феллини, придумал фильм длиной в десять секунд: «...Женщина смотрит трансляцию запуска ракеты. Обратный отсчет: десять, девять, восемь... Она набирает номер. Ракета взлетает. Женщина говорит в трубку: "Приезжай. Он улетел"».
Так что задание простое: придумайте свою историю длиной примерно в десять слов.
Не нужно быть сценаристом. Не нужно знать, что такое логлайн, синопсис и «второй акт». Просто опишите одну сцену, одну картинку, один момент - обычными словами, как рассказали бы другу. Ваша сцена - как зарисовка, как маленькая картинка, в которой есть глубина.
Например:
— «Когда он проснулся, динозавр все еще был там» (Аугусто Монтерросо)
— «Последний человек на Земле сидел в комнате. В дверь постучали...» (Фредрик Браун).
— «Компьютер, мы взяли батарейки? Компьютер?» (фантаст Эйлин Ганн).
Три подсказки, как придумать свою:
Начните с конца. Покажите результат события.
Столкните два факта, которые не должны быть рядом.
Уберите объяснения.
Что разыгрываем:
Место на курсе «Нейросети в кино. Мастерская короткого фильма» - 10 занятий, не видео, а путь от первой картинки до настоящего минутного фильма: драматургия, киноязык, монтаж, звук.
Как участвовать:
— история 10-15 слов, в комментарии к этому посту. Чем короче, тем лучше.
— прием работ до 9-го июня 15.00 мск.
— итоги 9-го июня 18.00 мск. здесь, в канале.
— старт курса 9-го июня 19.00 мск.
❤21🔥10👍7⚡2❤🔥2👏2🍌2🙏1🤗1🤪1🗿1
Силиконовый Мешок
Ну что, ждём сегодня или завтра?
Так, про GPT-5.6 не подтвердился прогноз. Хотя я их прекрасно понимаю - релизить новую модель на падении рынка, такая себе идея.
Но меня сильно смущает, что Polymarket дает больше 70%, что релиз новой модели Mythos от антропиков случится сегодня и 82%, что завтра.
Вообще, они, конечно, должны выкатить ее до конца месяца, дальше уже нет смысла тянуть.
Но думаю, что это будет урезанный со всех сторон Mythos - совсем не то, чем восторгается та небольшая группа компаний, что гоняет модель уже второй месяц.
Как бы то ни было - лето будет жаркое (лишь бы хватило воды для охлаждения датацентров).
Но меня сильно смущает, что Polymarket дает больше 70%, что релиз новой модели Mythos от антропиков случится сегодня и 82%, что завтра.
Вообще, они, конечно, должны выкатить ее до конца месяца, дальше уже нет смысла тянуть.
Но думаю, что это будет урезанный со всех сторон Mythos - совсем не то, чем восторгается та небольшая группа компаний, что гоняет модель уже второй месяц.
Как бы то ни было - лето будет жаркое (лишь бы хватило воды для охлаждения датацентров).
1🔥34❤11💯6👍4😁4⚡1👏1😍1🍌1🤗1
Силиконовый Мешок
Помните, я про Олега и его курс по визуальным нейросетям писал? Вот это то, о чем я всегда говорю, когда задвигаю тезис, что нейросети - это как экзоскелет для мозга, который усиливает сигналы, но если их нет - он бесполезен. Например, если у тебя есть понимание…
Media is too big
VIEW IN TELEGRAM
Наш конкурс подошел к концу, объявляем победителя. Олег выбрал работу Николая: «Сын нарисовал семью. Папу — карандашом. На всякий случай».
Кстати, все те, кто принимал участие, получают скидку - 15% на курс «Нейросети в кино. Мастерская короткого фильма», который стартует уже через 20 минут.
Бегите к Олегу (@tserbaev) за скидкой в личку. Всем спасибо!
Кстати, все те, кто принимал участие, получают скидку - 15% на курс «Нейросети в кино. Мастерская короткого фильма», который стартует уже через 20 минут.
Бегите к Олегу (@tserbaev) за скидкой в личку. Всем спасибо!
❤13🔥9👏8🙏2💯2🦄2⚡1🤯1👀1🤝1🤗1
hacks_ru.pdf
192.8 KB
Все хаки агентного инжиниринга, что я знаю
Вот правду говорят - «искал медь, а нашел золото», так и я искал решение для поиска по Reddit, X, YouTube, TikTok, Instagram, HN, Polymarket, GitHub, а нашел офигенные лайфхаки от Мэтта Ван Хорна.
Я постарался перевести их максимально близко к авторскому стилю, но, если что, там в документе есть ссылка на оригинальный тред, а еще сделал .MD для вашего агента - он в комментариях к посту.
В общем, гайд и для новичков, и для бывалых пользователей агентов (Hermes, Claude, Codex и т.д.), особенно мне зашел его подход в работе с Wiki-LLM и plan.md - многое себе забрал. Так что мои рекомендации!
Вот правду говорят - «искал медь, а нашел золото», так и я искал решение для поиска по Reddit, X, YouTube, TikTok, Instagram, HN, Polymarket, GitHub, а нашел офигенные лайфхаки от Мэтта Ван Хорна.
Я постарался перевести их максимально близко к авторскому стилю, но, если что, там в документе есть ссылка на оригинальный тред, а еще сделал .MD для вашего агента - он в комментариях к посту.
В общем, гайд и для новичков, и для бывалых пользователей агентов (Hermes, Claude, Codex и т.д.), особенно мне зашел его подход в работе с Wiki-LLM и plan.md - многое себе забрал. Так что мои рекомендации!
5❤106🔥49👏17👍9🙏6⚡1💯1🤣1🤗1😘1
Силиконовый Мешок
Так, про GPT-5.6 не подтвердился прогноз. Хотя я их прекрасно понимаю - релизить новую модель на падении рынка, такая себе идея. Но меня сильно смущает, что Polymarket дает больше 70%, что релиз новой модели Mythos от антропиков случится сегодня и 82%, что…
На этот раз не промахнулся с прогнозом. Антропики выпустили Fable 5 (тот же Mythos, но с защитой от дураков).
Уже раскатывают по Claude Code в подписках за $20, $100 и $200. Но есть и нюансы: доступна она там будет только до 22 июня, а после будет только по API-ценам для всех ($10 за миллион входных токенов и $50 за миллион выходных, что в два раза дороже Opus).
А еще все ваши запросы к Fable будут в течение 30 дней храниться на серверах и анализироваться, чтобы можно было вылавливать тех, кто как-то незаконно использует модель, дистиллирует - короче, балуется.
Уже раскатывают по Claude Code в подписках за $20, $100 и $200. Но есть и нюансы: доступна она там будет только до 22 июня, а после будет только по API-ценам для всех ($10 за миллион входных токенов и $50 за миллион выходных, что в два раза дороже Opus).
А еще все ваши запросы к Fable будут в течение 30 дней храниться на серверах и анализироваться, чтобы можно было вылавливать тех, кто как-то незаконно использует модель, дистиллирует - короче, балуется.
1🔥45❤17👍10👀8👏6🦄2✍1😁1💯1🤗1
Поспать сегодня не получилось, всю ночь ковырял новый Fable. И знаете, мне пока все нравится. Да, кушает он хорошо, даже думал еще одну подписку сделать (не скажу, какую по счету). И вот мои мыслишки по свежим (вообще нет) следам:
1) Вот, теперь стало понятно, для чего антропики сделали режим Workflow. В Fable он раскрылся на полную: попросил сделать полное код-ревью, после чего модель подняла сотни агентов параллельно. Мне показалось, что она для каждого файла в проекте назначила отдельного агента. Как итог, нашла баги, пробелы в документации, даже к UX проекта у нее справедливые претензии возникли
2) Раньше большую задачу приходилось резать на куски и скармливать модели по частям, иначе она тупила и галлюцинировала. Теперь лучше отдавать всю задачу целиком, и Fable будет работать над ней часами, пока не доделает. Из нескольких больших задач пока ни одну не бросил на полпути
3) Даже подход к работе с моделью стал другой. Раньше: написал промпт, получил ответ, поправил, снова промпт. С Fable лучше один раз объяснить, какой результат нужен и как понять, что он достигнут, и отпустить. Дальше он сам проверяет свою работу, находит косяки, исправляет и повторяет, пока не получится
4) Хотя есть нюанс, мне не понравилось, как внутри одной сессии модель оценивает свою же работу. Поэтому лучше, если проверку делает вторая модель, которая не видела процесс работы и смотрит только на результат
5) Отдельное удовольствие, как теперь работает память между сессиями. Раньше мне казалось, что модель все свои записи в процессе работы совсем не перечитывала. А Fable на своих ошибках реально учится: разбирается, почему ошибся, делает вывод и в следующий раз этот вывод использует. Сам, без напоминаний
6) Чем конкретнее список требований, тем лучше результат. Не «сделай хорошо», а буквально чек-лист: пункт 1, пункт 2, пункт 3. Модель не остановится, пока не закроет каждый пункт. С таким чек-листом Fable у меня работал всю ночь без перерыва
7) У модели есть настройка «сколько думать над ответом» (Effort). Совет: ставьте меньше, чем кажется нужным. Даже на минимуме (Low) он умнее всего, что я видел, а на средних (Medium) настройках может пять минут размышлять над простым вопросом
8) Бесит, что он такой болтливый стал. Объясняет так подробно и много, что я пару раз почувствовал себя тупым. И обожает уточняющие вопросы: вместо того чтобы просто сделать, сначала устроит допрос и попросит подтвердить каждый шаг. Лечится просьбой «объясняй проще и решай сам», но не до конца. Обещают починить
1) Вот, теперь стало понятно, для чего антропики сделали режим Workflow. В Fable он раскрылся на полную: попросил сделать полное код-ревью, после чего модель подняла сотни агентов параллельно. Мне показалось, что она для каждого файла в проекте назначила отдельного агента. Как итог, нашла баги, пробелы в документации, даже к UX проекта у нее справедливые претензии возникли
2) Раньше большую задачу приходилось резать на куски и скармливать модели по частям, иначе она тупила и галлюцинировала. Теперь лучше отдавать всю задачу целиком, и Fable будет работать над ней часами, пока не доделает. Из нескольких больших задач пока ни одну не бросил на полпути
3) Даже подход к работе с моделью стал другой. Раньше: написал промпт, получил ответ, поправил, снова промпт. С Fable лучше один раз объяснить, какой результат нужен и как понять, что он достигнут, и отпустить. Дальше он сам проверяет свою работу, находит косяки, исправляет и повторяет, пока не получится
4) Хотя есть нюанс, мне не понравилось, как внутри одной сессии модель оценивает свою же работу. Поэтому лучше, если проверку делает вторая модель, которая не видела процесс работы и смотрит только на результат
5) Отдельное удовольствие, как теперь работает память между сессиями. Раньше мне казалось, что модель все свои записи в процессе работы совсем не перечитывала. А Fable на своих ошибках реально учится: разбирается, почему ошибся, делает вывод и в следующий раз этот вывод использует. Сам, без напоминаний
6) Чем конкретнее список требований, тем лучше результат. Не «сделай хорошо», а буквально чек-лист: пункт 1, пункт 2, пункт 3. Модель не остановится, пока не закроет каждый пункт. С таким чек-листом Fable у меня работал всю ночь без перерыва
7) У модели есть настройка «сколько думать над ответом» (Effort). Совет: ставьте меньше, чем кажется нужным. Даже на минимуме (Low) он умнее всего, что я видел, а на средних (Medium) настройках может пять минут размышлять над простым вопросом
8) Бесит, что он такой болтливый стал. Объясняет так подробно и много, что я пару раз почувствовал себя тупым. И обожает уточняющие вопросы: вместо того чтобы просто сделать, сначала устроит допрос и попросит подтвердить каждый шаг. Лечится просьбой «объясняй проще и решай сам», но не до конца. Обещают починить
🔥60❤42👍21😢4🦄4 4✍2👏2🙏2💯2🤗1
Знаете, как я понимаю, что у участников сообщества ИИзнанка случается все больше и больше успешных кейсов? Да, периодически кто-то хвастается успехами - и мы вместе радуемся. Но главный признак успешных проектов - это когда все больше участников просят поделиться контактами хороших юристов. Потому что если проект приносит ощутимую прибыль, начинаешь более усердно чесаться и думать, все ли в порядке в моем палисадничке.
Мы даже решили завтра пригласить к нам на «полезный звонок» (есть у нас и такой формат) юриста по персональным данным, чтобы помучить его вопросами:
— Как работать с персональными данными, когда вы создаете приложение или сервис?
— Где главные риски: формы, авторизация, аналитика, нейросети, передача данных?
— Что произошло в регулировании за год и куда все движется?
Так что если вы раздумывали, залететь ли в закрытое сообщество ИИзнанка - вот вам знак. Смотрите сами, по цене сытного завтрака вы получаете кучу всего: приходите завтра в 19:00 на бесплатный воркшоп с юристом, бронируете слот со мной на удобное вам время (обсудим ваш проект или задачи), получаете вечный доступ в сообщество Research Mastermind, целый месяц резвитесь в чатике с крутыми ИИ-билдерами, задаете вопросы нашему боту (например: «познакомь меня со всеми, кто делает ИИ-автоматизации»), а еще можете выступить в одну из сред со своим проектом на хорошую аудиторию. Кайф.
Мы даже решили завтра пригласить к нам на «полезный звонок» (есть у нас и такой формат) юриста по персональным данным, чтобы помучить его вопросами:
— Как работать с персональными данными, когда вы создаете приложение или сервис?
— Где главные риски: формы, авторизация, аналитика, нейросети, передача данных?
— Что произошло в регулировании за год и куда все движется?
Так что если вы раздумывали, залететь ли в закрытое сообщество ИИзнанка - вот вам знак. Смотрите сами, по цене сытного завтрака вы получаете кучу всего: приходите завтра в 19:00 на бесплатный воркшоп с юристом, бронируете слот со мной на удобное вам время (обсудим ваш проект или задачи), получаете вечный доступ в сообщество Research Mastermind, целый месяц резвитесь в чатике с крутыми ИИ-билдерами, задаете вопросы нашему боту (например: «познакомь меня со всеми, кто делает ИИ-автоматизации»), а еще можете выступить в одну из сред со своим проектом на хорошую аудиторию. Кайф.
❤27👍8🔥2👏2🤣2❤🔥1😁1💯1
Media is too big
VIEW IN TELEGRAM
Вау, Claude Fable 5 — это безумие!!
Он только что воссоздал игру 2011 года (и, вероятно, одну из лучших игр, когда-либо созданных) The Elder Scrolls V: Skyrim за ОДИН промпт.
Промпт:make skyrim
Игровым студиям теперь конец!
——
Он только что воссоздал игру 2011 года (и, вероятно, одну из лучших игр, когда-либо созданных) The Elder Scrolls V: Skyrim за ОДИН промпт.
Промпт:
Игровым студиям теперь конец!
——
P.S простите меня за эту шутку, но именно так сегодня выглядит весь твиттер, реддит и остальные. Когда у них уже лимиты закончатся...
2🤣231😁23💯15❤8⚡5🤯5😡4🤝3👍2👏2😱2
И еще немного о Fable 5 (вы уж потерпите, скоро отключат). В недавнем плейбуке писал про скилл, хотя я бы назвал его поисковым движком, который интегрирован у меня и в Claude Code, и в Hermes для сбора трендов из Reddit, X, YouTube, TikTok, Instagram, Hacker News и Polymarket. Называется /last30days. И всю неделю я его нещадно эксплуатирую в поисках новых хаков или других интересностей в Fable. Но, видимо, я уже давно подключен к коллективному ИИ-бессознательному, ну или это доступ в сообщество ИИзнанка так влияет, но большая часть хаков выглядит как само собой разумеющееся:
1) Первое и главное. Модель реально на голову круче того, что было раньше, поэтому если вы привыкли писать кучерявые промпты с указанием ограничений, пояснениями, что и как делать, то тут такое избыточно и ухудшает результат. Сформулируйте, как должен выглядеть итог задачи, и отойдите. И никогда не просите ее пересказывать свои внутренние рассуждения: даже в официальном гайде написано, что это провоцирует отказы.
2) Сначала непривычно, что не нужно вести модель за руку по шагам. Я почти всегда стал применять команду /goal для непрерывной работы агента. Но тут есть нюансы: недаром Fable прозвали самой «медленной, дорогой и способной» моделью, поэтому токены сжигает только в путь. Вписывайте жесткое условие остановки в каждый длинный прогон: потолок бюджета, потолок времени или условие «готово».
3) ИИ-сообщество, не сговариваясь, пришло к тому, что Fable - отличный оркестратор, а не исполнитель (ну не должен топ-менеджер со своей зарплатой гайки крутить). Моя схема маршрутизации выглядит так: Fable планирует, Sonnet пишет код, Haiku тестирует. Половина агентов делает, половина проверяет, и именно проверяющие решают, доедет ли коммит до репозитория.
4) Крутите ручку Effort. Я уже писал выше и еще раз повторю: для многих задач режима «Medium» более чем достаточно. Читал чувака, который доказал, что Fable на medium обходит Opus 4.8 на high и max, и токенов при этом уходит меньше.
5) Бесит, что сраный классификатор безопасности Fable 5 молча переключает «подозрительные» сессии на Opus 4.8. Кстати, задумывалось это для запросов про кибератаки, биологию и химию, но на деле агрится на все что угодно. Поэтому следите за словами.
6) У модели офигенное «зрение»! А в бенчмарках это как-то упустили. Поэтому если делаете что-то с интерфейсом, попробуйте следующий формат работы: сначала скриншот, потом уже описание словами. Один скриншот стоит десятка прилагательных, картинку модель понимает лучше, чем ваши попытки описать интерфейс терминами.
1) Первое и главное. Модель реально на голову круче того, что было раньше, поэтому если вы привыкли писать кучерявые промпты с указанием ограничений, пояснениями, что и как делать, то тут такое избыточно и ухудшает результат. Сформулируйте, как должен выглядеть итог задачи, и отойдите. И никогда не просите ее пересказывать свои внутренние рассуждения: даже в официальном гайде написано, что это провоцирует отказы.
2) Сначала непривычно, что не нужно вести модель за руку по шагам. Я почти всегда стал применять команду /goal для непрерывной работы агента. Но тут есть нюансы: недаром Fable прозвали самой «медленной, дорогой и способной» моделью, поэтому токены сжигает только в путь. Вписывайте жесткое условие остановки в каждый длинный прогон: потолок бюджета, потолок времени или условие «готово».
3) ИИ-сообщество, не сговариваясь, пришло к тому, что Fable - отличный оркестратор, а не исполнитель (ну не должен топ-менеджер со своей зарплатой гайки крутить). Моя схема маршрутизации выглядит так: Fable планирует, Sonnet пишет код, Haiku тестирует. Половина агентов делает, половина проверяет, и именно проверяющие решают, доедет ли коммит до репозитория.
4) Крутите ручку Effort. Я уже писал выше и еще раз повторю: для многих задач режима «Medium» более чем достаточно. Читал чувака, который доказал, что Fable на medium обходит Opus 4.8 на high и max, и токенов при этом уходит меньше.
5) Бесит, что сраный классификатор безопасности Fable 5 молча переключает «подозрительные» сессии на Opus 4.8. Кстати, задумывалось это для запросов про кибератаки, биологию и химию, но на деле агрится на все что угодно. Поэтому следите за словами.
6) У модели офигенное «зрение»! А в бенчмарках это как-то упустили. Поэтому если делаете что-то с интерфейсом, попробуйте следующий формат работы: сначала скриншот, потом уже описание словами. Один скриншот стоит десятка прилагательных, картинку модель понимает лучше, чем ваши попытки описать интерфейс терминами.
9❤69👍40💯11👏9🔥7🙏3👾3⚡2😘2🦄1
Ребята, многие из вас днем и ночью гоняют Fable 5, потому что до 22 июня на тарифах Pro, Max и Team бесплатный, а потом только по API за 50 баксов (за миллион выходных токенов, что вдвое дороже Opus). Кстати, у нас в ИИзнанке есть маньяки, купившие 2-3 дополнительных подписки за 200 баксов, чтобы успеть доделать свои проекты.
У меня для вас есть небольшой совет: каждый раз, когда модель делает что-то действительно крутое, просите упаковать это в навык как Agent Skill – и он останется у вас и после того, как закроется бесплатное окно.
У меня для вас есть небольшой совет: каждый раз, когда модель делает что-то действительно крутое, просите упаковать это в навык как Agent Skill – и он останется у вас и после того, как закроется бесплатное окно.
🔥119👍16❤13🤣7💯5😘5🙏2👏1😁1🤗1🦄1
Отличные новости! В Claude Code скинули лимиты, но есть нюансы…
Правительство США приказало заблокировать доступ к Fable и Mythos для всех неграждан, включая сотрудников Anthropic без синего паспорта.
Поэтому доступ к Fable закрыли вообще всем пользователям Claude…
https://www.anthropic.com/news/fable-mythos-access
Правительство США приказало заблокировать доступ к Fable и Mythos для всех неграждан, включая сотрудников Anthropic без синего паспорта.
Поэтому доступ к Fable закрыли вообще всем пользователям Claude…
https://www.anthropic.com/news/fable-mythos-access
🤣116😱25🔥15❤6👾3😡3🤯2⚡1💯1😈1🦄1
Сегодня объявляется день страданий по будущему искусственного интеллекта и обсуждения теорий заговора в нашем чате @prompt_chat - залетайте, кто еще не
1🤣57👍6💯5🦄4❤2🔥2❤🔥1🤝1
Я тут прям разогнался в сторьках про всю это движуху с ИИ компаниями. Мне даже стало нравиться их публиковать…
🤣20🔥6❤3⚡2👍2 2👏1💯1
Весь день анализировал новостной поток о блокировке Fable, и каждый раз, когда натыкался на слово «неграждан», меня что-то триггерило. Было ощущение, что где-то я уже это видел, но не мог вспомнить, где.
Весь извелся и пошел шерстить свою личную вики, секонд брейн, блин. А, точно! Почему я (и все остальные) забыли про гениальный сценарий Дэниела Кокотайло - «AI 2027», в этом форсайте он довольно подробно описал, как, по его мнению, будет развиваться вся эта история с искусственным интеллектом с 2025 по 2027 год.
Конечно, он не пишет про конкретные компании, а заменяет их на собирательные образы: OpenBrain - американский лидер с фронтирной моделью и DeepCent - китайский конкурент. Год назад все думали, что OpenBrain - это OpenAI, но в этом году можно сделать допущение и посчитать, что это Anthropic.
Так вот, в мае 2027 Кокотайло спрогнозировал, что будет введена директива «Security clearances», по которой часть сотрудников-неамериканцев компании OpenBrain отстранят от работы с фронтирной моделью.
Ого, нифига себе, прямо как во вчерашнем письме министра торговли Говарда Латника Дарио Амодеи, где он требует ввести запрет на доступ к Fable 5 и Mythos 5 «любого иностранного гражданина» - внутри и вне США, включая собственных сотрудников-неграждан Anthropic. Интересно девки пляшут.
Так, стоп. Письмо от министра торговли? Не от военных? Почему? А тут все просто: поставку Fable 5 и Mythos 5 решили зарегулировать тем же инструментом экспортного контроля, что и продвинутые чипы. Другими словами, Минторг требует у Anthropic лицензию на экспорт, реэкспорт и внутренний трансфер моделей. Ой, а мы не знали, что и для доступа к нашей модели нужна лицензия - подумал Дарио (наверно).
Напомню, что с января прошлого года к экспортно-контролируемым товарам в США, помимо чипов, относят и веса моделей - за это, кстати, больше всех топил Anthropic, но вот что «доступ» к коммерческому фронтиру подпадет под такое регулирование, для Дарио, видимо, стало сюрпризом.
Так что добро пожаловать в новый дивный мир, в котором все фронтир-модели будут считаться стратегическим экспортным товаром, как и продвинутые полупроводники.
Весь извелся и пошел шерстить свою личную вики, секонд брейн, блин. А, точно! Почему я (и все остальные) забыли про гениальный сценарий Дэниела Кокотайло - «AI 2027», в этом форсайте он довольно подробно описал, как, по его мнению, будет развиваться вся эта история с искусственным интеллектом с 2025 по 2027 год.
Конечно, он не пишет про конкретные компании, а заменяет их на собирательные образы: OpenBrain - американский лидер с фронтирной моделью и DeepCent - китайский конкурент. Год назад все думали, что OpenBrain - это OpenAI, но в этом году можно сделать допущение и посчитать, что это Anthropic.
Так вот, в мае 2027 Кокотайло спрогнозировал, что будет введена директива «Security clearances», по которой часть сотрудников-неамериканцев компании OpenBrain отстранят от работы с фронтирной моделью.
Ого, нифига себе, прямо как во вчерашнем письме министра торговли Говарда Латника Дарио Амодеи, где он требует ввести запрет на доступ к Fable 5 и Mythos 5 «любого иностранного гражданина» - внутри и вне США, включая собственных сотрудников-неграждан Anthropic. Интересно девки пляшут.
Так, стоп. Письмо от министра торговли? Не от военных? Почему? А тут все просто: поставку Fable 5 и Mythos 5 решили зарегулировать тем же инструментом экспортного контроля, что и продвинутые чипы. Другими словами, Минторг требует у Anthropic лицензию на экспорт, реэкспорт и внутренний трансфер моделей. Ой, а мы не знали, что и для доступа к нашей модели нужна лицензия - подумал Дарио (наверно).
Напомню, что с января прошлого года к экспортно-контролируемым товарам в США, помимо чипов, относят и веса моделей - за это, кстати, больше всех топил Anthropic, но вот что «доступ» к коммерческому фронтиру подпадет под такое регулирование, для Дарио, видимо, стало сюрпризом.
Так что добро пожаловать в новый дивный мир, в котором все фронтир-модели будут считаться стратегическим экспортным товаром, как и продвинутые полупроводники.
1🔥69❤37👏20🤯15👍8💯7🤗2😘2😁1🙏1🦄1
А вот это уже интересно. Пока мы хоронили Fable 5 и Mythos 5, которых США приравняли к национальному достоянию и запретили раздавать кому попало, OpenRouter обнаружил, что синтез результатов нескольких моделей может значительно превзойти возможности отдельных моделей.
Например, бюджетная связка (Gemini 3 Flash, Kimi K2.6 и DeepSeek V4 Pro) обошла GPT-5.5 и Opus 4.8. Она оказалась в пределах 1% от результата Fable 5, стоя при этом вдвое дешевле.
OpenRouter назвали свой продукт Fusion - инструмент, позволяющий получать такие комбинированные результаты так же легко, как при обращении к одной модели.
Уже можно тестировать: https://openrouter.ai/fusion
Например, бюджетная связка (Gemini 3 Flash, Kimi K2.6 и DeepSeek V4 Pro) обошла GPT-5.5 и Opus 4.8. Она оказалась в пределах 1% от результата Fable 5, стоя при этом вдвое дешевле.
OpenRouter назвали свой продукт Fusion - инструмент, позволяющий получать такие комбинированные результаты так же легко, как при обращении к одной модели.
Чтобы оценить преимущества Fusion, они использовали бенчмарк глубокого исследования (deep research), который проверяет сочетание рассуждения, использования инструментов и знаний. Они выяснили, что:
1) Панели стабильно превосходят отдельные модели
2) Производительность за пределами фронтира достижима с помощью фронтирных панелей
3) Панели бюджетных моделей могут превзойти фронтирные модели и приблизиться к производительности фронтирных панелей
Уже можно тестировать: https://openrouter.ai/fusion
🔥146❤25👏18👍9✍6⚡4💯3🤣3🤗3
Каждый раз заходя в Obsidian, радуюсь, что моя LLM-вики напоминает Звезду Смерти из Звездных Войн. А вот эта «фокусирующая линза суперлазера», круглая хреновина посередине, это память моего агента на базе Hermes. Давно хотел рассказать, как она работает и для чего я ее использую.
Уже писал, что запоминаю информацию, как облако тегов - не могу держать в голове какие-то конкретные данные типа названия сервисов, районов и компаний, а вот прилагательных у меня сколько угодно.
Поэтому общение с моим агентом происходит в формате: «напомни о чем говорил спикер пару недель назад, который рассказывал про классный сервис для обработки объемных документов» и этого хватает, чтобы выдать мне готовый ответ или несколько зацепок, по которым я доберусь до нужной информации. Но как вы понимаете, чтобы получать ответы, LLM-вики нужно наполнять контекстом.
И для этого я использую несколько носимых устройств и парочку ботов (один сидит в телеграме, а другой на звонках в Zoom и Google Meet). Так как же все это работает?
Мой Hermes живет на VPS, я общаюсь с ним через Телеграм. Его единственная задача - вести мой второй мозг: личную базу знаний, которую пишет и поддерживает не человек, а сама модель. Паттерн придумал Андрей Карпатый и назвал это LLM-вики: вики, автором которой выступает LLM.
Внутри два слоя, один работает, как дневник, а второй, как конспект.
1) Первый слой - raw. Это дневник. Сюда дословно и навсегда падает все, что произошло: транскрипты голоса, заметки, пересланные статьи. Эти файлы никогда не редактируются. Дневник нельзя переписать задним числом, иначе он перестанет быть свидетельством.
2) Второй слой - wiki. Это живой конспект. Не свалка заметок, а аккуратные атомарные страницы: одна сущность или концепт на страницу, перекрестные ссылки между ними, мастер-каталог и хронологический лог. И этот конспект мой агент держит в актуальном виде сам.
Дневник отвечает на вопрос что было. Конспект - на вопрос что это значит. Первый дословный и неизменный, второй структурированный и постоянно актуализируется.
Как сырье превращается в память. Когда что-то прилетает, оно мгновенно ложится одним файлом в raw и помечается в реестре как не обработано, мне в Телеграм падает подтверждение. Голос по дороге проходит распознавание и становится дословным транскриптом. На этом шаге ничего не осмысляется, задача только поймать и зафиксировать.
Дальше, по расписанию включается переваривание. Агент читает все необработанное, вытаскивает оттуда сущности, концепты, утверждения и открытые вопросы, и вливает это в вики. Не плодит дубли, а обновляет существующие страницы. Когда я потом задаю вопрос, он идет не в сырье, а в конспект: читает каталог, открывает нужные страницы, синтезирует ответ со ссылками на источники.
Важная штука во всем этом - провенанс. Каждое утверждение в вики помечается: extracted - дословно из источника, inferred - это уже вывод самой модели, ambiguous - источники расходятся. То есть всегда видно, что факт, а что догадка ассистента. Память честно говорит о степени своей уверенности и не выдает свои выводы за мои.
Чем это все кормится:
1) Телеграм - голосовые (через Groq), текст, форварды статей и PDF.
2) TicNote от Mobvoi - ИИ-диктофон на звонки и разговоры: его облако расшифровывает, мой скрипт забирает транскрипт в raw.
3) Omi - опенсорсный рекордер (DevKit2), пишет звук непрерывно на microSD. Я переделал его на свой стек, без облака компании: вынимаю карту, вставляю в Мак, приложение читает только новые записи, Silero VAD режет тишину, Groq Whisper расшифровывает, транскрипт падает в raw. Оттуда агент ингестит в вики.
Что в итоге. Два носимых устройства, одно проприетарное, второе полностью мое, льются в одну трубу. Окружающий захват жизни - разговоры, идеи вслух, звонки - дистиллируется в перелинкованную память, по которой ассистент отвечает на мои СДВГ'шные вопросы.
Уже писал, что запоминаю информацию, как облако тегов - не могу держать в голове какие-то конкретные данные типа названия сервисов, районов и компаний, а вот прилагательных у меня сколько угодно.
Поэтому общение с моим агентом происходит в формате: «напомни о чем говорил спикер пару недель назад, который рассказывал про классный сервис для обработки объемных документов» и этого хватает, чтобы выдать мне готовый ответ или несколько зацепок, по которым я доберусь до нужной информации. Но как вы понимаете, чтобы получать ответы, LLM-вики нужно наполнять контекстом.
И для этого я использую несколько носимых устройств и парочку ботов (один сидит в телеграме, а другой на звонках в Zoom и Google Meet). Так как же все это работает?
Мой Hermes живет на VPS, я общаюсь с ним через Телеграм. Его единственная задача - вести мой второй мозг: личную базу знаний, которую пишет и поддерживает не человек, а сама модель. Паттерн придумал Андрей Карпатый и назвал это LLM-вики: вики, автором которой выступает LLM.
Внутри два слоя, один работает, как дневник, а второй, как конспект.
1) Первый слой - raw. Это дневник. Сюда дословно и навсегда падает все, что произошло: транскрипты голоса, заметки, пересланные статьи. Эти файлы никогда не редактируются. Дневник нельзя переписать задним числом, иначе он перестанет быть свидетельством.
2) Второй слой - wiki. Это живой конспект. Не свалка заметок, а аккуратные атомарные страницы: одна сущность или концепт на страницу, перекрестные ссылки между ними, мастер-каталог и хронологический лог. И этот конспект мой агент держит в актуальном виде сам.
Дневник отвечает на вопрос что было. Конспект - на вопрос что это значит. Первый дословный и неизменный, второй структурированный и постоянно актуализируется.
Как сырье превращается в память. Когда что-то прилетает, оно мгновенно ложится одним файлом в raw и помечается в реестре как не обработано, мне в Телеграм падает подтверждение. Голос по дороге проходит распознавание и становится дословным транскриптом. На этом шаге ничего не осмысляется, задача только поймать и зафиксировать.
Дальше, по расписанию включается переваривание. Агент читает все необработанное, вытаскивает оттуда сущности, концепты, утверждения и открытые вопросы, и вливает это в вики. Не плодит дубли, а обновляет существующие страницы. Когда я потом задаю вопрос, он идет не в сырье, а в конспект: читает каталог, открывает нужные страницы, синтезирует ответ со ссылками на источники.
Важная штука во всем этом - провенанс. Каждое утверждение в вики помечается: extracted - дословно из источника, inferred - это уже вывод самой модели, ambiguous - источники расходятся. То есть всегда видно, что факт, а что догадка ассистента. Память честно говорит о степени своей уверенности и не выдает свои выводы за мои.
Чем это все кормится:
1) Телеграм - голосовые (через Groq), текст, форварды статей и PDF.
2) TicNote от Mobvoi - ИИ-диктофон на звонки и разговоры: его облако расшифровывает, мой скрипт забирает транскрипт в raw.
3) Omi - опенсорсный рекордер (DevKit2), пишет звук непрерывно на microSD. Я переделал его на свой стек, без облака компании: вынимаю карту, вставляю в Мак, приложение читает только новые записи, Silero VAD режет тишину, Groq Whisper расшифровывает, транскрипт падает в raw. Оттуда агент ингестит в вики.
Что в итоге. Два носимых устройства, одно проприетарное, второе полностью мое, льются в одну трубу. Окружающий захват жизни - разговоры, идеи вслух, звонки - дистиллируется в перелинкованную память, по которой ассистент отвечает на мои СДВГ'шные вопросы.
4🔥92❤28👍21🤯11⚡4👏3🙏2🤣1