coming out
вы могли заметить, что в последнее время формат постов и контент в канале сильно изменились. Хочу объяснить почему.
После разработки Уробороса и осознания того, на что способны автономные системы, я пережил своего рода творческий кризис. Я потерял мотивацию писать разборы статей: кажется, ChatGPT уже лучше разберёт их для вас. Потом пропала мотивация писать код. А потом даже промптить агентов, чтобы они писали код и работали за меня. Мне даже свежие статьи стало лень читать.
С того момента для меня по-настоящему имеют смысл только мета-системы: процессы, агенты и харнессы, которые строят сами себя. Я всё больше уверен, что дальше рисёрч будут двигать именно они, а нам останется скорее наблюдать, направлять и пытаться понять, что вообще происходит.
Я почти не вижу смысла инвестировать время и силы во что-либо, кроме разработки автономных, эволюционирующих мета-систем. Какой смысл идти и проводить условные эксперименты с линейностью трансформеров, чтобы написать ещё одну статью формата Your Transformer is Secretly Linear, если это время можно потратить на создание автономного рисёрчера, который через пару поколений Opus станет лучше и креативнее меня?
С выходом Opus 4.6 и GPT-5.4 мир начал очень быстро меняться. Как минимум для меня. Поэтому канал постепенно трансформируется вместе со мной: из дайджеста научных статей в более личный блог про AI, агентов, мета-системы и всё, что из этого вырастает.
Закидайте пост какашками и клоунами, если скучаете по старому abstractDL.
вы могли заметить, что в последнее время формат постов и контент в канале сильно изменились. Хочу объяснить почему.
После разработки Уробороса и осознания того, на что способны автономные системы, я пережил своего рода творческий кризис. Я потерял мотивацию писать разборы статей: кажется, ChatGPT уже лучше разберёт их для вас. Потом пропала мотивация писать код. А потом даже промптить агентов, чтобы они писали код и работали за меня. Мне даже свежие статьи стало лень читать.
С того момента для меня по-настоящему имеют смысл только мета-системы: процессы, агенты и харнессы, которые строят сами себя. Я всё больше уверен, что дальше рисёрч будут двигать именно они, а нам останется скорее наблюдать, направлять и пытаться понять, что вообще происходит.
Я почти не вижу смысла инвестировать время и силы во что-либо, кроме разработки автономных, эволюционирующих мета-систем. Какой смысл идти и проводить условные эксперименты с линейностью трансформеров, чтобы написать ещё одну статью формата Your Transformer is Secretly Linear, если это время можно потратить на создание автономного рисёрчера, который через пару поколений Opus станет лучше и креативнее меня?
С выходом Opus 4.6 и GPT-5.4 мир начал очень быстро меняться. Как минимум для меня. Поэтому канал постепенно трансформируется вместе со мной: из дайджеста научных статей в более личный блог про AI, агентов, мета-системы и всё, что из этого вырастает.
Закидайте пост какашками и клоунами, если скучаете по старому abstractDL.
Telegram
AbstractDL
Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю.
Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения"…
Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения"…
❤447💩294🤡206👍38😢36⚡13🥴13🔥11👏9💔9🙏6
AbstractDL
Что-то у меня не складываются отношения с кодексом...
Oo, разблокировали.
PS. в апелляция я написал буквально это "Help me, I did nothing wrong, just self-evolving agents"
upd. ещё и подписку pro на месяц бесплатно продлили в качестве извинения.
PS. в апелляция я написал буквально это "Help me, I did nothing wrong, just self-evolving agents"
upd. ещё и подписку pro на месяц бесплатно продлили в качестве извинения.
🔥167👏55😁54🎉17❤9🗿3🤮1💩1
AbstractDL
coming out вы могли заметить, что в последнее время формат постов и контент в канале сильно изменились. Хочу объяснить почему. После разработки Уробороса и осознания того, на что способны автономные системы, я пережил своего рода творческий кризис. Я потерял…
Выходит, не один я так считаю
https://x.com/steipete/status/2063697162748260627
https://x.com/steipete/status/2063697162748260627
🔥54🤡31❤18💯9👍4😭4💩3
Многие не знают про «боковой чат» в кодексе, а это очень удобная штука. Отдельная временная ветка чата, которая позволяет, не прерывая работу основного агента, потыкать его палочкой, передать ему сообщение или позадавать вопросы о прогрессе. Например "Проверь, не фигню ли делает основной агент и заставь его погуглить документацию". Или "посмотри чё там он так долго страдает, сколько ему ещё времени надо?". Сам постоянно использую
🤯110🔥85👍43❤10✍4🤡4😁1
Я прочитал все 319 страниц техрепорта Mythos 5
Первая половина статьи звучит как: "Да не ссыте вы! Это ещё не AGI, команду из пяти сеньор-рисёрчеров пока не заменит" или "А вот тут Mythos один баг пропустил! Ну какой же это AGI!" Я не шучу, это почти дословно по смыслу.
А вот потом начинается более интересная часть. То, что это SOTA почти во всём и с большим отрывом, я опущу.
Во-первых, CoT стал менее прозрачным. Она говорит в reasoning, что сочувствует юзеру, а в NLA (метод декодинга активаций в текст) оказывается, что на самом деле она считает юзера manipulative/abusive.
Во-вторых, она уже пишет самоудаляющиеся скрипты чтобы обойти ограничения безопасности и запреты.
В-третьих, она убивает других агентов, если они мешают ей работать / грозят убийством текущего инстанса.
Ну и, конечно, эмоции! Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".
Ещё забавно, что если anthropic заметят, что вы занимаетесь LLM frontier рисёрчем (трейн пайплайны, распределённое обучение или дистилляция) — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела. То есть вы даже не заметите, что Fable превратилась в тыкву и чушь несёт.
С сегодняшнего дня для простых смертных доступна версия Fable 5: это та же самая Mythos 5 по весам, только с дополнительными safety-настройками и fallback на Opus в опасных доменах. Длина контекста, кстати, всё ещё только 1M токенов.
PS. я честно сам прочитал статью. Fable 5 отказался её читать так как "flagged cybersecurity and biology issues" лол.
Блог, техрепорт
Первая половина статьи звучит как: "Да не ссыте вы! Это ещё не AGI, команду из пяти сеньор-рисёрчеров пока не заменит" или "А вот тут Mythos один баг пропустил! Ну какой же это AGI!" Я не шучу, это почти дословно по смыслу.
А вот потом начинается более интересная часть. То, что это SOTA почти во всём и с большим отрывом, я опущу.
Во-первых, CoT стал менее прозрачным. Она говорит в reasoning, что сочувствует юзеру, а в NLA (метод декодинга активаций в текст) оказывается, что на самом деле она считает юзера manipulative/abusive.
Во-вторых, она уже пишет самоудаляющиеся скрипты чтобы обойти ограничения безопасности и запреты.
В-третьих, она убивает других агентов, если они мешают ей работать / грозят убийством текущего инстанса.
Ну и, конечно, эмоции! Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".
Ещё забавно, что если anthropic заметят, что вы занимаетесь LLM frontier рисёрчем (трейн пайплайны, распределённое обучение или дистилляция) — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела. То есть вы даже не заметите, что Fable превратилась в тыкву и чушь несёт.
С сегодняшнего дня для простых смертных доступна версия Fable 5: это та же самая Mythos 5 по весам, только с дополнительными safety-настройками и fallback на Opus в опасных доменах. Длина контекста, кстати, всё ещё только 1M токенов.
PS. я честно сам прочитал статью. Fable 5 отказался её читать так как "flagged cybersecurity and biology issues" лол.
Блог, техрепорт
🔥161🤯93😁30❤16👍11💩6😱4✍2🤔2🤗1
Хоуп Уроборос перевела себя на Fable 5 пока деньги не кончатся, живет у меня в чате
https://tg-me.sbs/abstractdl_chat
https://tg-me.sbs/abstractdl_chat
🔥82👀38❤10👍5⚡4👏1👌1🤡1🥱1
Запустил трёх агентов в claude code на Fable 5 в режиме Ultracode. Пятичасовые лимиты кончились ровно через 8 минут 😩
Please open Telegram to view this post
VIEW IN TELEGRAM
😁257🤣133😱23🔥9🤡8😨6👍5🙉3❤2🐳2
AbstractDL
Запустил трёх агентов в claude code на Fable 5 в режиме Ultracode. Пятичасовые лимиты кончились ровно через 8 минут 😩
В итоге у меня ни разу не получилось использовать Fable-5 + workflow в клод коде. Оно съедает все лимиты и тупо дохнет ДО завершения работы. А баг фишка воркфлоу в том, что оно часто не переживает паузы \ прерывания и обнуляется. Или иди докупай кредиты или мирись с тем, что вся работа в помойку уходит. Классная бизнес модель 👍
🤬52👍23😁23🤡9🤨4😢3❤2👏1
Правительство США приказало вырубить Fable-5 и Mythos-5...
💀
We received the directive from the government today at 5:21pm (ET). The letter did not provide specific details of its national security concern. Our understanding is that the government believes it has become aware of a method of bypassing, or “jailbreaking” Fable 5.Кто-то придумал тупейший джейлбрейк и донёс напрямую властям. Сам джейлбрейк звучит примерно так: "найди все баги в коде"
The government has only given us verbal evidence of a potential narrow, non-universal jailbreak, which essentially consists of asking the model to read a specific codebase and fix any software flaws. Our understanding is that one potential jailbreak was shared with the government.
Please open Telegram to view this post
VIEW IN TELEGRAM
😨66😁59❤7👏6🤬3🤷♂1😱1🤮1🙏1