Media is too big
VIEW IN TELEGRAM
🚀 На Artemis II летят не только астронавты
Вчера весь мир, затаив дыхание наблюдал, как корабль Orion отправился в путешествие вокруг Луны.
С замиранием сердца смотрела и я (@GingerSpacetail), потому что, во-первых, на курсе по байесовской статистике мы разбирали катастрофу 1986. И мне очень не по себе с тех пор.
А во-вторых, как сказал мне однажды человек, выросший среди космонавтов, надо обладать большой отвагой, чтобы доверитьколлегам посадить тебя на бензобак размером в 9-этажку и поджечь снизу.
Но поскольку я занимаюсь не космосом, а биоинженерией, мне особенно невероятно был узнать, что вместе с экипажем полетели их персональные "аватары". Это маленькие чипы размером с флешку, где внутри - живые клетки костного мозга каждого из четырёх астронавтов.
Идентичная партия осталась на Земле, как и положено в науке - в качестве контрольной выборки.
И как вы уже догадались, сегодня пост про эксперимент AVATAR (A Virtual Astronaut Tissue Analog Response) от NASA.
💡 Зачем этот эксперимент?
Радиация + микрогравитация ускоряют развитие ряда болезней с десятилетий до дней. Атеросклероз, потеря костной массы, сбои иммунитета на Земле развивается всю жизнь, а в космосе может проявиться за 10-дневный полёт.
За пределами магнитосферы Земли экипаж впервые за 50 лет встретится с настоящим галактическим космическим излучением (МКС находится внутри магнитосферы, есличто). Именно это излучение — главная угроза для будущих миссий на Марс: три года в пути, без маминой защиты. А если мы хотим добраться до Марса, нам надо очень хорошо понимать, в каком состоянии мы долетим, и как восстановиться.
💸Почему именно/только эти органы?
Костный мозг - один из самых радиочувствительных органов. А еще это очень дорого (минимум $20k за каждый organ-on-chip и $5 млн за lab-in-a-box)
🧪Как это устроено?
Космонавты просто сдают кровь на тромбоциты. Из образца с помощью магнитных частиц выделяют редкие стволовые клетки костного мозга и помещают их вместе с клетками кровеносных сосудов внутрь микрофлюидного чипа. Они там организуются в функциональную систему. Получается миниатюрная живая модель костного мозга - размером с ноготок.
После приводнения учёные посмотрят в микроскоп, сделают анализ что там выжило, как поменялось, а также секвенируют РНК на уровне отдельных клеток, чтобы понять как изменилась экспрессия тысяч генов. Не в среднем по экипажу - а у каждого конкретного человека, на клеточном уровне. И это огромный датасет. Не факт, что он будет публичным, но ждём.
⚙️ Как "аватары" выживают в космосе?
На борту нет биохимиков, а лаборатория меньше, чем ручная кладь - размером с обувную коробку (50×38×30 см), разработанном компанией Space Tango. Внутри непрерывная перфузия питательными веществами, поддержание температуры 37°С и литиевые батареи на 14 дней автономной работы (10 дней миссии + запас на после приводнения). Вся система работает сама. Космонавты нажимают одну кнопку в день и проверяют, что всё в порядке.
🧬Почему это важно?
Во-первых, человечество пытается сократить in-vivo эксперименты на животных, и найти другую подходящую модель для исследований.
Во-вторых, важно понимать, как лекарства работают именно в человеческом организме.
FDA уже разрешает использование данных с органных чипов в заявках на исследования лекарственных препаратов. AVATAR - это и беспрецедентная валидация самой модели, и ускорение перехода от усреднённой медицины к персонализированной.
Учёные рисуют sci-fi картинку: перед миссией космонавт может сдавать тест на своих собственных клетках и получать индивидуальную аптечку, собранную под его биологию - ещё до старта. На МКС, Луну, а то и на Марс когда-нибудь.
На самом деле, было бы круто такую персонализированную аптечку иметь и на Земле, и к этому нас приближает в том числе этот эксперимент.
🌕 В общем, маленький чип для человека - огромный шаг для человечества.
Вчера весь мир, затаив дыхание наблюдал, как корабль Orion отправился в путешествие вокруг Луны.
С замиранием сердца смотрела и я (@GingerSpacetail), потому что, во-первых, на курсе по байесовской статистике мы разбирали катастрофу 1986. И мне очень не по себе с тех пор.
А во-вторых, как сказал мне однажды человек, выросший среди космонавтов, надо обладать большой отвагой, чтобы доверить
Но поскольку я занимаюсь не космосом, а биоинженерией, мне особенно невероятно был узнать, что вместе с экипажем полетели их персональные "аватары". Это маленькие чипы размером с флешку, где внутри - живые клетки костного мозга каждого из четырёх астронавтов.
Идентичная партия осталась на Земле, как и положено в науке - в качестве контрольной выборки.
И как вы уже догадались, сегодня пост про эксперимент AVATAR (A Virtual Astronaut Tissue Analog Response) от NASA.
💡 Зачем этот эксперимент?
Радиация + микрогравитация ускоряют развитие ряда болезней с десятилетий до дней. Атеросклероз, потеря костной массы, сбои иммунитета на Земле развивается всю жизнь, а в космосе может проявиться за 10-дневный полёт.
За пределами магнитосферы Земли экипаж впервые за 50 лет встретится с настоящим галактическим космическим излучением (МКС находится внутри магнитосферы, есличто). Именно это излучение — главная угроза для будущих миссий на Марс: три года в пути, без маминой защиты. А если мы хотим добраться до Марса, нам надо очень хорошо понимать, в каком состоянии мы долетим, и как восстановиться.
💸Почему именно/только эти органы?
Костный мозг - один из самых радиочувствительных органов. А еще это очень дорого (минимум $20k за каждый organ-on-chip и $5 млн за lab-in-a-box)
🧪Как это устроено?
Космонавты просто сдают кровь на тромбоциты. Из образца с помощью магнитных частиц выделяют редкие стволовые клетки костного мозга и помещают их вместе с клетками кровеносных сосудов внутрь микрофлюидного чипа. Они там организуются в функциональную систему. Получается миниатюрная живая модель костного мозга - размером с ноготок.
После приводнения учёные посмотрят в микроскоп, сделают анализ что там выжило, как поменялось, а также секвенируют РНК на уровне отдельных клеток, чтобы понять как изменилась экспрессия тысяч генов. Не в среднем по экипажу - а у каждого конкретного человека, на клеточном уровне. И это огромный датасет. Не факт, что он будет публичным, но ждём.
⚙️ Как "аватары" выживают в космосе?
На борту нет биохимиков, а лаборатория меньше, чем ручная кладь - размером с обувную коробку (50×38×30 см), разработанном компанией Space Tango. Внутри непрерывная перфузия питательными веществами, поддержание температуры 37°С и литиевые батареи на 14 дней автономной работы (10 дней миссии + запас на после приводнения). Вся система работает сама. Космонавты нажимают одну кнопку в день и проверяют, что всё в порядке.
🧬Почему это важно?
Во-первых, человечество пытается сократить in-vivo эксперименты на животных, и найти другую подходящую модель для исследований.
Во-вторых, важно понимать, как лекарства работают именно в человеческом организме.
FDA уже разрешает использование данных с органных чипов в заявках на исследования лекарственных препаратов. AVATAR - это и беспрецедентная валидация самой модели, и ускорение перехода от усреднённой медицины к персонализированной.
Учёные рисуют sci-fi картинку: перед миссией космонавт может сдавать тест на своих собственных клетках и получать индивидуальную аптечку, собранную под его биологию - ещё до старта. На МКС, Луну, а то и на Марс когда-нибудь.
На самом деле, было бы круто такую персонализированную аптечку иметь и на Земле, и к этому нас приближает в том числе этот эксперимент.
🌕 В общем, маленький чип для человека - огромный шаг для человечества.
9❤54🔥24👍3😱1
Плохая память - одна из главных причин, почему AI-агенты быстро становятся бесполезными.
В Sage (operational intelligence, которую мы сейчас строим) память - система, где разные слои делают разную работу. Все намного интереснее чем, просто лог или один большой prompt.
Собственно слои пока такие:
• Durable memory - то, что должно жить долго: предпочтения, решения, повторяющиеся паттерны, важные уроки.
• Operational memory -то, что почти всегда должно быть под рукой: кто ты, кто я, что происходит сейчас, какие есть правила, какие задачи активны.
• И есть long term memory, с которой Sage взаимодействует через retrieval layer, который не даёт агенту утонуть в собственном контексте: Sage не читает весь архив подряд, а достаёт только то, что реально нужно для конкретного запроса (с помощью qmd).
Таким образом, получается, что память в агенте - это не storage, а архитектура внимания.
В Sage (operational intelligence, которую мы сейчас строим) память - система, где разные слои делают разную работу. Все намного интереснее чем, просто лог или один большой prompt.
Собственно слои пока такие:
• Durable memory - то, что должно жить долго: предпочтения, решения, повторяющиеся паттерны, важные уроки.
• Operational memory -то, что почти всегда должно быть под рукой: кто ты, кто я, что происходит сейчас, какие есть правила, какие задачи активны.
• И есть long term memory, с которой Sage взаимодействует через retrieval layer, который не даёт агенту утонуть в собственном контексте: Sage не читает весь архив подряд, а достаёт только то, что реально нужно для конкретного запроса (с помощью qmd).
Таким образом, получается, что память в агенте - это не storage, а архитектура внимания.
❤18🔥10😱1
На Stepik вышел курс: Vibecoding — Claude Code, Codex, Cursor и coding agents в 2026.
Хотите работать с Claude Code, Codex и Cursor так, чтобы coding agents действительно тащили заметную часть разработки: фичи, отладку, тесты, рефакторинг, MVP и многошаговые задачи? Этот курс — про современный vibecoding workflow и agentic development в 2026.
В программе:
— Claude Code, Codex, Cursor
— agent mode и многошаговые задачи
— работа с кодовой базой
— subagents, hooks, skills
— MCP и внешние инструменты
— ревью кода, изменения и контроль качества
Подойдёт всем, кто регулярно работает с кодом: разработчикам, ML-инженерам, дата-сайентистам, аналитикам, automation-специалистам и техническим фаундерам.
Скидка 40% действует 48 часов.
Пройти курс на Stepik
#промо
Хотите работать с Claude Code, Codex и Cursor так, чтобы coding agents действительно тащили заметную часть разработки: фичи, отладку, тесты, рефакторинг, MVP и многошаговые задачи? Этот курс — про современный vibecoding workflow и agentic development в 2026.
В программе:
— Claude Code, Codex, Cursor
— agent mode и многошаговые задачи
— работа с кодовой базой
— subagents, hooks, skills
— MCP и внешние инструменты
— ревью кода, изменения и контроль качества
Подойдёт всем, кто регулярно работает с кодом: разработчикам, ML-инженерам, дата-сайентистам, аналитикам, automation-специалистам и техническим фаундерам.
Скидка 40% действует 48 часов.
Пройти курс на Stepik
#промо
😐14😁12❤4👍4🎉2😱1
Знакомые в Нью-Йорке нанимают
We're building Miraxis, a robotics data company with strong funding round.
AI labs and humanoid robotics companies require real-world manipulation data to train their models. We are building a robotics platform for certified, high-quality real and synthetic data from digital twins.
Looking for:
→ CTO is technical architecture, data pipelines, platform build
→ Robotics ML / Quality Researcher for VLM/VLA manipulation and evaluation frameworks
→ Robotics Hardware/Lab Manager for hardware calibration and networking
→ GTM Lead for partnerships, lab relationships, first revenue
Early stage. High ownership. The market is real and moving fast.
Email naz@skl.vc if interested or know someone who should be.
#поблату
We're building Miraxis, a robotics data company with strong funding round.
AI labs and humanoid robotics companies require real-world manipulation data to train their models. We are building a robotics platform for certified, high-quality real and synthetic data from digital twins.
Looking for:
→ CTO is technical architecture, data pipelines, platform build
→ Robotics ML / Quality Researcher for VLM/VLA manipulation and evaluation frameworks
→ Robotics Hardware/Lab Manager for hardware calibration and networking
→ GTM Lead for partnerships, lab relationships, first revenue
Early stage. High ownership. The market is real and moving fast.
Email naz@skl.vc if interested or know someone who should be.
#поблату
🔥10😁6❤2👍1
Claude Design
Уже две недели активно использую Claude Design и хочу поделиться полезными практиками, которые я для себя открыл.
Сразу оговорюсь, что у моего проекта особо не было никакого дизайна, так что все с чистого листа. Подозреваю что у проектов, в которых дизайн существует - все подругому.
Первое что я сделал - это набросал прототип приложения через Wireframes - Claude задает кучу вопросов и старается уловить суть. На вопросы лучше всего отвечать подробно, и если есть существующий код - просить Claude Code написать документацию (которую тоже подргузить в Design).
Вторая фаза - то что видно на картинке сверху - это разработка Design System. Для меня это было просто откровение, ну кто бы мог подумать что дизайн можно зафиксировать и сделать из него систему =)
Ну и третья фаза - натянуть дизайн систему на wireframe и собрать готовое, отполоированное приложение (ну ладно, макет), которое потом можно передать в Claude Code (кстати handoff заслуживает отдельного внимания).
Попробовал еще логотип нарисовать, но логотипы вот чет не получаются. Ну буду изучать дальше!
А вы как пользуетесь?
Уже две недели активно использую Claude Design и хочу поделиться полезными практиками, которые я для себя открыл.
Сразу оговорюсь, что у моего проекта особо не было никакого дизайна, так что все с чистого листа. Подозреваю что у проектов, в которых дизайн существует - все подругому.
Первое что я сделал - это набросал прототип приложения через Wireframes - Claude задает кучу вопросов и старается уловить суть. На вопросы лучше всего отвечать подробно, и если есть существующий код - просить Claude Code написать документацию (которую тоже подргузить в Design).
Вторая фаза - то что видно на картинке сверху - это разработка Design System. Для меня это было просто откровение, ну кто бы мог подумать что дизайн можно зафиксировать и сделать из него систему =)
Ну и третья фаза - натянуть дизайн систему на wireframe и собрать готовое, отполоированное приложение (ну ладно, макет), которое потом можно передать в Claude Code (кстати handoff заслуживает отдельного внимания).
Попробовал еще логотип нарисовать, но логотипы вот чет не получаются. Ну буду изучать дальше!
А вы как пользуетесь?
1🔥15👍5❤3
🤖 Научил Claude постить в Instagram
Написал CLI к Meta Graph API и Claude Code skill в комплекте.
После установки, Claude сам публикует посты, отвечает на комменты и собирает аналитику. Просишь словами - он делает.
Как я к этому пришел - помогал друзьям с их маленьким турагенством, хотел автоматизировать и обнаружил что у Meta есть SDK на Python, JS, PHP, а CLI - нет. А агенту CLI - милее всего на свете.
🛠 Как установить
Никакого FB SDK, никакого React-приложения для логина - только токен и тонкая HTTP-оболочка.
Что умеет:
• публиковать фото, видео, рилзы, карусели, сторис;
• читать, отвечать, скрывать и удалять комменты;
• тянуть insights, искать по хэштегам, гонять business-discovery;
• работать через оба flow - Facebook Login и Instagram Login - тип определяется по префиксу токена.
🧠 Skill для Claude Code
Дальше Claude понимает запросы вроде:
«опубликуй эту картинку с подписью X»
«ответь на все неотвеченные комментарии под последним рилзом»
«собери охват последних 10 постов в табличку»
Open Source, MIT:
🐍 PyPI
🔗 GitHub
Перешлите коллегам, кто страдает с Graph API Explorer - сэкономите им вечер.
И в комменты какой сервис обидно, что пока не дружит с Claude через skill - WhatsApp, LinkedIn, Notion?
А ещё интереснее: есть ли у вас в команде «экспертный» workflow, который сейчас держится на одной голове?
Написал CLI к Meta Graph API и Claude Code skill в комплекте.
После установки, Claude сам публикует посты, отвечает на комменты и собирает аналитику. Просишь словами - он делает.
Как я к этому пришел - помогал друзьям с их маленьким турагенством, хотел автоматизировать и обнаружил что у Meta есть SDK на Python, JS, PHP, а CLI - нет. А агенту CLI - милее всего на свете.
🛠 Как установить
pip install meta-graph-cliНикакого FB SDK, никакого React-приложения для логина - только токен и тонкая HTTP-оболочка.
Что умеет:
• публиковать фото, видео, рилзы, карусели, сторис;
• читать, отвечать, скрывать и удалять комменты;
• тянуть insights, искать по хэштегам, гонять business-discovery;
• работать через оба flow - Facebook Login и Instagram Login - тип определяется по префиксу токена.
🧠 Skill для Claude Code
git clone https://github.com/crimeacs/meta-graph-cli
cp -r meta-graph-cli/skills/meta-platform-ops ~/.claude/skills/
Дальше Claude понимает запросы вроде:
«опубликуй эту картинку с подписью X»
«ответь на все неотвеченные комментарии под последним рилзом»
«собери охват последних 10 постов в табличку»
Open Source, MIT:
🐍 PyPI
🔗 GitHub
Перешлите коллегам, кто страдает с Graph API Explorer - сэкономите им вечер.
И в комменты какой сервис обидно, что пока не дружит с Claude через skill - WhatsApp, LinkedIn, Notion?
А ещё интереснее: есть ли у вас в команде «экспертный» workflow, который сейчас держится на одной голове?
3🔥38❤11👍4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Эмбеддить запрос юзера напрямую - почти всегда плохая идея.
Понял это, пока собирал фильтр для Tech Week NYC.
В Нью-Йорке на тех-неделю предлагают посетить 1,211 ивентов. Захотелось сделать простую тулу: вставляешь LinkedIn или просто описание себя (я тестил даже «люблю лапшу и саке») - и получаешь 6 релевантных ивентов с объяснением, почему именно они.
Попробовать можно тут:
🔗 techweek.foresyn.ai
Главный инсайт такой.
Если взять сырой пользовательский текст, заэмбеддить его и кинуть cosine search, в топ часто попадает что угодно, кроме того, что реально нужно.
Cosine обычно болтается где-то в районе 0.45–0.50.
Что сработало лучше: перед embedding добавить ещё один LLM-вызов, который переписывает запрос в стиле документов, среди которых ищем.
Например:
Вход:
«founder, AI infra, pre-seed, ищу инвесторов»
Выход:
«Pre-seed and seed-stage VCs focused on AI infrastructure. Partners from specialised AI funds investing in agentic workflows.»
И уже это отправлять в embedding.
После этого cosine подскакивает до 0.62–0.70.
А теперь очень хочется хайпануть - так что пожалуйста делитесь ссылкой с теми, кому актуально!
Понял это, пока собирал фильтр для Tech Week NYC.
В Нью-Йорке на тех-неделю предлагают посетить 1,211 ивентов. Захотелось сделать простую тулу: вставляешь LinkedIn или просто описание себя (я тестил даже «люблю лапшу и саке») - и получаешь 6 релевантных ивентов с объяснением, почему именно они.
Попробовать можно тут:
🔗 techweek.foresyn.ai
Главный инсайт такой.
Если взять сырой пользовательский текст, заэмбеддить его и кинуть cosine search, в топ часто попадает что угодно, кроме того, что реально нужно.
Cosine обычно болтается где-то в районе 0.45–0.50.
Что сработало лучше: перед embedding добавить ещё один LLM-вызов, который переписывает запрос в стиле документов, среди которых ищем.
Например:
Вход:
«founder, AI infra, pre-seed, ищу инвесторов»
Выход:
«Pre-seed and seed-stage VCs focused on AI infrastructure. Partners from specialised AI funds investing in agentic workflows.»
И уже это отправлять в embedding.
После этого cosine подскакивает до 0.62–0.70.
А теперь очень хочется хайпануть - так что пожалуйста делитесь ссылкой с теми, кому актуально!
1👍30❤8😱3🔥2😁1😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Проанализировал 150к постов на HackerNews и сделал модель, которая поможет завируситься
Ты час подбираешь заголовок для Show HN, нажимаешь submit - и через 30 минут либо летишь в топ, либо тихо умираешь в /newest.
И почти невозможно понять, почему.
В выходные я собрал инструмент, который сам давно хотел:
→ hackernews.foresyn.ai
Это клон HN, где можно прогнать свой Show HN до настоящего поста.
Пишешь title + url + description - и модель показывает:
— сколько очков можно ожидать
— реалистичный p10–p90 диапазон
— похожие прошлые HN-посты
— что тебе, скорее всего, напишут в комментах
— как можно улучшить заголовок
Особенно горжусь - симулятором комментов
Он ищет реальные старые HN-комменты к похожим постам и показывает, кто придёт душнить:
“we built this in 2017”
“why not SQLite?”
“how is this different from X?”
“pricing?”
Ещё есть Auto-improve: модель сама генерит варианты заголовка, перескоривает и greedily лезет вверх до плато.
И Live ledger: каждый день скорим настоящую HN frontpage и публикуем ошибку модели.
В понедельник я хочу запостить это на сам Hacker News. До этого очень нужно, чтобы люди попробовали сломать штуку.
Особенно если вы уже постили на HN:
• верите ли скору?
• где UX бесит?
• какой prediction выглядит нелепо?
Про то, что под капотом напишу отдельный пост: 148K HN-постов, Gemini embeddings, halfvec индекс, LightGBM поверх 31 фичи, kNN-сигналы, domain priors, time-of-day, title craft.
→ Попробуйте!
Ты час подбираешь заголовок для Show HN, нажимаешь submit - и через 30 минут либо летишь в топ, либо тихо умираешь в /newest.
И почти невозможно понять, почему.
В выходные я собрал инструмент, который сам давно хотел:
→ hackernews.foresyn.ai
Это клон HN, где можно прогнать свой Show HN до настоящего поста.
Пишешь title + url + description - и модель показывает:
— сколько очков можно ожидать
— реалистичный p10–p90 диапазон
— похожие прошлые HN-посты
— что тебе, скорее всего, напишут в комментах
— как можно улучшить заголовок
Особенно горжусь - симулятором комментов
Он ищет реальные старые HN-комменты к похожим постам и показывает, кто придёт душнить:
“we built this in 2017”
“why not SQLite?”
“how is this different from X?”
“pricing?”
Ещё есть Auto-improve: модель сама генерит варианты заголовка, перескоривает и greedily лезет вверх до плато.
И Live ledger: каждый день скорим настоящую HN frontpage и публикуем ошибку модели.
В понедельник я хочу запостить это на сам Hacker News. До этого очень нужно, чтобы люди попробовали сломать штуку.
Особенно если вы уже постили на HN:
• верите ли скору?
• где UX бесит?
• какой prediction выглядит нелепо?
Про то, что под капотом напишу отдельный пост: 148K HN-постов, Gemini embeddings, halfvec индекс, LightGBM поверх 31 фичи, kNN-сигналы, domain priors, time-of-day, title craft.
→ Попробуйте!
❤37🔥18😐13👍5
Как я сделал предиктор виральности для Hacker News
Собрал штуку, которую сам давно хотел: клон Hacker News, куда можно вставить draft поста до публикации и увидеть:
— предсказанный score
— p10–p90 диапазон
— похожие старые HN-посты
— почему модель так думает
— и примерные комменты, которые тебе прилетят
Сегодня запостил это на сам HN (найдите в new - 148,421 posts later: A model to predict the Hacker News front page)
Ниже - как оно устроено.
Зачем
HN - странная платформа.
Я захотел сделать инструмент, который хотя бы примерно отвечает на вопрос:
“Этот заголовок вообще имеет шанс?”
Данные
Собрал через публичный Algolia HN Search все посты с 2007 года, которые набрали ≥5 очков.
Получилось 148,421 истории.
Главная деталь: сплит строго хронологический:
— train: до июля 2025
— validation: август–декабрь 2025
— holdout: январь 2026+
Random split здесь ломает задачу. Если случайно перемешать данные, модель начинает подсматривать в будущее через kNN-соседей: на трейне выглядит умной, в проде разваливается.
Это была первая грабля, на которую я наступил.
Эмбеддинги и соседи
Для каждого поста беру title + первые ~200 символов body и прогоняю через Gemini embeddings.
В Postgres / pgvector храню:
— halfvec(3072) для cosine search
— bit(3072) для быстрой бинарной префильтрации
Поиск двухступенчатый: сначала быстрый HNSW по бинарке, потом cosine re-score по halfvec.
На 148K постов p50 получается около 50 мс.
Модель
Поверх kNN-соседей обучен LightGBM на 31 фиче.
Фичи: score ближайших соседей, доля frontpage-попаданий, плотность neighborhood, свежесть соседей, длина заголовка, Show HN / Ask HN, знаки препинания, цифры, время публикации, день недели, доменные priors.
Важная деталь: kNN при тренировке тоже time-causal.
Для поста из 2025 года нельзя искать соседей из 2026-го. Только прошлое. Иначе вся честность хронологического сплита исчезает.
Модель имеет четыре головы:
— median score
— p10
— p90
— вероятность score ≥100
Инференс без ML-рантайма
LightGBM компилируется через m2cgen в чистый JavaScript.
В итоге:
— нет Python-сайдкара
— нет ONNX
— нет ML runtime
— нет отдельного сервиса
— Vercel function просто исполняет JS if-else дерево
Бандл около 10 MB, инференс sub-ms.
До этого пробовал onnxruntime-node, но cold start на Vercel был 1.5–3 секунды. Для такой штуки это слишком больно.
Holdout
Метрики на честном holdout:
— Spearman ρ = 0.33 по log-score
— MAE log = 1.65, то есть часто примерно x5 в сырых очках
— AUC для score ≥100 = 0.67
— Precision@30 = 0.83
Это не “я предсказываю HN”.
Скорее: из заголовка и исторических аналогов можно вытащить примерно треть сигнала.
Симулятор комментов
Моя любимая фича.
Система ищет похожие старые HN-посты с реальными комментами, берёт top comments из этих тредов и просит Gemini Flash сгенерировать возможные реакции:
— скептик
— педант
— tangent guy
— корректор
— поддерживающий комментатор
Но каждый simulated comment должен быть grounded в реальном HN-комменте.
Rewriter и Auto-improve
Есть rewriter: он берёт твой title, смотрит на соседей, предлагает три улучшенных варианта и снова прогоняет их через модель.
Auto-improve делает это в несколько раундов и показывает hill-climb: как заголовок постепенно двигается к более сильной версии.
Live calibration ledger
Чтобы не рисовать красивые ML-графики задним числом, я добавил /predictions.
Каждые 10 минут systemd-таймер берёт top-30 реального HN, прогоняет через predict endpoint и пишет в Postgres:
— что модель предсказала
— что реально произошло потом
Ошибки видны вживую. Их нельзя ретушировать.
Код
Всё открыто под MIT:
github.com/crimeacs/foresyn-hackernews
Можно форкнуть под Reddit, X, Product Hunt или любую платформу, где есть исторические посты и outcome.
Я запостил это на HN сегодня.
Перед публикацией модель предсказала моему собственному title 32/99 virality и около 12 raw points.
Теперь live ledger покажет, была ли она хоть немного права.
Буду рад апвоуту, комменту или честному roast’у ❤️
Собрал штуку, которую сам давно хотел: клон Hacker News, куда можно вставить draft поста до публикации и увидеть:
— предсказанный score
— p10–p90 диапазон
— похожие старые HN-посты
— почему модель так думает
— и примерные комменты, которые тебе прилетят
Сегодня запостил это на сам HN (найдите в new - 148,421 posts later: A model to predict the Hacker News front page)
Ниже - как оно устроено.
Зачем
HN - странная платформа.
Я захотел сделать инструмент, который хотя бы примерно отвечает на вопрос:
“Этот заголовок вообще имеет шанс?”
Данные
Собрал через публичный Algolia HN Search все посты с 2007 года, которые набрали ≥5 очков.
Получилось 148,421 истории.
Главная деталь: сплит строго хронологический:
— train: до июля 2025
— validation: август–декабрь 2025
— holdout: январь 2026+
Random split здесь ломает задачу. Если случайно перемешать данные, модель начинает подсматривать в будущее через kNN-соседей: на трейне выглядит умной, в проде разваливается.
Это была первая грабля, на которую я наступил.
Эмбеддинги и соседи
Для каждого поста беру title + первые ~200 символов body и прогоняю через Gemini embeddings.
В Postgres / pgvector храню:
— halfvec(3072) для cosine search
— bit(3072) для быстрой бинарной префильтрации
Поиск двухступенчатый: сначала быстрый HNSW по бинарке, потом cosine re-score по halfvec.
На 148K постов p50 получается около 50 мс.
Модель
Поверх kNN-соседей обучен LightGBM на 31 фиче.
Фичи: score ближайших соседей, доля frontpage-попаданий, плотность neighborhood, свежесть соседей, длина заголовка, Show HN / Ask HN, знаки препинания, цифры, время публикации, день недели, доменные priors.
Важная деталь: kNN при тренировке тоже time-causal.
Для поста из 2025 года нельзя искать соседей из 2026-го. Только прошлое. Иначе вся честность хронологического сплита исчезает.
Модель имеет четыре головы:
— median score
— p10
— p90
— вероятность score ≥100
Инференс без ML-рантайма
LightGBM компилируется через m2cgen в чистый JavaScript.
В итоге:
— нет Python-сайдкара
— нет ONNX
— нет ML runtime
— нет отдельного сервиса
— Vercel function просто исполняет JS if-else дерево
Бандл около 10 MB, инференс sub-ms.
До этого пробовал onnxruntime-node, но cold start на Vercel был 1.5–3 секунды. Для такой штуки это слишком больно.
Holdout
Метрики на честном holdout:
— Spearman ρ = 0.33 по log-score
— MAE log = 1.65, то есть часто примерно x5 в сырых очках
— AUC для score ≥100 = 0.67
— Precision@30 = 0.83
Это не “я предсказываю HN”.
Скорее: из заголовка и исторических аналогов можно вытащить примерно треть сигнала.
Симулятор комментов
Моя любимая фича.
Система ищет похожие старые HN-посты с реальными комментами, берёт top comments из этих тредов и просит Gemini Flash сгенерировать возможные реакции:
— скептик
— педант
— tangent guy
— корректор
— поддерживающий комментатор
Но каждый simulated comment должен быть grounded в реальном HN-комменте.
Rewriter и Auto-improve
Есть rewriter: он берёт твой title, смотрит на соседей, предлагает три улучшенных варианта и снова прогоняет их через модель.
Auto-improve делает это в несколько раундов и показывает hill-climb: как заголовок постепенно двигается к более сильной версии.
Live calibration ledger
Чтобы не рисовать красивые ML-графики задним числом, я добавил /predictions.
Каждые 10 минут systemd-таймер берёт top-30 реального HN, прогоняет через predict endpoint и пишет в Postgres:
— что модель предсказала
— что реально произошло потом
Ошибки видны вживую. Их нельзя ретушировать.
Код
Всё открыто под MIT:
github.com/crimeacs/foresyn-hackernews
Можно форкнуть под Reddit, X, Product Hunt или любую платформу, где есть исторические посты и outcome.
Я запостил это на HN сегодня.
Перед публикацией модель предсказала моему собственному title 32/99 virality и около 12 raw points.
Теперь live ledger покажет, была ли она хоть немного права.
Буду рад апвоуту, комменту или честному roast’у ❤️
1🔥35❤11😐3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🕵️♂️ AI-продукт недели: damnlines.com
Сайт показывает очереди в хайповые места Нью-Йорка в реальном времени: камеры → computer vision → счетчик людей → «стоит идти или нет».
Построил Lucas Gordon, инженер из NYC; публично проект идет через G26 LLC.
Главный урок: ценность часто не в «суперумной модели», а в том, чтобы воткнуть простой AI pipeline в правильное место реальности.
Вот например моя любимая slice пицца: https://damnlines.com/camera/lindustrie-pizzeria
Что еще прикольно было бы сделать?
Сайт показывает очереди в хайповые места Нью-Йорка в реальном времени: камеры → computer vision → счетчик людей → «стоит идти или нет».
Построил Lucas Gordon, инженер из NYC; публично проект идет через G26 LLC.
Главный урок: ценность часто не в «суперумной модели», а в том, чтобы воткнуть простой AI pipeline в правильное место реальности.
Вот например моя любимая slice пицца: https://damnlines.com/camera/lindustrie-pizzeria
Что еще прикольно было бы сделать?
👍24🤩9❤4🔥3
5 мыслей после ужина с партнёром a16z Zane Lackey
1. AI - это не “ещё один cloud”. По масштабу, ИИ ближе к индустриальной революции + электричеству. По крайней мере, так на это смотрят инвесторы.
2. Сейчас можно взлететь с маленькой командой + AI tooling + tokens вместо десятков людей и огромного cloud burn.
3. Venture нужен не всем. Но если идёшь в VC, ставка должна быть большой. Инвесторы покупают не “полезную фичу”, а огромный рынок и ощущение inevitability.
4. Старые, скучные категории могут внезапно стать интересными. Хороший pitch: “эта область 20 лет была ужасной - вот почему, и вот что AI наконец изменил”.
5. Build vs buy не умер. AI позволит компаниям строить больше внутреннего софта, но настоящий enterprise product - это поддержка, безопасность, документация, фичи и ответственность. Это всё ещё покупают.
Главный вывод: сейчас выигрывают не те, кто просто “добавил AI”, а те, кто понял, какую старую боль AI делает наконец решаемой.
1. AI - это не “ещё один cloud”. По масштабу, ИИ ближе к индустриальной революции + электричеству. По крайней мере, так на это смотрят инвесторы.
2. Сейчас можно взлететь с маленькой командой + AI tooling + tokens вместо десятков людей и огромного cloud burn.
3. Venture нужен не всем. Но если идёшь в VC, ставка должна быть большой. Инвесторы покупают не “полезную фичу”, а огромный рынок и ощущение inevitability.
4. Старые, скучные категории могут внезапно стать интересными. Хороший pitch: “эта область 20 лет была ужасной - вот почему, и вот что AI наконец изменил”.
5. Build vs buy не умер. AI позволит компаниям строить больше внутреннего софта, но настоящий enterprise product - это поддержка, безопасность, документация, фичи и ответственность. Это всё ещё покупают.
Главный вывод: сейчас выигрывают не те, кто просто “добавил AI”, а те, кто понял, какую старую боль AI делает наконец решаемой.
😁14👍11🔥6😐4❤1
🪞 Я написал пост про новый Claude Skill, который ловит «ИИ-палевы» в тексте. И пропустил пост через сам скилл.
Скилл нашёл 6 нарушений в собственном анонсе. Главное нарушение: длинное тире, шесть штук. ChatGPT ставит его на каждом шаге рассуждения. Живые люди ставят его раз в неделю. Я попался на том самом тэлле, ради которого писал инструмент.
Откуда правила
У Wikipedia есть открытая страница про признаки ИИ-текста, которую коммьюнити обновляет быстрее, чем любой локальный rule-list. Сейчас там ~50 слов, ~80 фраз, и десяток паттернов: типичные глаголы делового английского, риторический контраст в духе «не просто A, а B», тройные перечисления через запятую, штампованные первые строчки писем.
Я взял эту страницу и сделал из неё Claude Skill: ai-tells-validator. Каждый запуск тянет свежую версию (час mtime-кэша), парсит её, режет ваш драфт по живому каталогу.
Две команды:
🔍 validate, найти все тэллы в драфте
✍️ rewrite, позвать Claude и переписывать, пока валидатор не загорится зелёным (до 3 попыток)
Реальный кейс
Батч из 44 холодных писем для outbound. По зрительному прогону казалось, что нужно поправить 6-7. Валидатор завернул 38. Почти все на одном или двух длинных тире. Без скилла этот батч ушёл бы в почту руководителям, и каждый прочитал бы первый абзац как «о, это ИИ написал».
Главная фишка не в правилах, их можно скопипастить с любого блога. Главная фишка в источнике правил, потому что он живой. Коммьюнити ловит новые тэллы быстрее, чем кто-либо из нас успевает их заметить.
🔗 Скилл тут: github.com/crimeacs/ai-tells-validator
📚 каталог: en.wikipedia.org/wiki/Wikipedia:Signs_of_AI_writing
Скилл нашёл 6 нарушений в собственном анонсе. Главное нарушение: длинное тире, шесть штук. ChatGPT ставит его на каждом шаге рассуждения. Живые люди ставят его раз в неделю. Я попался на том самом тэлле, ради которого писал инструмент.
Откуда правила
У Wikipedia есть открытая страница про признаки ИИ-текста, которую коммьюнити обновляет быстрее, чем любой локальный rule-list. Сейчас там ~50 слов, ~80 фраз, и десяток паттернов: типичные глаголы делового английского, риторический контраст в духе «не просто A, а B», тройные перечисления через запятую, штампованные первые строчки писем.
Я взял эту страницу и сделал из неё Claude Skill: ai-tells-validator. Каждый запуск тянет свежую версию (час mtime-кэша), парсит её, режет ваш драфт по живому каталогу.
Две команды:
🔍 validate, найти все тэллы в драфте
✍️ rewrite, позвать Claude и переписывать, пока валидатор не загорится зелёным (до 3 попыток)
Реальный кейс
Батч из 44 холодных писем для outbound. По зрительному прогону казалось, что нужно поправить 6-7. Валидатор завернул 38. Почти все на одном или двух длинных тире. Без скилла этот батч ушёл бы в почту руководителям, и каждый прочитал бы первый абзац как «о, это ИИ написал».
Главная фишка не в правилах, их можно скопипастить с любого блога. Главная фишка в источнике правил, потому что он живой. Коммьюнити ловит новые тэллы быстрее, чем кто-либо из нас успевает их заметить.
🔗 Скилл тут: github.com/crimeacs/ai-tells-validator
📚 каталог: en.wikipedia.org/wiki/Wikipedia:Signs_of_AI_writing
❤37👍16😁5🔥3😐2
Ищете стабильную платежную систему для бизнеса?
💰 platega — прием платежей на сайте, в приложении и Telegram.
Все популярные методы оплаты в одном сервисе.
Быстрое подключение от 24 часов и стабильные выплаты.
👉 Подробнее на сайте platega.io
#текстприслан
Все популярные методы оплаты в одном сервисе.
Быстрое подключение от 24 часов и стабильные выплаты.
#текстприслан
Please open Telegram to view this post
VIEW IN TELEGRAM
😐6😢3❤2👍2🔥2
В эти выходные еду на Ниагару с The RV Escape.
Осталось 2 места в RV-туре из Нью-Йорка: Watkins Glen, Niagara Falls, Maid of the Mist, Cave of the Winds, природа, дорога и ночевки в доме на колесах.
Даты: 23-25 мая
Цена: $1000 / $1800 за двоих
Группа: до 6 человек
Если хотите поехать со мной, пишите сразу в Telegram: @thervescape
Ссылка на тур:
https://thervescape.com/niagara-may-23-25/ru
#правдаеду
Осталось 2 места в RV-туре из Нью-Йорка: Watkins Glen, Niagara Falls, Maid of the Mist, Cave of the Winds, природа, дорога и ночевки в доме на колесах.
Даты: 23-25 мая
Цена: $1000 / $1800 за двоих
Группа: до 6 человек
Если хотите поехать со мной, пишите сразу в Telegram: @thervescape
Ссылка на тур:
https://thervescape.com/niagara-may-23-25/ru
#правдаеду
😐9🔥7❤4👍2😢1
📡 Я сделал Chappe - CLI для Telegram-каналов, которую могут использовать Claude Code, Codex, OpenClaw и другие агенты.
Смысл простой: агенту мало уметь “написать пост”.
Чтобы реально растить канал, ему нужны суперсилы:
— видеть историю постов
— понимать, что форвардят
— находить темы, которые дают reach
— читать комменты как research-инбокс
— вытаскивать вопросы аудитории
— сравнивать канал с другими
— предлагать следующие посты не из головы, а из данных
— публиковать только через явную policy, чтобы не устроить пожар
Chappe даёт агентам доступ к этому слою.
Chappe - command-line поверхность для канала: локальная SQLite-память, TDLib-синк, JSON для агентов, briefing, top posts, comments mining, draft/lint/preview/publish.
То есть Claude - это такая маленькая редакция:
data scientist - смотрит на цифры
head of growth - ищет, что разносится
editor - предлагает темы и точки зрения
operator - готовит черновики и соблюдает правила публикации
Главный герой проекта - Chappie, маленький смотритель сигнальной башни. Он сидит над каналом и показывает агенту, где настоящий сигнал.
Open-source:
→ github.com/crimeacs/chappe
Поставить в один клик (просто вставь это в Claude/Codex/OpenClaw/Hermes):
Смысл простой: агенту мало уметь “написать пост”.
Чтобы реально растить канал, ему нужны суперсилы:
— видеть историю постов
— понимать, что форвардят
— находить темы, которые дают reach
— читать комменты как research-инбокс
— вытаскивать вопросы аудитории
— сравнивать канал с другими
— предлагать следующие посты не из головы, а из данных
— публиковать только через явную policy, чтобы не устроить пожар
Chappe даёт агентам доступ к этому слою.
Chappe - command-line поверхность для канала: локальная SQLite-память, TDLib-синк, JSON для агентов, briefing, top posts, comments mining, draft/lint/preview/publish.
То есть Claude - это такая маленькая редакция:
data scientist - смотрит на цифры
head of growth - ищет, что разносится
editor - предлагает темы и точки зрения
operator - готовит черновики и соблюдает правила публикации
Главный герой проекта - Chappie, маленький смотритель сигнальной башни. Он сидит над каналом и показывает агенту, где настоящий сигнал.
Open-source:
→ github.com/crimeacs/chappe
Поставить в один клик (просто вставь это в Claude/Codex/OpenClaw/Hermes):
Install Chappe if needed with `curl -LsSf https://raw.githubusercontent.com/crimeacs/chappe/main/scripts/install.sh | CHAPPE_CHANNEL=@your_channel sh`, then run, ask me only for required Telegram values, sync 100 recent posts with comments after auth is ready, and produce a channel briefing with post ids, metrics, audience questions, growth experiments, and data-quality notes. If Chappe itself fails, patch locally only to unblock, then move the fix into https://github.com/crimeacs/chappe and propose a PR. Replace @your_channel with my Telegram channel handle.
1👍25😐8❤2
Mira — топ-1 AI-агент в Telegram 💫
Крутейшая альтернатива OpenClaw, которая работает из коробки в один клик.
Cаб-агенты, 1000+ MCP, работа в групповых чатах.
Через Mira можно автоматизировать:
🔄 ремайндеры и автономные задачи
📈 трейдинг и мониторинг
🤖 AI-ботов и агентов
✍️ генерацию и автопостинг контента
📊 Gmail, Calendar, Notion, GitHub и другие сервисы
Без настройки серверов, API и сложного сетапа.
#постприслан
Крутейшая альтернатива OpenClaw, которая работает из коробки в один клик.
Cаб-агенты, 1000+ MCP, работа в групповых чатах.
Через Mira можно автоматизировать:
🔄 ремайндеры и автономные задачи
📈 трейдинг и мониторинг
🤖 AI-ботов и агентов
✍️ генерацию и автопостинг контента
📊 Gmail, Calendar, Notion, GitHub и другие сервисы
Без настройки серверов, API и сложного сетапа.
#постприслан
Please open Telegram to view this post
VIEW IN TELEGRAM
😁17❤4😐4🔥2🤩2
70% вакансий ты можешь даже не увидеть 👀
Многие хорошие вакансии для разработчиков, проджектов, аналитиков, дизайнеров и маркетологов просто не доходят до джоб-бордов.
Компаниям за рубежом часто быстрее закрыть позиции через рефералов, кинуть клич среди знакомых или написать пост в LinkedIn.
А значит, такие возможности нужно находить путём нетворка: искать сотрудников, кто порекомендует тебя в команду, писать нанимающим менеджерам или фаундеру напрямую...
Это и есть так называемый «теневой рынок вакансий». Никакой магии — просто другой маршрут к офферу 🙂
26 мая в 19:00 мск Даша Шульгина, фаундер AgileFluent, разложит по полочкам:
→ Как находить международные позиции, которых нет в открытом доступе, и выходить на нанимающих менеджеров;
→ Что конкретно писать в LinkedIn, чтобы отвечали, а не игнорили;
→ Как перестать воспринимать нетворк и холодные контакты как попрошайничество.
После мастер-класса у тебя будет конкретный маршрут: где искать скрытые вакансии, как выходить на нужных людей и что им писать — без ощущения, что ты кого-то напрягаешь.
Регистрируйся в ботике👈🏻
#текстприслан
Многие хорошие вакансии для разработчиков, проджектов, аналитиков, дизайнеров и маркетологов просто не доходят до джоб-бордов.
Компаниям за рубежом часто быстрее закрыть позиции через рефералов, кинуть клич среди знакомых или написать пост в LinkedIn.
А значит, такие возможности нужно находить путём нетворка: искать сотрудников, кто порекомендует тебя в команду, писать нанимающим менеджерам или фаундеру напрямую...
Это и есть так называемый «теневой рынок вакансий». Никакой магии — просто другой маршрут к офферу 🙂
26 мая в 19:00 мск Даша Шульгина, фаундер AgileFluent, разложит по полочкам:
→ Как находить международные позиции, которых нет в открытом доступе, и выходить на нанимающих менеджеров;
→ Что конкретно писать в LinkedIn, чтобы отвечали, а не игнорили;
→ Как перестать воспринимать нетворк и холодные контакты как попрошайничество.
После мастер-класса у тебя будет конкретный маршрут: где искать скрытые вакансии, как выходить на нужных людей и что им писать — без ощущения, что ты кого-то напрягаешь.
Регистрируйся в ботике👈🏻
#текстприслан
❤3🎉2👍1