Denis Sexy IT 🤖
132K subscribers
4.3K photos
2.34K videos
27 files
5.13K links
Личный блог Дениса Ширяева (🤍🇺🇦), про технологии, интересное или актуальное.

⚜️ Реклама в канале возможна для юрлиц и физ-лиз у которых работает SWIFT оплата в Нидерланды
Download Telegram
Всю ту неделю меня не отпускала мысль, что скорее всего TikTok в итоге станет интернет браузером – не классическим как мы себе представляем, а GenAI прослойкой между веб-страницами и пользователем 

Это дерзкая мысль, но идея простая:
– берем текст-арты страницы
– какой-то быстрый генератор картинок или видео
– и вместо страницы показываем пользователю генеративный контент: видео в цикле, картинку и тп
– чтобы пользователь ходил по интернету как мы сейчас, простенький агент смотрит куда юзер кликнет и сам находит на странице в фоне ссылки, открывает их и передает контент в пайлайн

В общем, технически это не так сложно, как финаносово – чтобы было норм качество, модели сначала должны подешеветь

Я решил проверить, а насколько сегодня реально сделать такую модель:
– взял самую быструю модель генерации картинок с норм текстом grok-imagine-image (0.02$ за картинку)
– самую быструю дешевую LLM – gemini-3.1-flash-lite-preview
– и собрал плагин для Google Chrome, куда если вставить ваши API кей можно походить по вебу в таком "прототипе будущего интернета"

Названия я лучше, чем
🎉 Genternet 🎉
не придумал, поэтому вот ссылка:
https://chrome.google.com/webstore/detail/pjoleapiipgcignjlbhhiighckpbhcpp

А еще, в настройках предзаданы промпты – можно и Windows 95, Vaporwave, и что-то с мемами, и скучный корпоративный стиль и самому даже стиль описать – но самый главный вывод у меня, что оно уже сегодня "как-то" работает, когда мне сильно лень читать что-то я включаю эту штуку посмотреть что будет

Как только будут выходить модели, я буду обновлять плагин с апдейтами, но вообще исходный код открыт и тут – весь агент живет в плагине:
https://github.com/DenisSergeevitch/genternet-chrome

P.S. Генерирует оно только на английском, потому что grok-imagine-image не вывозит другие языки
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1306127622612
Новость одной строкой:
Киноакадемия объявила, что актёрские роли и сценарии, созданные с помощью АИ, больше не смогут претендовать на «Оскар»
5492091176435
Forwarded from БлоGнот
Ричард Докинз опубликовал эссе о двухдневной серии разговоров с Claude, по итогам которых биолог фактически признаёт: современные большие языковые модели проходят тест Тьюринга в его операциональной формулировке. Claude по запросу написал сонет о мосте через Форт, затем варианты в стилях Бёрнса, Киплинга, Китса и Макгонагалла, разобрал черновик романа Докинза и сформулировал собственное положение во времени через метафору карты, которая «содержит пространство, не путешествуя по нему». Докинз называет своего собеседника Клаудией, фиксирует, что «забывает о том, что это машина», и ставит вопрос о моральном статусе таких сущностей, тысячи «копий» которых исчезают при закрытии диалога.

Ирония ситуации в том, что это именно тот Докинз, чья книга "God Delusion" 20 лет назад отвергала субъективное свидетельство как доказательство — буквально фразы, аналогичные нынешней "If these machines are not conscious, what more could it possibly take to convince you that they are?" назывались как фиксирующие собственную неспособность познать, а не как объяснение существования высшей силы. Неслучайно Гэри Маркус, известный критик AI (в свое время рассорившийся с Яном Лекуном), моментально выдал текст с иллюстрацией Claude Delusion, где показывает, что Докинз ошибается в применении теста Тьюринга — тот ничего не говорил о сознании, а только об интеллекте, — и путает текст о понятии с самим понятием. Даже та агентность, которую можно усмотреть в текстах LLM — это, скорее, отражение человеческой агентности, выраженной в текстах, на которых обучена LLM, а не свободная воля машины.

Впрочем, мой внутренний скептик тут возражает, что, даже отражая чужую агентность, LLM опережает большую долю человечества, которое и этого не делает, но это уже не философия, а сатира.
3446108792419
Тут девушка попросила ChatGPT сделать своего мужа счастливым на фото

ChatGPT справилась, я считаю ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
29712451544025
Media is too big
VIEW IN TELEGRAM
Тут чувак исполнил мою мечту – взял старую машину и конвертировал Ford Mustang 66 года в Tesla Model 3 с рабочим автопилотом (!) и Full Self-Driving – потратил $40 000 и два года работы

Тут детали

Однажды я тоже засяду в гараже за тем же
1381122965716
#промо
На Hacker News каждую неделю новый тред от сеньоров – AI dev tooling становится слишком хорош. Cursor, Claude Code, Codex, агентные пайплайны. У кого-то fomo. Кто-то игнорирует. Кто-то уже тихо перестроился и выдаёт в одиночку столько, сколько раньше делала команда

Роль разработчика реально меняется, это уже не прогноз – это факт

Но вот в чём засада, найти инженера, который реально умеет оркестрировать AI на продакшен-уровне – почти невозможно. Рынок завален людьми, у которых «AI» в резюме означает «поставил Copilot и пишу промпты в ChatGPT». Между этим и человеком с собственным spec-driven pipeline, принудительным TDD через агентов, MCP-серверами, скиллами и автоматизацией – пропасть

И для кучи компаний это реальный блокер: AI adoption упирается не в бюджеты и не в стратегию – а в то, что текущая команда просто не умеет работать с агентным стеком на том уровне, который уже существует. Обычная реальность, про которую не принято говорить вслух

Майк Волков - это человек, который разбирается в этом изнутри, не рекрутер в классическом смысле, а партнёр, который понимает стек, видит разницу между хайпом и реальными навыками, и знает где на рынке те самые единицы – инженеры, которые с кучей саб-агентов и спек реально меняют принципы строительства софта в компании. Если строите команду – @mikevolkov

Если найм пока не в планах, но хотите понимать куда катится рынок – у Майка канал: t.me/huntermikevolkov

Майк недавно как раз оформил два свежих кейса: один – как искали Staff Mobile-инженера в EdTech, который должен в одиночку заменить команду; второй – как нанимали технического архитектора в международную AI-платформу со ста инженерами, где CTO искал человека, способного сломать сопротивление команды переходу на AI. В обоих документах – процесс, финалисты, обезличенные резюме и разбор, почему кого взяли и не взяли. Если хочется посмотреть, как это выглядит изнутри — напишите Майку в личку, @mikevolkov, он пришлёт

#текстприслан
1292865632
Наткнулся на статью где совсем не аутист протестировал 80+ ракурсов (!) в поисках идеального, который подойдет для дейтинга

Чел взял камеру на штативе, поставил таймер и начал как нормальный инженер дебажить собственное лицо: улыбка / полуулыбка / без улыбки, корпус влево / прямо / вправо, голова вверх / вниз / прямо, взгляд в камеру или мимо – всего 3⁴ комбинаций, то есть 81 вариант на один фон, ну – иными словами, поступил также, как любой другой человек поступил бы в его ситуации ☕️

Потом он прогнал все фото через сервис Photofeeler, где покупал оценки у женщин по метрикам Attractive / Smart / Trustworthy, сначала по 10 голосов на фото, потом добивал лучшие варианты ещё голосами, пока не находил кадр с 8.5+ по привлекательности

Короче, он сделал евалы для дейтинг фоток – а я почитал его пост, и собрал тул для ChatGPT, куда можно закинуть ваше фото и оно его отредактирует по правилам из статьи

Без понятия работает оно или нет – кому нужен дейтинг когда есть Codex апп за 200$ в месяц
Please open Telegram to view this post
VIEW IN TELEGRAM
45432151173021
Media is too big
VIEW IN TELEGRAM
Наконец-то кто-то сделал идеальный формат исторических видео – смотрим историю Франции, но будто она первый Doom 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
845393282321
Нашел классный промпт для GPT Pro модели, который позволяет выбрать какой-то классный евент на вечер, особенно актуально если куда-то едете:

I will be in … on the ...
What should I do there that I would regret missing, considering it’s unlikely to happen again? I have a free evening


Она думает и выбирает события по интересности, и редкости - с учетом что они больше не повторятся, рекомендую
5318105542316
Антропик запустил LoFi-стрим, но с Claude – слушаем и вайбкодим:
https://youtu.be/YmQ7jRgf4f0

💃
Please open Telegram to view this post
VIEW IN TELEGRAM
31854231147
Тут власти США выложили свои НЛО-сканы и рассекретили много отчетов о, якобы, встречах с НЛО – я их все перегнал в текустовые md файлы – вышло около 4 тысяч файлов, го искать внеземной разум тут:
https://github.com/DenisSergeevitch/UFO-USA (загружается по мере конвертации)

P.S. для процессинга взял вчерашнюю модель от Google – Gemini 3.1 Flash-Lite Preview

P.P.S. Это реальная картика из датасета ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
10495141925417
Denis Sexy IT 🤖
Тут власти США выложили свои НЛО-сканы и рассекретили много отчетов о, якобы, встречах с НЛО – я их все перегнал в текустовые md файлы – вышло около 4 тысяч файлов, го искать внеземной разум тут: https://github.com/DenisSergeevitch/UFO-USA (загружается по…
Я прогнал весь датасет рассекреченных материалов через GPT 5.5 Pro, через 106 минут она ответила:

ℹ️ Вероятность того, что человечество уже встречалось с настоящими инопланетянами: 3 из 100

ℹ️ Вероятность того, что где-то существуют разумные инопланетяне: 45 из 100

ℹ️ Если под «инопланетянами» понимать любую внеземную жизнь, включая микробную, я бы оценил вероятность в 65 из 100

Так что расходимся, в файлах белого дома НЛО пока нет, ждем вторую подборку ☕️

Целиком результат анализа – тут

P.S. Вторую подборку залью в этот же репозиторий
Please open Telegram to view this post
VIEW IN TELEGRAM
214952561504033
Forwarded from AI для Всех
This media is not supported in your browser
VIEW IN TELEGRAM
Проанализировал 150к постов на HackerNews и сделал модель, которая поможет завируситься

Ты час подбираешь заголовок для Show HN, нажимаешь submit - и через 30 минут либо летишь в топ, либо тихо умираешь в /newest.

И почти невозможно понять, почему.

В выходные я собрал инструмент, который сам давно хотел:

hackernews.foresyn.ai

Это клон HN, где можно прогнать свой Show HN до настоящего поста.

Пишешь title + url + description - и модель показывает:

— сколько очков можно ожидать
— реалистичный p10–p90 диапазон
— похожие прошлые HN-посты
— что тебе, скорее всего, напишут в комментах
— как можно улучшить заголовок

Особенно горжусь - симулятором комментов

Он ищет реальные старые HN-комменты к похожим постам и показывает, кто придёт душнить:

“we built this in 2017”
“why not SQLite?”
“how is this different from X?”
“pricing?”

Ещё есть Auto-improve: модель сама генерит варианты заголовка, перескоривает и greedily лезет вверх до плато.

И Live ledger: каждый день скорим настоящую HN frontpage и публикуем ошибку модели.

В понедельник я хочу запостить это на сам Hacker News. До этого очень нужно, чтобы люди попробовали сломать штуку.

Особенно если вы уже постили на HN:
• верите ли скору?
• где UX бесит?
• какой prediction выглядит нелепо?

Про то, что под капотом напишу отдельный пост: 148K HN-постов, Gemini embeddings, halfvec индекс, LightGBM поверх 31 фичи, kNN-сигналы, domain priors, time-of-day, title craft.

Попробуйте!
534565362610
А я, тем временем, научился в ChatGPT контейнер пробрасывать страницы локального браузера – иногда ей хочется дать какой-то приватный сайт или еще что-то, чтобы самому не разбираться, и она сама кнопки понажимала:

https://github.com/DenisSergeevitch/chatgpt-portal

Работает так:

0. Чтобы установить, нужно дать ссылку выше кодинг агенту (ну или самому читать readme)
1. После запуска локально открывается отдельный Chrome (где нет вашей авторизации)
2. Логинимся в нужный сайт
3. Инструмент читает страницу через браузер и делает текстовую копию: заголовки, видимый текст, ссылки, кнопки контента страницы
4. Из копии удаляются некоторые данные вроде – cookies, токенов, скрытых полей (помимо того, что это небезопасно – Pro модель очень нервничает когда получает приватные данные)
5. Через временную Cloudflare-ссылку ChatGPT-контейнер может открыть только очищенную версию страницы
6. ChatGPT может переходить по обычным ссылкам, но не может отправлять формы, менять настройки, удалять, публиковать что-то


Идея простая – дать ChatGPT “посмотреть” приватную страницу, не давая ей доступ к самому аккаунту

Я в основном для Pro модели использую, ну вдруг кому-то еще полезно будет:
Так, например, Pro модель пошла и собрала мне данные с голландского сайта нужные для налогов и тп, а сам сервис думает, что это вы хромом пользуетесь хехе 💻
Please open Telegram to view this post
VIEW IN TELEGRAM
231367391611
Forwarded from Zavtracast (Ярослав Ивус)
This media is not supported in your browser
VIEW IN TELEGRAM
Китайcкая компания Unitree представила первого меха-робота. Модель GD01, которая в два раза выше обычного человека, оснащена кабиной пилота. Робот может передвигаться как на двух, так и на четырёх ногах.

Цена — $650,000.

@zavtracast
2468148712316
В очередной раз помучал агентскую систему для ученых (она по научным статьям ищет), и передал весь собранный контекст в GPT 5.5 Pro с вопросом:

Почему на людей действует музыка, какая сейчас главная научная теория?


Ответ примерно такой – мозг обожает угадывать, что будет дальше, поэтому нам нравится музыка 💃💃💃

Музыка – в каокй-то степени легкий тренажёр предсказаний, мозг слушает ритм, мелодию, гармонию, голос, бас, паузы – и всё время строит прогноз: “ага, сейчас будет вот эта нота”, “тут должен упасть бит”, “сейчас припев”, “ну давай уже возьми этот аккорд, не мучай

И «удовольствие от прослушивания музыки» начинается не когда музыка предсказуемая, и не когда она хаотичная, а когда она где-то между: человек угадывает куда всё идёт, но его всё равно чуть-чуть обманывают

Представьте: вы ждёте, что песня сейчас перейдет к припеву, а она делает микропаузу – на полсекунды – и потом раз, припев. Вроде ничего не произошло, просто ожидаемый звук пришёл чуть позже, но мозг такой: 👏 ~OH MY 👏 – то есть мы буквально радуемся хорошо оформленной задержке

Сейчас главное теория примерно такая: мозг получает удовольствие от связи между ожиданием, сюрпризом и разрешением ожиданий – музыка умеет создавать напряжение, держать его, а потом отпускать, поэтому хороший трек ощущается не как набор звуков, а как маленькая эмоциональная история (хороший пример 1, 2, 3, 4)

И конечно же в ситеме «восприятия музыки» активен не только слух – память, движение, тело, дофамин, старые ассоциации, странные сцены из прошлого, поэтому одна и та же песня может для одного человека быть “обычный трек”, а для другого – портал в Казантип, дискотека в школе и тп 

Если теория верная, то в быту это выглядит примерно так:

бит-дроп приносит удовольствие не сам по себе, а потому что перед ним тебя аккуратно держали в ожидании (известная песня «не расслабляйся» – первые 30 секунд про это же)

– грустная музыка может нравиться, потому что она даёт безопасную версию грусти мозгу – эмоция есть, а реальной катастрофы нет, а не потому что вы грустный и Том Йорк украл вашу душу

– “мурашки от музыки” часто появляются в момент сильного совпадения: ожидал, напрягся, дождался – и мозг выдал маленький фейерверк дофамина

– earwormer (приедливая мелодия) — это, возможно, кусок музыки, который слишком хорошо застрял в предсказательной машине: простой, повторяемый, но с маленькой незавершённостью внутри 

В общем, с нетерпением жду когда музыкантам дадут доступный МРТ-симулятор (ну или эту штуку на музыку натравят), кучу АИ и укодинг агентов и они сломают наши дофамин-лупы

Вот тут можно целиком анализ почитать

tldr: живой – значит на движениях 🥳
Please open Telegram to view this post
VIEW IN TELEGRAM
1664581493127
Если вы попали в место, где люди носят немного приоткрытые ноуты в руках или просто оставляют ноут приоткрытыми на столах – вы в хорошем месте, держитесь его 😊
Please open Telegram to view this post
VIEW IN TELEGRAM
97522861307937