Метаверсище и ИИще
50.9K subscribers
6.38K photos
5.08K videos
48 files
7.39K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Grok Imagine Video 1.5 VS Seedance 2.0

Выводы делайте сами. Имхо по динамике Сиданский лучше, но вероятно не во всех сценах.

@cgevent
😁36👍9🔥42👎1
Gemini Omni vs Grok vs Seedance

Специально для любителей драк.

Omni - там где 10 секунд.

А где Сиданс вы поймете по динамике и по монтажной склейке в самом конце.

@cgevent
👎20👍13😁31😱1
Сиолошная
Finally, PC 2 — Nvidia и Microsoft «переизобрели» персональные компьютеры для эпохи AI (я не шучу, в анонсе так и пишут, и даже «новая глава»). За анонсом стоит новая платформа для PC и ноутбуков на основе RTX Spark Superchip, состоящего из GPU, CPU и объединённой…
Media is too big
VIEW IN TELEGRAM
Еще раз уточню про RTX Spark

Это не новая коробочка от Nvidia - это новая платформа - новое все - мама, чип, память - все другое.

Это System-on-Chip, где стоит 20-ядерный ARM CPU, Blackwell GPU на 6144 CUDA Tensor Cores с FP4 и 128 ГБ ОБЩЕЙ памяти. Как с силиконовых маках.

Мне это напоминает 2018 год, когда Нвидия представила на Сигграфе в Ванкувере собственно сам RTX и концепцию RTX Studio. Когда они смогли упихать видеокарты в тонкие ноутбуки, чтобы делать графику не только на огромных десктопах.

Вот и сейчас они говорят, что ноуты на этой платформе будут весить всего 1.3 кило и быть толщиной 15 миллиметров.

Остается открытым интересный вопрос про операционку - что придется придумать Микрософту...

@cgevent
43👍7👎4🔥4😱1
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

«Мысленно я был дома»

По письмам солдата Юрия Никулина домой
Автор: @leskoc

История создания
Друг пришёл с готовым сценарием, построенным на реальных фронтовых письмах Юрия Никулина, и спросил: «Мне нужен ИИ-ролик, ты в деле?». У меня уже был опыт создания подобных видео, поэтому сразу согласился. Изначально хотели сделать визуал в стиле мультфильма «Приключения Васи Куролесова», но нейросети упорно выдавали картинку, близкую к американской анимации, и добиться нужной эстетики не получилось. Решили остановиться на доступном, но близком к настроению варианте — мягкой рисованной стилизации, которая передаёт светлую грусть и теплоту писем.

Детали производства

Общий пайплайн:
Раскадровка в GPT Image2→ стилизация (Nano banana pro) → анимация → озвучка и звук → монтаж и цветокоррекция.
Весь процесс занял ровно 7 дней (примерно 40 часов чистого времени).

Выбрал Grok, по своему опыту для анимации он классный и лимиты до недавнего времени были щедрые + есть классные фишки по типу продления кадра

Озвучка и голос
- Cartesia для клонирование голоса Юрия Никулина. Использовал бесплатный тариф. Для клонирования выбрал отрывки из фильмов

- Музыка: инструментальная тема Микаэла Таривердиева из кинофильма «Семнадцать мгновений весны» . Она идеально легла на ритм повествования

Монтаж и постобработка
- Premiere Pro сборка всех сцен, синхронизация звука, цветокоррекция.

Бюджет:
- Аккаунт Grok (Авито) — 800 руб.
- 5 аккаунтов ChatGPT — бесплатно.
- Cartesia — бесплатный тариф.
- LLM Arena (доступ к Nano Banana Pro) — бесплатно.
- Остальное: собственное время и Premiere Pro.
Итого: 800 рублей.

@cgevent
👍73👎35🔥2011🙏1
Forwarded from слИИвки (Дмитрий Тихонов)
ByteDance выкатила Bernini — новую систему для генерации и редактирования видео, где MLLM-модель сначала «планирует» сцену на семантическом уровне, а уже потом диффузионная модель рендерит итоговый ролик. По сути, ИИ сначала думает, потом рисует. 🤯

Проект построен на базе WAN 2.2 и дополнительных чекпоинтах от команды ByteDance, а также моделей, указанных авторами в репозитории. Поддерживаются генерация видео, редактирование, работа с референсами и вставка объектов в готовые ролики.

Потестить можно тут:
bernini-ai.github.io

#AI #VideoGeneration #ByteDance #WAN22 #pepewtfa
👍34🔥116🙏1
ИИ, который мы заслужили.

Компания Joy AI нанимает тестировщиков старше 18 лет на 4 недели. Им предстоит тестировать новую функцию «Daily Guided Masturbation» (ежедневные сессии под руководством ИИ с адаптивным под настроение голосом).

За рукоблудие обещают платить, внимание, 2000$ в месяц.

Компания делает (в том числе) "ИИ коуча по мастурбации" и нуждается в "специалистах".

Ежедневные голосовые ИИ-сессии, недельные отчеты о том, как это влияет на сон, стресс и общее самочувствие - все по науке. В объявлении так и написано masturbation for science.

Не шутка, вот объява:

Сорс


@cgevent
😁6314🔥9😱3🙏3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Текстуры на 12К

Я уже писал что Rodin Gen-2.5 тизерит генерацию 3Д-моделей на 10 Миллионов полигонов.

Пишут типа: "вплоть до структуры кожи".

А теперь они бахнули генерацию текстур на 12К. В принципе это уже годно даже для кино. Не говоря про игры.
Узкое место, по-прежнему топология и генерация деталей, но сам факт того, что 3Д-генераторы начинают смотреть за пределы 3Д-печати - радует.

Промпт на видео тоже радует...

Пока только в бете для бизнес-акков.

@cgevent
👍26🔥6👎41
This media is not supported in your browser
VIEW IN TELEGRAM
Гугл выкатил обещанных аватаров для Gemini Omni

Для создания камео - версии себя - покрутите лицом на камеру, Омни оцифрует ваше лицо (по типу KYC) и сохраняет вас как Аватар. Под капотом 3Д-сканирование.

Потом к нему можно обратиться к аватару в промпте как например "Создай видео, на котором @[ваш никнейм в Google] поет с оркестром".

Аватар для вашего никнейма может быть только один, но фишка в том, что в любой момент аватар можно "переснять", просто повторив процедуру или удалив последний аватар.

Пока не знаю, что там с цензурой - можно ли подсунуть на вход (через лайфхаки с видеопотоком) чужое (известное) лицо.

Также пока не заморочился с VPN ибо "Аватары пока недоступны в Великобритании, Европейской экономической зоне и Швейцарии."

Требуется подписка Pro и выше.

Попробуйте плиз.

Вот тут очень подробная инструкция на русском, как это сделать.
https://support.google.com/gemini/answer/16984474

На компьютере откройте сайт gemini.google.com
В текстовом поле внизу нажмите "Добавить файлы" затем "Другие варианты" затем "Аватар" .
Отсканируйте QR-код с помощью телефона или планшета.
Следуйте инструкциям на экране телефона или планшета, чтобы записать видео с вашим лицом и голосом.
Вам нужно будет предоставить доступ к камере и микрофону.
Вернитесь к компьютеру, чтобы завершить процесс.
Нажмите Использовать аватар.


@cgevent
🔥2710👍1
Forwarded from AI Product | Igor Akimov
MoneyPrinterTurbo - автоматическое создание роликов

Хах, а вот и защита - "принтер для денег" и бесплатный "контент-завод" :)

Опенсорсный проект, который собрал больше 77 тысяч звёзд на GitHub. Вводишь тему или короткий промпт – на выходе готовый ролик со сценарием, стоковым видео, озвучкой, субтитрами и музыкой.

– LLM пишет сценарий по твоей теме, либо можно подставить свой текст
– система сама подтягивает HD-сток без копирайта из Pexels и подобных источников
– TTS озвучивает текст, субтитры собираются автоматически
– сверху ложится фоновая музыка – и всё это рендерится в 1080p

Что под капотом
– локальные модели через Ollama (Llama, Mistral, Qwen) и облачные – OpenAI, DeepSeek, плюс Grok
– форматы 9:16, 16:9 и 1:1 – под Shorts, YouTube и Instagram сразу
– пакетная генерация: делаешь несколько вариантов и выбираешь лучший
– тонкая настройка субтитров: шрифт, размер, цвет, обводка, позиция
– есть и Web-интерфейс, и REST API, разворачивается через Docker
– внутри Python, MoviePy и FFmpeg, чистая MVC-архитектура

Прикольно, что проекту уже почти 2 года, а он все растет и растет. Качество упирается в стоковые видео плюс синтезированный голос, так что зрителю видно, что это конвейер – для брендового контента пока не годится. Зато как учебный кейс «склей AI-сервисы в продукт» и как фабрика для тестов каналов.

https://github.com/harry0703/MoneyPrinterTurbo/blob/main/README-en.md
28🔥12👎6👍4😱1
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

Клип/фильм на авторскую песню.

Автор: Артем.

Здесь я в большинстве тестировал сиденс.
И он крут. Конечно не обошлось и без клинга, куда без него.
Что в итоге получилось.
Ушла полная максимальная подписка клинг.
И три максимальные подписки хигсфилд (на нем я использовал сиденс).
Озвучка и липсинк также сиденс.
Изображения банана и чуть чуть флакс 2 макс.
Ну и суно.
По работе около 100 часов.

О чем это видео.

Невероятная история большой войны.
Фрея - олицетворение искусственного интеллекта и человечности.
Магия любви и ненависти.
Мы расскажем как ведут себя Боги.
И как ведут себя люди, распоряжаясь своей волей.
Когда от одной маленькой жизни зависит судьба человечества.
Когда кажется, что выхода больше нет.
Она придет на помощь, чего бы это ни стоило.
Мы покажем ужасы войны и свет надежды.
Самая важная битва в которой решится все.
Это музыкальный клип? Короткометражный фильм?
Или нечто другое?
Смесь истории и фэнтези.
Авторская песня Артема Долгих.
В исполнении великолепной магической Фреи.
Своей магией она может превратить бездушную куклу в человека и подарить любовь - вы это видели.
Она может расколдовать животное, с помощью магии роз и подарить ему любовь - вы это видели.
Но если она придет в ярость, то сможет подарить только смерть - вы это увидите.
Добро пожаловать в иллюзию.
Добро пожаловать в реальность.


Приятного просмотра 🫶
И спасибо за внимание!

@cgevent
👎46🔥39👍18😱54
Forwarded from Psy Eyes
Runway: убирают безлимитный тариф Unlimited и ставят вместо него за ту же цену ($95/мес) тариф Max.

В нем не будет режима Explore для безлимитной генерации видео и картинок в рамках подписки. Вместо 2250 кредитов в месяц даётся 9500, чего хватит на 15 FullHD видео Seedance 2 длиной 15 сек (цены). Неиспользованные кредиты переносятся на 1 следующий месяц, а дальше сгорают.

Для тех, кто уже на анлиме всё останется как есть до 31 августа. С 1 сентября, если вы на ежемесячном списании, либо остаётесь на Max, либо отменяете подписку. Если на ежегодном списании, с 1 сентября либо переходите на Max, либо получаете возврат средств за неиспользованное время.

Анонс в дискорде
👎39😁12😱61
This media is not supported in your browser
VIEW IN TELEGRAM
AI-assisted retopology, UV unwrapping, GPU compute packing, and texture baking

Интересный новый софт Cozy Blanket - обещают ИИ-ретоп и Анврап.

Цен нет, доступа нет, сроков нет - но есть очень обещающие картинки и хорошо сделанный сайт.

Можно подписаться на обновления.

Подписался, заинтригован.

https://sparseal.com/cozyblanket-pro/

@cgevent
🔥49😱86
This media is not supported in your browser
VIEW IN TELEGRAM
Новые модели от Микрософта.

Они анонсировали семейство из семи новых моделей под брендом MAI для работы с изображениями, голосом и кодом.

MAI‑Thinking‑1 (ризонинг-модель, 35 миллиарда параметров, контект 128K)
MAI‑Code‑1-Flash
MAI‑Image‑2.5
MAI‑-Voice-2

Нас интересует (или не интересует) MAI‑Image‑2.5, которая на Арене взобралась на второе место в категории редактирования картинок, обойдя Банану. Что делает доверие к Арене еще более сомнительным.

С ценами на АПИ можно ознакомиться по ссылке, а но мне больше интересно, как Микрософт будет встраивать генерацию в продукты. Уже сейчас написано "MAI-Image-2.5 is live on PowerPoint for high-quality image generation and rolling out to OneDrive for precise editing."

@cgevent
👍117👎1🔥1
Forwarded from AI Product | Igor Akimov
This media is not supported in your browser
VIEW IN TELEGRAM
Codex теперь умеет выкладывать внутренние приложения
OpenAI зашёл на территорию Lovable и Replit, но пока только для внутренних сайтов.

Вчера на стриме «Intelligence at Work» OpenAI выкатил сразу три апдейта для Codex: шесть ролевых плагинов под бизнес-задачи, аннотации и – самое интересное – Sites.

Это плагин + managed-хостинг прямо внутри Codex. Просишь собрать приложение – Codex его строит, прогоняет, деплоит и возвращает ссылку, которую можно расшарить по воркспейсу. Весь цикл в одном треде, без ручной возни с инстансами и регионами (привет всем, кто пытался захостить локально собранное приложение в GCP или AWS).

Целятся во внутренние инструменты: онбординг-дашборды, базы знаний, борды для идей, репортинг-вью, лёгкие воркфлоу-приложения. То есть не «лендинг запилить», а «превратить рутину команды в живое приложение».

Добавили 2 фичи для хранения:
– D1 – SQLite-совместимая база под структурку: состояние чеклистов, закладки, фильтры, конфиги, метаданные файлов
– R2 – объектное хранилище под сами файлы: документы, картинки, ассеты

Любопытная деталь: D1 и R2 – это вообще-то названия продуктов Cloudflare. То есть «хостинг от OpenAI» под капотом едет на Cloudflare – OpenAI не строит инфру сам, а заворачивает чужую под свой бренд и свою авторизацию.

По дефолту приложение видят только владелец и админы воркспейса. Дальше открываешь либо на весь воркспейс (workspace_all), либо точечно на людей и группы (custom). Авторизация – через Sign in with ChatGPT. Пока превью для Business и Enterprise.

В общем, всем ChatGPT, пожираем всех ближайших конкурентов и GPT-врапперы.

https://developers.openai.com/codex/sites
👍186
This media is not supported in your browser
VIEW IN TELEGRAM
Вайб-контентинг или видео-агентинг.

Осьминог от Дримины.

Пока мы тут хлещемся по поводу того, какой видеогенератор круче, из тумана постепенно вырисовываются новые паплайны (спойлер - в пределе заветная кнопка "сделать красиво").

Я уже писал про Super Computer от Хиггсов - агент, который берет на вход минимальную хотелку пользователя, а дальше сам сценарит, концептит, персонажит, раскадрочит, промптит, итерирует, генерит, критикует сам себя, переделывает.
Отзывы плохие - путается, застревает, жрет токены, ходит по кругу, генерит шнягу.

Также мы уже пообсуждали в коментах агента в Google Flow - отзывы получше, амбиции поменьше, функционал скромнее, но надежнее.

И это именно прототипы того, что нас ждет в контентинге в этом году.

Агент-партнер, которому можно либо отдать задачу и забыть, либо идти с ним вместе поэтапно. Самое главное, что он будет в контексте задачи - помнить про исходную хотелку, удерживать концепт персонажей, который сам же и породит, следить за консистентностью и даже соотносить финал с начальным замыслом.

Конечно, все это похоже на вайб-кодинг и удерживание контекcта в голове агента. Только контекст у нас визуальный, не всегда вербализуемый или объяснимый, но в целом замысел тот же.

Но если вайб-кодер часто вообще не смотрит код, а только юзает результат, ну или смотрит код - и для этого у него есть просто текстовый редактор кода. Но наш визуальный промежуточный код - это и текст, и картинки, и раскадровки, и звук, и концепты, и видосы референсы - в общем визуальная кустистая ботва, разбросанная по папкам и экрану.
И дальше будет очень интересно наблюдать, кто сможет организовать эту ботву (на экране) и интерактивное общение с агентом наиболее удобным образом.

Аналогов такого UX просто еще не было. Для раскадровок - одно, для концептов - мудборды, для персонажей - шиты, для композа - нодовый интерфейс, для монтажа - таймлайн. А тут надо как бы все вместе нарисовать на экране. Ибо теперь нажал кнопку - и все этапы могут сгенериться сами - и надо их как-то представить.
Пока все идет к тому, что это будет аналог нодовых интерсейсов на бесконечных холстах(канвасах), но не факт, что так и останется в будущем. Ноды - паллиатив.

Хех, это был дичайше долгая подводка к новому агенту от Дримины под названием OCTO.
И да, он тоже сам сценарит, концептит, персонажит, раскадрочит, промптит, итерирует, генерит, критикует сам себя, переделывает. Под капотом может быть родной Сидэнс, но не обязательно, генератор картинок - любой, текстовые модели - любые.

https://dreamina.capcut.com/ai-tool/home/

На видео - примерный интерфейс, но я сейчас накидаю еще примеров того, что уже делается одной кнопкой в этом OCTO.

А чтобы еще больше удлинить пост и покрепче обосновать тезис про агентов и вайб-контентинг, приведу новость о том, что UTOPAI Studios выпустили вторую версию своего агентского пайплайна:
https://variety.com/2026/digital/tech/ai-utopai-studios-pai-2-generative-video-platform-1236764434/

И там прямо так и говорится:

“With PAI 2.0, our goal is to help catalyze a ‘Claude Code moment’ for media generation”

Тут они пытаются перетащить на себя общее одеяло, но в принципе да, мы сейчас наблюдаем ‘Claude Code moment’ для генерации контента, в виде прихода агентов в видеогенерацию.

@cgevent
👍2012🔥3👎1
Вот тут примеры генераций из Dreamina Octo.

Тут важно заметить, что это не ручной генереж и монтаж, а результат работы агента. Который сам решил за ракурсы и склейки.
И за многое остальное.

Там есть и короткие ролики и пятиминутные фильмы.

Думаю, что скоро тикток просто захлебнется микродрамами, а слопа станет еще больше.

Но таков путь.

@cgevent
🔥43😱95😁3👍1