Метаверсище и ИИще
50.9K subscribers
6.37K photos
5.08K videos
48 files
7.38K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Lyria 3: генератор музыки от Google

Генерацию музыки завозят в Gemini App(десктоп и моб). Если открыть Gemini, то в Tools после Create Images появляется Create Music.

Я зашел под штатовским IP, но у меня еще не появилось.

Дернул для вас пару примеров из твиттора.

Но не спешите радовацца, есть масса ограничений.

30 секунд

Нельзя присунуть свои стихи\тексты, как я понял лирика генерится исходя из описания музыка в промпте. Можно ли в промпте указать тексты песен я пока не знаю.

Можно на входе давать картинки, Google Music их "озвучит".

С моей точки зрения, это сильно урезанный продукт для коротких видосов, рилсов и шортсов. Даже в риторике Гугла на сайте не звучит концепция создания ПЕСЕН, а описывается просто создание "музыки".

Читаем подробности тут:
https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/

И проверяем свою Gemini.

@cgevent
👍1512👎4🔥2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Гауссиановый лайфхак.

Если вы натренируете свою 3D Gaussian splat сцену на фотках, где персонаж смотрит в камеру, то ваш Сплат будет следить за вами!

Можете сами поглядеть тут:
https://superspl.at/view?id=29f9b77d

Сорс.

@cgevent
😁10318😱9👍8🔥2
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

Марина Цветаева - Реквием

Автор: Артем
https://www.youtube.com/@ai_top_creator

Это прямое продолжение «Прохожего».
Наши герои повзрослели, постарели и прошли тяжелый путь.
Песня - похожий мотив, но мощнее.
История - эмоциональна, но сильнее.
Картинка качественнее, структура сложнее.
Он подхватит на эмоциональных качелях и раскачает так, что можно и не удержаться.
Это будет быстро и не больно, не так, как нашим героям. Но послевкусие останется надолго.

К цифрам и инструментам.

- 1794 сгенерированных изображения, 110 были отобраны

- 1020 сгенерированных видео

- 327 сгенерированных липсингов

- и всего 104 шота из видео и липсингов ушло в монтаж

- 1028 рабочих файлов

Ужасающая себестоимость клипа по меркам нейросетей. Почти 70000₽. (25000₽ обработка у звукорежиссера)

Работа заняла около 100 часов.
13 дней.

- банана про
- флакс 2 макс
- сидрим 4,5
- клинг
- вео
- ранвей
- сиденс

Спасибо за внимание и приятного просмотра❗️

@cgevent
1👎98🔥50👍3711
This media is not supported in your browser
VIEW IN TELEGRAM
Seedance 2.0 is on its way to ComfyUI.
Stay tuned!


Вот такая телега появилась в твитторе ComfyUI.

Народ, конечно, уже обсуждает, влезет ли в 5090 или нет.

Я думаю, что это просто пиар cloud.comfy.org, где и появится Сидэнский.

Также возможно его появление, через API (Partners) Nodes - точно также как вчера в Комфи появился Recraft V4.

@cgevent
🔥32😁8👍61
This media is not supported in your browser
VIEW IN TELEGRAM
Мажоры поднимают веки.

Тут пришла череда новостей от CG-мейджоров, которые принялись скупать ИИ-компании (спасибо Саше Калюжному за вчерашние новости, Саша теперь ревьюер на Siggraph, с чем его и поздравляю).

Помните, я несколько раз писал про Мешкапад.
Это создание, анимация и нейро-мокап CG-болванов вместе с трекингом камеры.
Также Meshcapade позволяет генерировать 3D-модели человеческих тел из различных источников данных.
И ну анимировать их либо нейромокапом, либо даже промптами.
Технология, разработанная Meshcapade, основана на модели тела SMPL (Skinned Multi-Person Linear), которую сделали в Институте Макса Планка в Германии, а сам Мешкапад является одним из стартапов Института.

Так вот: их пожрал Epic Games.

Теперь все это дело будет прикручиваться к Метахьюманам.

Технический директор Epic Ким Либрери заявил: «Привлечение талантливой команды Meshcapade и передовых технологий в Epic поможет предоставить создателям контента в игровой, кино- и виртуальной индустрии новые специализированные инструменты для разработки цифровых людей».

Любопытно, Epic Games, для этого откроет новый офис в Тюбингене, в Германии, где находится немецкая КиберДолина

@cgevent
👍2911👎4😁1
Мажоры поднимают веки 2

The Foundry купили стартап Griptape AI

Griptape - это что-то типа ComfyUI, но попроще. Набор нод и движок для их выполнения. Ноды самые разные - от доступа к LLM, до видеогенерации (последняя либа на гитхабе - доступ к Клингу).
Кроме нодового движка, у них еще есть Griptape Cloud (аналог Comfy Cloud) и Griptape Framework - среда разработки ИИ-приложений на Питонге.

В общем, купили их точно не за нодовый движок (У Фаундри свой в 10 раз более мощный), а за остальные разработки и инфраструктуру.

Ждем теперь генерации всего и вся прямо в Нюке.

Foundry заявили, что планирует интегрировать Griptape в существующие продукты Foundry, чтобы «художники могли легко включать результаты работы различных моделей искусственного интеллекта в свой творческий процесс».

Кстати, вот гитхаб Griptape, там все открыто.

@cgevent
🔥115👎1
Мажоры поднимают веки 3.

На недавнем финансовом отчёте CEO Unity Мэтью Бромберг сообщил, что на конференции GDC в марте 2026 будет представлен бета-вариант обновлённой системы Unity AI, которая позволит разработчикам создавать полные казуальные игры просто с помощью *естественного языка* - без традиционного написания кода и скриптов.

Основная идея заключается в «ИИ-авторинге» - инструменте, который понимает контекст проекта и генерирует игровые прототипы и элементы на основе промптов. Unity подчёркивает, что это должно снизить барьеры для входа, сделать разработку более доступной людям без технических навыков и повысить продуктивность существующих создателей игр.

Возможно, технология будет работать с простыми мобильными и казуальными жанрами (например, головоломки, платформеры или простые симуляторы), хотя точные границы возможностей пока неясны.

Unity также политкорректно заявляет, что это не заменит полностью традиционные движки, а скорее станет дополнением к ним — инструментом для ускорения творчества и расширения круга тех, кто может создавать интерактивный контент. Компания надеется, что "такие ИИ-средства откроют путь для десятков миллионов новых разработчиков и изменят ландшафт индустрии."

@cgevent
14👍11👎4
Как идеальная иллюстрация к предыдущему посту - эмоциональный текст (а также видео и картинки) от Антона. Я сначала хотел поставить это в необычную прожарку (можете прожарить, если хотите), но понял, что это заслуживает отдельного поста. Ну, за GameDev!

Как сбылась мечта спустя 16 лет.


Всем привет. Меня зовут Антон, я работаю в геймдеве около 15 лет.

За это время успел поработать концепт-художником, арт-директором, генералистом, лидом команды видеопродакшена. Проекты становились дороже, команды больше, ответственность выше. Работу я люблю, и она по-своему интересная, но с каждым годом я всё сильнее уходил от той самой детской мечты - придумывать и строить миры.

Чем дальше, тем меньше творчества. Больше заводской стандартизации, метрик, отчётов и оглядки на цифры. А делать хотелось, и не по трендам и не потому что «так работает», а потому что так хочется. Но главным стопом всегда был код. Я мог закрыть всё арт-производство, но быть одновременно художником и программистом казалось малореалистичным.

И тут появились нейросети. Серьезно изучив тему, я создал блог в Telegram. Сначала писал про арт и видеопродакшен, потом постепенно ушёл в код. В итоге выстроил рельсы, на которых LLM может реально заменить кодера в разработке. Арт пока еще не доверяю. Но код!

После серии прототипов я взялся за первый серьезный проект. Tower Defense с roguelike-элементами в мире летающих кораблей. Не без ностальгии по временам работы над Аллодами Онлайн. но реализовать смог только сейчас. Так появился HEXSTORM: Tears of Arcadia.

На создание тест версии ушло чуть больше 400 часов, при условии, что я ни знаю ни единого языка программирования. Первый результат мне нравился. Но у меня не было команды QA. И некому было сказать, туда ли я двигаюсь. Поэтому я собрал веб-билд и отправил его в Яндекс.Игры. В игру поиграло ~30к человек.

Контента там было всего на пару часов, но люди играли и возвращались. Проект получил множество положительных отзывов, но спустя несколько версий стало понятно: веб-версия упёрлась в потолок. Ограничения платформы начали мешать развитию. Достойную графику и эффекты просто нельзя реализовать нормально.

Прошло полгода с момента начала разработки. И я настолько заматерел, что начал сборку полноценного PC-билда для Steam.

Steam-страница уже запущена. И это очень крутое ощущение, когда делаешь что-то своё и что-то самодостаточное, вне стен огромных студий.

Знаю по себе и по коллегам, что со временем в профессии легко застыть. Когда ты всё ещё компетентен, востребован, но желание что-то придумывать постепенно вымывается процессами, метриками и обслуживанием чужих решений. Для меня нейросети сработали как способ снова начать делать интересные вещи, без необходимости в большой команде и сложных корпоративных инфраструктур. При правильном подходе они снимают часть барьеров, которые раньше просто не позволяли даже попробовать.

Поэтому впервые за много лет у меня появилось то самое ощущение из юности, когда кажется, что возможно вообще всё.

@cgevent
👍129🔥6926👎17
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за фейссвопперы.

Seedance 2.0 просто убийственно хорош.

Replace the model in the eyewear e-commerce promotional video
Video 1 with a Western (European/American) model, referencing the appearance in Image 1. Change all spoken language to English, while keeping the original character actions, performance timing, and camera movement unchanged



@cgevent
🔥143👍25😱16
Вышла Gemini 3.1 Pro

Уничтожает всех и вся.

Уже доступна для Pro и Ultra в Gemini, AI Studio, Antigravity, NotebookLM, Gemini CLI.

Идём тестировать и спрашивать за Новую Нанабанану.

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

@cgevent
😁36🔥305😱1
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

Клип «Кровь за Гроб Господен»
Музыка: Молот Истории
Видео: @Aleksey_Azanov


Если плохо грузит с ТГ, можно посмотреть на YouTube или на Яндекс Диске.

Чуть больше года назад я начал свой путь создания коммерческих видео благодаря помощи ребят из чата этого канала. Сейчас, набравшись смелости, первый раз высылаю на прожарку работу)

От заказчика была задача показать сюжет штурма Иерусалима крестоносцами.
На этапе препродакшена были внимательно изучены реальные исторические события, написан сценарий, выбрана цветовая схема.

🖼 В ходе работы над статикой (в Nano Banana Pro) распробовал инструмент Storyboard во Freepik. Расписывается одна сцена, запускается очередь из сотни генераций, и можно заниматься другой работой. После выбираются подходящие кадры (иногда приходится их «апскейлить» через Nano Banana Pro, чаще всего вылазит проблема, что плывут лица).

🎥 Анимировалось в основном в Kling 2.6, немного в Veo3.1 и Kling 3.0 (классно делает динамику, но всё плавёт как в Minimax, который тоже использовался для одной генерации).

🛠 Некоторые из проблем, которые пришлось преодолевать - цензура нейронок (заказчик просил покровавей). Решалось через более вдумчивый промптинг, количество попыток, перебор разных нейронок.
-в битвах статику нейронка всегда рисовала момент удара (меча по мечу, меча по телу). Красиво для статики, но для анимации не пригодно. Решилось несколькими приемами в промптинге.

⏱️По затратам времени и денег сложно посчитать, потому что делалось месяц, но параллельно огромному количеству других задач по видео, и за этот месяц вместе с другими проектами сожгли три ультры Клинга

@cgevent
👎68👍26🔥1510😱1
Forwarded from Осцилляции WaveCut (WaveCut)
Это было неизбежно: рано или поздно должны были появиться специализированные решения для инференса.
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.

Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.

Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).

Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.

Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.

У меня голова идет кругом от мыслей к чему это может привести.


Ссылки:
Анонс
Демо (скорость реально впечатляет)
1👍71🔥57😱187