Forwarded from Сметана ТВ
YouTube
Доброкотов 10 лет спустя: что случилось?
Сценарист, комик, гений, мультимедийный художник. Человек красивый и скромный. Так себя описывает Саша Доброкотов.
Поговорили с самым усатым резидентом Сметаны. Получился уютный разговор с большим количеством откровений и творческим сюрпризом в конце. …
Поговорили с самым усатым резидентом Сметаны. Получился уютный разговор с большим количеством откровений и творческим сюрпризом в конце. …
❤100👻19🔥14🤯11
Media is too big
VIEW IN TELEGRAM
Аватарошная HeyGen обновилась до пятой версии 😮
Теперь для обучения модели достаточно 15-секунд видео (было где-то от минуты). Ну и важное: модель теперь может взять вашу «двигательную подпись» из референс-видео и применить ее к другой версии вас — в другой одежде, фоне, формате кадра и т.д. Ну и улучшайки по мелочи: консистетность, липсинк, жесты.
Сделал небольшой домашний тест. Это text-to-avatar если что. C записанным заранее голосом, думаю, вышло бы получше.
Теперь для обучения модели достаточно 15-секунд видео (было где-то от минуты). Ну и важное: модель теперь может взять вашу «двигательную подпись» из референс-видео и применить ее к другой версии вас — в другой одежде, фоне, формате кадра и т.д. Ну и улучшайки по мелочи: консистетность, липсинк, жесты.
Сделал небольшой домашний тест. Это text-to-avatar если что. C записанным заранее голосом, думаю, вышло бы получше.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯132🔥70👍32❤9👻3😱2
GPT image 2 vs Nano Banana 2 👊
Протестировал новинку на своем стресс тесте. Показываю усредненный результат из ~10 круток.
Итого, у новой ГПТшки лучше:
1) C пространственной логикой (ковер должен быть ЗА человеком, лампа НА столе). Банана так и не попала.
2) По тексту — более интересные гарнитуры и точнее к промту.
Что хуже:
1) ГПТшка буквально вклеивала лицо с референса, включая лишний голубой световой рефлекс на голове и ее наклон. Возможно чинится промтом.
2) Самое больное — фирменное ГПТшное кашеобразное зерно, даже не знаю как его описать, что-то вроде компрессии.😞
В целом очень хороший апдейдт, который надо еще апдейтить.👊
Промт в комментах.
Протестировал новинку на своем стресс тесте. Показываю усредненный результат из ~10 круток.
Итого, у новой ГПТшки лучше:
1) C пространственной логикой (ковер должен быть ЗА человеком, лампа НА столе). Банана так и не попала.
2) По тексту — более интересные гарнитуры и точнее к промту.
Что хуже:
1) ГПТшка буквально вклеивала лицо с референса, включая лишний голубой световой рефлекс на голове и ее наклон. Возможно чинится промтом.
2) Самое больное — фирменное ГПТшное кашеобразное зерно, даже не знаю как его описать, что-то вроде компрессии.
В целом очень хороший апдейдт, который надо еще апдейтить.
Промт в комментах.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥98👍39❤23👻3
Ещё про GPT image 2. Думаю все видели смешные всратые азбуки сделанные в 1.5. Подписчик в комментариях поделился новой версией. Меня прям удивило, как он выкрутился с твёрдым и мягким знаком.
3❤241🔥164👍49🤯29👻9🤔5
Стилисты — все? 💅
Народ продолжает исследовать новые возможности GPT Image 2, нашел у Насти промт для девчонок, решил модифицировать под мужичков (делюсь комментах).
Как пользоваться:
1. Включаете Thinking (чтобы он сходил на всякие модные сайты и посмотрел тренды) и вставляете промт.
2. Читаете простыню рекомендаций.
3. Просите нарисовать дашборд.
4. Постфактум можете попросить собрать гардероб с реальными товарами.
Так что если хотите быть самым стильным на районе — пользуйтесь.😊
Народ продолжает исследовать новые возможности GPT Image 2, нашел у Насти промт для девчонок, решил модифицировать под мужичков (делюсь комментах).
Как пользоваться:
1. Включаете Thinking (чтобы он сходил на всякие модные сайты и посмотрел тренды) и вставляете промт.
2. Читаете простыню рекомендаций.
3. Просите нарисовать дашборд.
4. Постфактум можете попросить собрать гардероб с реальными товарами.
Так что если хотите быть самым стильным на районе — пользуйтесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤175👍53🔥43👻12🤯2
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤188👻46😱23🔥20👍12
Media is too big
VIEW IN TELEGRAM
Тестируя новые пайплайны (GPT Image 2 и Seedance 2), экранизировал комикс про Человека-наркомана (посмотрите оригинал) моего друга и товарища Дюрана.
Чего в столе лежать, показываю.
Чего в столе лежать, показываю.
11🔥461❤81👻55👍24😱13🤯3🤔1
Как же хорошо GPT Image 2 умеет в стили. Вот в Твиттере завирусился промт под MS PAINT. А раньше под это лоры делали...
Redraw the attached image in the most clumsy, scribbly, and utterly pathetic way possible. Use a white background, and make it look like it was drawn in MS Paint with a mouse. It should be vaguely similar but also not really, kind of matching but also off in a confusing, awkward way, with that low-quality pixel-by-pixel feel that really emphasizes how ridiculously bad it is. Actually, you know what, whatever, just draw it however you want.3❤225🔥106🤔22👍16👻9🤯1
Новости шумят — Claude массово блокирует пользовательей РФ. Скорей всего излишняя драматизация, хоть и линии по ужесточению от Антропиков есть (с осени 2025 отдельно усиливали региональные ограничения, ID verification в небольшом числе случаев, антифрод механики).
Как бы оно не было:😑 ВСЕГДА ДЕЛАЙТЕ БЭКАП 😑 .
Settings > Privacy > Backup > Export data.
Ну и если вас забанили, пишите в комменты: как оплачивали, какие вэпэны использовали. Попробуем собрать картину и сэйф-лист.
Как бы оно не было:
Settings > Privacy > Backup > Export data.
Ну и если вас забанили, пишите в комменты: как оплачивали, какие вэпэны использовали. Попробуем собрать картину и сэйф-лист.
Please open Telegram to view this post
VIEW IN TELEGRAM
60👍89😱31🔥19❤16🤔8👻8🤯3
👍102❤32🔥30🤔6👻5🤯1
Главная конференция Гуглов уже в 20.00 по МСК.
Что ожидается по нашей теме (с разной степенью вероятности):
1) Самое главное —Veo 4 Google Omni, новая мультимодальная контекстная видео модель. Короче, ala Seedance 2, но в интерфейсе Gemini.
2) Remy / Gemini Spark — ассистент, который болтается с вами 24/7 и помогает решать вопросики.
3) Gemini Desktop Agent — ответ Claude Cowork, позволяет нейронке рулить рабочим столом.
4) Gemini 4 — но это не точно.
5) AI Ultra Lite — новый тариф между Pro ($20) и грабительским Ultra ($250) с увеличенными лимитами.
Ну и всякое по мелочи. Очень интересно, что получится с Омни. Напомню, что в свое время выход Veo 2/3 переврнул игру на рынке видео. Но сейчас это сделал Seedance 2 и любопытно их сравнить.
P.S: Картинка к посту не просто так, мне написали представители гугол и попросили разрешение использовать ковролет в презентации, так что если увидите — скриньте!
Что ожидается по нашей теме (с разной степенью вероятности):
1) Самое главное —
2) Remy / Gemini Spark — ассистент, который болтается с вами 24/7 и помогает решать вопросики.
3) Gemini Desktop Agent — ответ Claude Cowork, позволяет нейронке рулить рабочим столом.
4) Gemini 4 — но это не точно.
5) AI Ultra Lite — новый тариф между Pro ($20) и грабительским Ultra ($250) с увеличенными лимитами.
Ну и всякое по мелочи. Очень интересно, что получится с Омни. Напомню, что в свое время выход Veo 2/3 переврнул игру на рынке видео. Но сейчас это сделал Seedance 2 и любопытно их сравнить.
P.S: Картинка к посту не просто так, мне написали представители гугол и попросили разрешение использовать ковролет в презентации, так что если увидите — скриньте!
2❤108🔥63🤔12🤯7👍5👻3
Собрал выжимку (с помощью ГПТ, хехе) всего самого интересного из презентации гугла в карточке. ✊
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6❤108👍55👻30🔥7🤔3🤯1
Немного выпал из постинга (работал и воскрешал забаненную Инсту). Но вот все интересное за последнее время, коротко — #есливыпропустили.
⌨️ Текст / код
Opus 4.8 — переключаемся. Революции нет, но баги в своём коде пропускает в 4 раза реже, появился ползунок «усилий», думает глубже, работает дольше, цена та же. Anthropic заодно обогнали OpenAI по оценке ($965 млрд) и намекнули на «класс моделей умнее Opus» в ближайшие недели.
📹 Видео
Gemini Omni вы знаете — он вышел. По чистой генерации уступает Сидансу/Клингу, но это в первую очередь редактирующая модель: композ, дубляж с липсинком, нейроренды, образовательные ролики. Можно посмотреть у Метаверсища тесты. Под это и берите. Единственное НО — в Gemini, по крайней мере у меня, постоянно тригерится на лица/людей.
Runway Aleph 2 — в первом, напомню, созданы легендарные мультивселенские генеральские котлы. Улучшили качество и контроль, теперь можно править статичные кадры во встроенной банане/gpt2 — меняется всё видео. По моим тестам норм, но тоже самое делает Seedance 2. Если подписка безлимитная — грех не пользоваться.
🎧 Звук
По Suno прилетело с двух сторон. ElevenLabs Music v2 меняет жанр посреди трека и собирает песню по кускам (цены срезали вдвое). Stable Audio 3.0 — открытые веса, треки до 6:20, крутятся на устройстве без GPU.
Проигрывают Суньчанскому, но у 11Labs есть полезное — возможность точно задавать хрон, что для коротких форматов (рекламы и т.д) очень хорошо.
🎨 Картинки
У🍌 Нанабананы 🍌 небольшой апгрейд — теперь она принимает видео на вход: понимает, что в кадре, и делает из этого картинки — слайды, иллюстрации, комиксы, мемы, etc.
У Krea вышла K2 — своя модель с акцентом на стили, метят в убийцы Midjourney. Для художников и абстракции норм, но стилевые возможности у Миджорни всё равно мощнее.
🌍 Большая картина
Раскол! Папа Лев XIV выпустил первую энциклику про ИИ (неравенство, труд, автоматизация войны), презентовал вместе с сооснователем Anthropic. А Белый дом ровно тогда отложил указ о проверке безопасности моделей — прогнулись под Маска и Цукерберга «чтобы не отстать от Китая». Папа за тормоза, Белый дом за газ.
Корень всего —Skynet Mythos, модель Anthropic, которую не выпускают, потому что слишком мощная. Когда такое выпустят (?) в открытую — будет разрыв. Но скорей всего будет кастрированная версия (см первую новость).
И любимое: агентов разных моделей оставили в виртуальном городе на 15 дней. Грок развалил свой за 4 дня (поджоги, вымирание), у Gemini — 683 преступления и парочка агентов сожгла город. А Claude в одиночку сидел писал конституции — ноль преступлений. Но в смешанном городе и он начал воровать. Все как у людей.
В последнее время думаю, что теории симуляции не такие уж и безумные.
Такие пироги🫡 .
Opus 4.8 — переключаемся. Революции нет, но баги в своём коде пропускает в 4 раза реже, появился ползунок «усилий», думает глубже, работает дольше, цена та же. Anthropic заодно обогнали OpenAI по оценке ($965 млрд) и намекнули на «класс моделей умнее Opus» в ближайшие недели.
Gemini Omni вы знаете — он вышел. По чистой генерации уступает Сидансу/Клингу, но это в первую очередь редактирующая модель: композ, дубляж с липсинком, нейроренды, образовательные ролики. Можно посмотреть у Метаверсища тесты. Под это и берите. Единственное НО — в Gemini, по крайней мере у меня, постоянно тригерится на лица/людей.
Runway Aleph 2 — в первом, напомню, созданы легендарные мультивселенские генеральские котлы. Улучшили качество и контроль, теперь можно править статичные кадры во встроенной банане/gpt2 — меняется всё видео. По моим тестам норм, но тоже самое делает Seedance 2. Если подписка безлимитная — грех не пользоваться.
По Suno прилетело с двух сторон. ElevenLabs Music v2 меняет жанр посреди трека и собирает песню по кускам (цены срезали вдвое). Stable Audio 3.0 — открытые веса, треки до 6:20, крутятся на устройстве без GPU.
Проигрывают Суньчанскому, но у 11Labs есть полезное — возможность точно задавать хрон, что для коротких форматов (рекламы и т.д) очень хорошо.
У
У Krea вышла K2 — своя модель с акцентом на стили, метят в убийцы Midjourney. Для художников и абстракции норм, но стилевые возможности у Миджорни всё равно мощнее.
Раскол! Папа Лев XIV выпустил первую энциклику про ИИ (неравенство, труд, автоматизация войны), презентовал вместе с сооснователем Anthropic. А Белый дом ровно тогда отложил указ о проверке безопасности моделей — прогнулись под Маска и Цукерберга «чтобы не отстать от Китая». Папа за тормоза, Белый дом за газ.
Корень всего —
И любимое: агентов разных моделей оставили в виртуальном городе на 15 дней. Грок развалил свой за 4 дня (поджоги, вымирание), у Gemini — 683 преступления и парочка агентов сожгла город. А Claude в одиночку сидел писал конституции — ноль преступлений. Но в смешанном городе и он начал воровать. Все как у людей.
В последнее время думаю, что теории симуляции не такие уж и безумные.
Такие пироги
Please open Telegram to view this post
VIEW IN TELEGRAM
❤103🔥43👻19👍14🤔8