This media is not supported in your browser
VIEW IN TELEGRAM
Если вы еще не устали от бесконечных агрегаторов генерации картинок и видео – вот вам еще один.
Название у ребят не самое удачное, так как теряется в бесконечной выдаче Grok Imagine, а платформа называется ImagineArt.
Внутри все привычные инструменты редактирования и известные модели – Flux, Imagen-3, Nano Banana, Cream v4, пользовательские модели и еще у них есть две свои – ImagineArt 1.0/1.5.
Кроме генерации есть раздел с разными аппами и креативными воркфлоу, которые можно применять на свои процессы.
На старте дают 100 кредитов, это примерно 4 картинки в предыдущей банане и 10-20 картинок на ImagineArt-модели.
Тестим тут
#imageGenerative@TochkiNadAI #creative@TochkiNadAI
Название у ребят не самое удачное, так как теряется в бесконечной выдаче Grok Imagine, а платформа называется ImagineArt.
Внутри все привычные инструменты редактирования и известные модели – Flux, Imagen-3, Nano Banana, Cream v4, пользовательские модели и еще у них есть две свои – ImagineArt 1.0/1.5.
Кроме генерации есть раздел с разными аппами и креативными воркфлоу, которые можно применять на свои процессы.
На старте дают 100 кредитов, это примерно 4 картинки в предыдущей банане и 10-20 картинок на ImagineArt-модели.
Тестим тут
#imageGenerative@TochkiNadAI #creative@TochkiNadAI
❤9👍6🔥4✍1 1
Обожаю закидывать в NotebookLM статьи, гайды, исследования.
Например, в режиме "инфографики" можно делать первое касание с материалом, а иногда даже сразу получить нужную инфу. Потом можно продолжить в режиме "презентации", чтоб прям совсем подробно.
Ну и мне нравится просто общаться с источниками в окне чата.
В примере инфографика по мотивам промпт-гайда по GPT-5.1.
#productivity@TochkiNadAI #prompt@TochkiNadAI
Например, в режиме "инфографики" можно делать первое касание с материалом, а иногда даже сразу получить нужную инфу. Потом можно продолжить в режиме "презентации", чтоб прям совсем подробно.
Ну и мне нравится просто общаться с источниками в окне чата.
В примере инфографика по мотивам промпт-гайда по GPT-5.1.
#productivity@TochkiNadAI #prompt@TochkiNadAI
1💯18👍15❤10
This media is not supported in your browser
VIEW IN TELEGRAM
Давно не было про Сору.
А там, между прочим, появились стили.
Теперь вы можете применять встроенные пресеты, чтобы менять внешний вид и атмосферу ваших видео.
Нажимаете Styles и выбираете нужный шаблон: селфи, аниме, новости, винтаж.
Забавно, что этот реф начинается со стиля, очень похожего на то, что я делал в своем космическом сериале.
На сериал я подзабил, так что до сих пор непонятно чем там все закончилось. Мне кажется, этих двоих в итоге поглотила черная дыра🚬
#videoGenerative@TochkiNadAI
А там, между прочим, появились стили.
Теперь вы можете применять встроенные пресеты, чтобы менять внешний вид и атмосферу ваших видео.
Нажимаете Styles и выбираете нужный шаблон: селфи, аниме, новости, винтаж.
Забавно, что этот реф начинается со стиля, очень похожего на то, что я делал в своем космическом сериале.
На сериал я подзабил, так что до сих пор непонятно чем там все закончилось. Мне кажется, этих двоих в итоге поглотила черная дыра
#videoGenerative@TochkiNadAI
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥5 3
Код, который сам пишет себе документацию
Google недавно выкатили Code Wiki
Инструмент, который превращает любой репозиторий в живую, постоянно обновляемую вики по коду.
Gemini шуршит в проекте, строит структуру, генерирует описания модулей, классов, функций, рисует архитектурные, последовательностные и dependency-диаграммы и после каждого коммита все это автоматически актуализирует.
Плюс внутри есть чат на Gemini, можно спрашивать и получать ответы с привязкой к вашему коду.
По сути, это NotebookLM для кода: берет репозиторий и делает из него живой учебник и навигатор по проекту.
Тестим тут
#productivity@TochkiNadAI #coding@TochkiNadAI
Google недавно выкатили Code Wiki
Инструмент, который превращает любой репозиторий в живую, постоянно обновляемую вики по коду.
Gemini шуршит в проекте, строит структуру, генерирует описания модулей, классов, функций, рисует архитектурные, последовательностные и dependency-диаграммы и после каждого коммита все это автоматически актуализирует.
Плюс внутри есть чат на Gemini, можно спрашивать и получать ответы с привязкой к вашему коду.
По сути, это NotebookLM для кода: берет репозиторий и делает из него живой учебник и навигатор по проекту.
Тестим тут
#productivity@TochkiNadAI #coding@TochkiNadAI
❤14⚡8👍4✍2
This media is not supported in your browser
VIEW IN TELEGRAM
На Маркете появился ИИ-агент. Конечно, я не удержался и протестировал его
Но! Вместо обычной просьбы "подбери подарок другу" я решил закрутить задачу посложнее. Дал ему ту самую классическую головоломку про родственные связи: когда нужно вычислить, кто кому приходится.
Удивительно, но многие модели до сих пор валятся на таких простых, казалось бы, задачках. ИИ-агент справился уверенно. Правильно вычислил персонажа и сразу предложил варианты подарков. В моем случае — получилась подходящая подборка шпионских подарков для моей гипотетической внучки😁
Но! Вместо обычной просьбы "подбери подарок другу" я решил закрутить задачу посложнее. Дал ему ту самую классическую головоломку про родственные связи: когда нужно вычислить, кто кому приходится.
Удивительно, но многие модели до сих пор валятся на таких простых, казалось бы, задачках. ИИ-агент справился уверенно. Правильно вычислил персонажа и сразу предложил варианты подарков. В моем случае — получилась подходящая подборка шпионских подарков для моей гипотетической внучки
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27❤9🔥4🤝2 1
This media is not supported in your browser
VIEW IN TELEGRAM
Рубрика: ваши проекты.
(может нужна нам такая, как думаете?😏 )
Классный кейс для повседневного использования.
Сергей прислал в чат, как он собирает для себя интерактивные учебники в Gemini 3.
Конкретно этот про этапы AI-native разработки, с тестами и пояснениями.
Потестить можно тут.
(может нужна нам такая, как думаете?
Классный кейс для повседневного использования.
Сергей прислал в чат, как он собирает для себя интерактивные учебники в Gemini 3.
Конкретно этот про этапы AI-native разработки, с тестами и пояснениями.
Потестить можно тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15💯5❤3 3
This media is not supported in your browser
VIEW IN TELEGRAM
А вот легендарный апскейлер Topaz Labs теперь доступен в ComfyUI
(вообще странно, что только сейчас)
Видео апскейл 4K
- Astra: Diffusion Creative Upscale
- Starlight Fast: Диффузионный точный апскейл
- Аполлон: интерполяция кадров
Улучшение изображения 8K
- Bloom: увеличение изображения и улучшение лица
Ну а до 4K мне нравится апскейлить в новой Банане. Тем более гугл насыпал 300$ кредитов.
Пробовать тут.
Подробнее тут.
#imageEditing@TochkiNadAI #videoEditing@TochkiNadAI
(вообще странно, что только сейчас)
Видео апскейл 4K
- Astra: Diffusion Creative Upscale
- Starlight Fast: Диффузионный точный апскейл
- Аполлон: интерполяция кадров
Улучшение изображения 8K
- Bloom: увеличение изображения и улучшение лица
Ну а до 4K мне нравится апскейлить в новой Банане. Тем более гугл насыпал 300$ кредитов.
Пробовать тут.
Подробнее тут.
#imageEditing@TochkiNadAI #videoEditing@TochkiNadAI
❤13👍8🔥6 3
This media is not supported in your browser
VIEW IN TELEGRAM
У LTX появилась новая фича – Retake.
Она про пересмотр отдельных кадров после того, как они уже созданы. Причем это и про реальные кадры съемок и про сгенерированные видео.
Можно перефразировать диалоги, переосмыслять эмоции или действия и переосмыслять моменты, не переделывая всю сцену целиком.
Кстати, обратите внимание, как LTX начали становиться похожими на Хиггсфилд в подаче обновлений🐹
#videoEditing@TochkiNadAI
Она про пересмотр отдельных кадров после того, как они уже созданы. Причем это и про реальные кадры съемок и про сгенерированные видео.
Можно перефразировать диалоги, переосмыслять эмоции или действия и переосмыслять моменты, не переделывая всю сцену целиком.
Кстати, обратите внимание, как LTX начали становиться похожими на Хиггсфилд в подаче обновлений
#videoEditing@TochkiNadAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19 10❤6🔥1💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Не знаю как вас, а меня пугает ветка развития антропоморфных роботов.
Автоматизация рутинных дел и ,как следствие, потеря работы для некоторых профессий – это меньшее из зол.
Военная отрасль, силовые ведомства – вот где развернется настоящий киберпанк, вот где становится неуютно💀
Ну а на видео двуногий робот MagicLab Z1, теперь он крутит сальто и восстанавливается после падений с человеческой скоростью.
Автоматизация рутинных дел и ,как следствие, потеря работы для некоторых профессий – это меньшее из зол.
Военная отрасль, силовые ведомства – вот где развернется настоящий киберпанк, вот где становится неуютно
Ну а на видео двуногий робот MagicLab Z1, теперь он крутит сальто и восстанавливается после падений с человеческой скоростью.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯24 13🤯6👍3❤1👎1🔥1
Media is too big
VIEW IN TELEGRAM
ИИ кино.
Kavan Cardozaснимает генерит довольно качественный стаф. Это один из эпизодов его работ, вот тут можно посмотреть остальные.
Смотрел бы я полный метр такого кино? Скорее пока нет. Не нашлось пока что сюжета, который поглотил бы настолько, что мне было бы интересно смотреть 2 часа сгенерированной истории. Но зато я прекрасно представляю себе подобные работы в рамках всяких Блэк Миррор и Любовь, смерть Роботах. Ну и в качестве игровых сюжетных вставок.
Много слышу споров (вы, наверняка, тоже), о том, будет ли ИИ-реклама / кино востребованным. Замечаю, что особенно увлеченно спорит сторона, чей бизнес / проекты завязаны на классический продакшен. Часто вижу за аргументами подсознательную защиту / страх нового / потерю контроля, абсолютно понимаю этих людей.
Еще есть популярное мнение о том, что ИИ-контент станет уделом "бедных" компаний, а классический продакшен будет подчеркивать статус бренда.
Лично я считаю, что классический продакшен практически не будет существовать без связи с ИИ. Это логично, так как есть масса инструментов, которые упрощают процесс на разных этапах, позволяют создавать быстрее и дешевле в формате комбинированных съемок, все, от раскадровок до монтажа, работы со светом, мокапы и т.д.
Не нужно бояться, но и не стоит закрываться. Использование ИИ в продакшене – это далеко не всегда про full-generative.
Kavan Cardoza
Смотрел бы я полный метр такого кино? Скорее пока нет. Не нашлось пока что сюжета, который поглотил бы настолько, что мне было бы интересно смотреть 2 часа сгенерированной истории. Но зато я прекрасно представляю себе подобные работы в рамках всяких Блэк Миррор и Любовь, смерть Роботах. Ну и в качестве игровых сюжетных вставок.
Много слышу споров (вы, наверняка, тоже), о том, будет ли ИИ-реклама / кино востребованным. Замечаю, что особенно увлеченно спорит сторона, чей бизнес / проекты завязаны на классический продакшен. Часто вижу за аргументами подсознательную защиту / страх нового / потерю контроля, абсолютно понимаю этих людей.
Еще есть популярное мнение о том, что ИИ-контент станет уделом "бедных" компаний, а классический продакшен будет подчеркивать статус бренда.
Лично я считаю, что классический продакшен практически не будет существовать без связи с ИИ. Это логично, так как есть масса инструментов, которые упрощают процесс на разных этапах, позволяют создавать быстрее и дешевле в формате комбинированных съемок, все, от раскадровок до монтажа, работы со светом, мокапы и т.д.
Не нужно бояться, но и не стоит закрываться. Использование ИИ в продакшене – это далеко не всегда про full-generative.
2👍18💯6❤4 2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Друзья, бежим срочно в Kimi
Там в Slides завезли Нану Банану Про бесплатно до конца выходных. Я сейчас генерю, как раз:
Сперва он генерит структуру, показывает вам все в текстовом виде с разделением на слайды.
Далее выбираете стиль (нужно выбрать первый, это и будет новая Банана).
Потом смотрите в течение 5 минут загрузочную анимацию на китайском, и редактор начнет вам показывать по 1-2 слайда по мере готовности (это, кстати, клево, для сдвгшников – рай).
Генерит со скоростью чуть дольше, чем Банана Про 4K в AI Studio.
Так как итоговая преза сгенерится цельными картинками с текстом на них – Kimi даст вам редактировать, но поверх презы.
Энджой!
#presentation@TochkiNadAI
Там в Slides завезли Нану Банану Про бесплатно до конца выходных. Я сейчас генерю, как раз:
Сперва он генерит структуру, показывает вам все в текстовом виде с разделением на слайды.
Далее выбираете стиль (нужно выбрать первый, это и будет новая Банана).
Потом смотрите в течение 5 минут загрузочную анимацию на китайском, и редактор начнет вам показывать по 1-2 слайда по мере готовности (это, кстати, клево, для сдвгшников – рай).
Генерит со скоростью чуть дольше, чем Банана Про 4K в AI Studio.
Так как итоговая преза сгенерится цельными картинками с текстом на них – Kimi даст вам редактировать, но поверх презы.
Энджой!
#presentation@TochkiNadAI
👍16🔥5🤩3 3❤2
А видели как клево новый Gemini умеет в юмор?
Помню, еще полгода назад SOTA-модели очень плохо умели шутить.
Для контекста: сегодня один клуб креативных директоров, за чатиком которого я подглядываю, собрался на встречу-тусовку в сеттинге тайных сообществ.
Так как я живу аж в другом полушарии – могу только картинки генерить, вместо встреч. Иду в Gemini+Banana.
Промпт супер простой:
И вот он выдал это.
Обратите внимание, как он хорошо подружил несколько слоев – стайл Википедии, тематику тайных орденов и внутрянку топик-тем и шуток рекламной индустрии, и собрал все это в складную историю.
Но главное – как он красиво закончил описание идолом ИИ-генерации. К слову, в этом же чатике нередко разворачиваются обжигающие споры о том – отнимет/не отнимет ИИ работу, клиентов и душу у рекламной отрасли🐶
Помню, еще полгода назад SOTA-модели очень плохо умели шутить.
Для контекста: сегодня один клуб креативных директоров, за чатиком которого я подглядываю, собрался на встречу-тусовку в сеттинге тайных сообществ.
Так как я живу аж в другом полушарии – могу только картинки генерить, вместо встреч. Иду в Gemini+Banana.
Промпт супер простой:
сгенери страницу в стиле Википедии с юмором на тематику про тайный орден рекламщиков, (название отсылает к тендерам)И вот он выдал это.
Обратите внимание, как он хорошо подружил несколько слоев – стайл Википедии, тематику тайных орденов и внутрянку топик-тем и шуток рекламной индустрии, и собрал все это в складную историю.
Но главное – как он красиво закончил описание идолом ИИ-генерации. К слову, в этом же чатике нередко разворачиваются обжигающие споры о том – отнимет/не отнимет ИИ работу, клиентов и душу у рекламной отрасли
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤30😁20🔥8 4👍3🤯1
Робот сочинит симфонию?
В Штатах обновили правила по AI-патентам. Наконец решили буквой закона вечный спор.
Теперь будет так. Если идею придумал человек, даже с помощью AI, патент принадлежит ему. AI считается не соавтором, а просто инструментом.
Патентуют не промпт, а изобретение. Раньше, при предыдущей версии правил, USPTO требовало анализировать, внес ли человек значительный вклад в каждый пункт формулы изобретения через критерии, определнные регламентом.
Сейчас эта схема в прошлом. Если человек сам сформулировал идею, не важно, пользовался он генеративным AI или нет.
В Штатах обновили правила по AI-патентам. Наконец решили буквой закона вечный спор.
Теперь будет так. Если идею придумал человек, даже с помощью AI, патент принадлежит ему. AI считается не соавтором, а просто инструментом.
Патентуют не промпт, а изобретение. Раньше, при предыдущей версии правил, USPTO требовало анализировать, внес ли человек значительный вклад в каждый пункт формулы изобретения через критерии, определнные регламентом.
Сейчас эта схема в прошлом. Если человек сам сформулировал идею, не важно, пользовался он генеративным AI или нет.
👍27🔥12❤4
This media is not supported in your browser
VIEW IN TELEGRAM
Manus Browser - еще один браузер с агентами
Напомню что это.
Это когда агенту на базе LLM дают доступ к браузеру со всеми логинами, куками и вкладками. Он двигает мышкой, скроллит, кликает кнопки, заполняет формы и собирает данные так, как сделал бы живой ассистент.
Плюс работает с теми же платными инструментами, что и вы: CRM, SEO-панели, рекламные кабинеты, личные кабинеты маркетплейсов, он заходит в уже авторизованные сессии или просит вас где нужно авторизоваться.
Я писал про свой опыт использования таких браузеров от OpenAI и Perplexity.
Сейчас использую только Comet.
Manus же обещают одноразовую авторизацию под задачу, лог всех действий и отсутствие отдельного хранения паролей, агент пользуется тем, что уже есть в профиле.
Но здравый смысл никто не отменял: критичные штуки вроде банков, root-аккаунтов облаков лучше держать в отдельном профиле или вообще другом браузере, а самому Manus отдавать рутину уровня CRM, отчетов и ресерча.
Устанавливаем тут.
#browser@TochkiNadAI #Agents@TochkiNadAI
Напомню что это.
Это когда агенту на базе LLM дают доступ к браузеру со всеми логинами, куками и вкладками. Он двигает мышкой, скроллит, кликает кнопки, заполняет формы и собирает данные так, как сделал бы живой ассистент.
Плюс работает с теми же платными инструментами, что и вы: CRM, SEO-панели, рекламные кабинеты, личные кабинеты маркетплейсов, он заходит в уже авторизованные сессии или просит вас где нужно авторизоваться.
Я писал про свой опыт использования таких браузеров от OpenAI и Perplexity.
Сейчас использую только Comet.
Manus же обещают одноразовую авторизацию под задачу, лог всех действий и отсутствие отдельного хранения паролей, агент пользуется тем, что уже есть в профиле.
Но здравый смысл никто не отменял: критичные штуки вроде банков, root-аккаунтов облаков лучше держать в отдельном профиле или вообще другом браузере, а самому Manus отдавать рутину уровня CRM, отчетов и ресерча.
Устанавливаем тут.
#browser@TochkiNadAI #Agents@TochkiNadAI
❤17👍8🔥2👎1😁1 1
This media is not supported in your browser
VIEW IN TELEGRAM
Люблю когда так оформляют итерации пайплайна.
Тут: Nano Banana Pro → Qwen Edit → Veo 3
Тут: Nano Banana Pro → Qwen Edit → Veo 3
👍26🔥13❤8😍3✍2 1
А что у нас тут? А это новый Gen-4.5 от Runway!
Качество подросло, теперь генерится более кинематографичное движение и свет, объекты и персонажи двигаются с естественным весом, реалистично реагируют на свет, отражения и тени. Это особенно заметно в сценах с динамикой, жидкостью и сложной физикой.
Модель точнее откликается на промпт и мультимодальные запросы.
По внутренним тестам (хехе) Gen-4.5 обходит другие модели в text-to-video и делает это без потери скорости или роста затрат.
#videoGenerative@TochkiNadAI
Качество подросло, теперь генерится более кинематографичное движение и свет, объекты и персонажи двигаются с естественным весом, реалистично реагируют на свет, отражения и тени. Это особенно заметно в сценах с динамикой, жидкостью и сложной физикой.
Модель точнее откликается на промпт и мультимодальные запросы.
По внутренним тестам (хехе) Gen-4.5 обходит другие модели в text-to-video и делает это без потери скорости или роста затрат.
#videoGenerative@TochkiNadAI
🔥10👍5🎉3❤1 1
Небольшой гайд по API Gemini 3
Главные новые ручки в API две:
thinking_level и media_resolution.
Первая задает, насколько глубоко модель думает:
low – когда нужен просто быстрый и дешевый ответ
high – когда важно качество рассуждений и сложные задачи.
Вторая управляет тем, насколько подробно модель разбирает картинки и видео, можно экономить токены на простом видео или, наоборот, выкрутить качество для слайдов и PDF с мелким текстом.
Показывают примеры вызовов из Python/JS/cURL, работу с инструментами вроде google_search и url_context, а еще thoughtSignature, это скрытые подписи рассуждений, которые надо передавать дальше, чтобы длинные диалоги и function calling не теряли нить.
Отдельно советуют не мудрить с промптами, оставить температуру 1.0 и, если нужен болтливый стиль попросить об этом прямо. Плюс есть раздел, как переехать с Gemini 2.5 и в каких задачах пока логично держать старые модели.
С полным гайдом можно ознакомиться тут.
#LLM@TochkiNadAI #coding@TochkiNadAI
Главные новые ручки в API две:
thinking_level и media_resolution.
Первая задает, насколько глубоко модель думает:
low – когда нужен просто быстрый и дешевый ответ
high – когда важно качество рассуждений и сложные задачи.
Вторая управляет тем, насколько подробно модель разбирает картинки и видео, можно экономить токены на простом видео или, наоборот, выкрутить качество для слайдов и PDF с мелким текстом.
Показывают примеры вызовов из Python/JS/cURL, работу с инструментами вроде google_search и url_context, а еще thoughtSignature, это скрытые подписи рассуждений, которые надо передавать дальше, чтобы длинные диалоги и function calling не теряли нить.
Отдельно советуют не мудрить с промптами, оставить температуру 1.0 и, если нужен болтливый стиль попросить об этом прямо. Плюс есть раздел, как переехать с Gemini 2.5 и в каких задачах пока логично держать старые модели.
С полным гайдом можно ознакомиться тут.
#LLM@TochkiNadAI #coding@TochkiNadAI
👍13🔥4❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Вот для вдохновения еще один вайбкод-проект на Gemini 3.
Очень симпатичный нодовый интерфейс. Даже не верится, что все это выдает одна модель.
Очень симпатичный нодовый интерфейс. Даже не верится, что все это выдает одна модель.
👍18🔥8❤3🤩2
Преступлением было бы не упомянуть новую модель от Kling, О1
O1 теперь умеет:
– удалять и заменять объекты в видео
– менять освещение, фон, погоду
– синхронить все с камерой и движением объектов
– генерить в Full HD
Гайд тут.
#imageEditing@TochkiNadAI
O1 теперь умеет:
– удалять и заменять объекты в видео
– менять освещение, фон, погоду
– синхронить все с камерой и движением объектов
– генерить в Full HD
Гайд тут.
#imageEditing@TochkiNadAI
❤11🔥5👍4