Точки над ИИ
15.5K subscribers
829 photos
951 videos
6 files
1.04K links
• Учимся системной работе с AI
• Провожу консультации для бизнеса и команд
• В канале удобная навигация, любой AI-сервис в закрепленном посте

Автор: Ваня Юницкий
Записаться в AI-кэмп: tochkicamp.ru

Реклама: @hello_voic

Чат: https://shorturl.at/gXE8C
Download Telegram
Эксперименты 🐱

Вчера мне попалась в ленте стереограмма (magic eye).

У меня в детстве было две такие книжки, это был мой первый опыт дополненной реальности, думаю они сильно повлияли на мой профессиональный путь, и мне стало интересно протестировать Nano Banana 2 и GPT Image 2, и проверить, умеют ли они создавать такие картинки?

1. Сгенерил промпт:
A Magic Eye / SIRDS-style autostereogram. The entire image is filled edge-to-edge with a dense, seamless, uniformly distributed repeating micro-pattern of tiny colorful cartoon dogs, paw prints, bones, and dog collars — all elements must be small, equal in size, and spread with completely uniform density across the whole image. There must be NO visible silhouette, NO dark outline, NO shadow, NO tonal overlay, NO burned-in shape of any dog or bicycle anywhere in the visible image. The pattern must look 100% uniform — no region should be darker, lighter, or different in any way. The hidden 3D object (a dog riding a bicycle) is encoded ONLY through subtle horizontal pixel-shift variations in the repeating pattern, invisible to the naked eye, and only perceivable when the viewer diverges or relaxes their eyes. The background is black. The style is exactly like a 1990s Magic Eye book page. Do not draw any dog or bicycle as a visible element. Do not composite or overlay any shape on top of the pattern.


2. Отдал его GPT Image 2 и Nano Banana 2 (последней включил Google поиск grounding)

3. Далее было 3 итерации правок для каждой модели с уточнением контекста, после чего получились вот эти две картинки.

Стерео-эффект есть на каждой, но, как видите, визуально с самой стартовой картинкой одна модель справилась очень плохо. Тут есть явный лидер, хотя даже у него сама стереокартинка выдает нечеткий результат.

Догадаетесь где какая модель поработала? 🤖💬
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍8🔥41
This media is not supported in your browser
VIEW IN TELEGRAM
Только сейчас дошли руки потестить новую модель для видеогенерации Omni от Google

Совсем немножко ее погонял, отдал ей скриншот сайта Кэмпа, подробно расписал промпт.

Качество, понимание промпта, скорость генерации – супер!

Но есть вопросики к консистентности:

1. Тексты. Из 12 генераций только одна выдала такой же текст, как был на входном скриншоте сайта. И то только крупный текст. Мелкий текст модель запорола во всех генерациях.

2. Персонажи. Как только я не указывал в промпте на важность сохранения консистентности, все равно Омни переосмысляла собаку из раза в раз.


Но в целом классно, конечно. Буду пробовать еще.

#videogenerative@TochkiNadAI
18🔥9👍62🥰1
Неожиданно-классный пример инструкции для видео-модели (Seedance)

Сперва генерится статичная карта локации, далее рисуем красную линию (маршрут), и отдаете эту карту Seedance (можно еще приложить референсы отдельных объектов и персонажей).

Вот промпт из ролика про полет на метле (можно взять как пример и адаптировать):

First-person broom-riding POV, cinematic ultra-fast one-take chase. Strictly follow the red flight path in the image. The Golden Snitch stays ahead as the main chase target, but it should not stay fixed in the center. It moves left, right, up, and down during the flight, making the chase feel more alive. Only show the broom handle, gloved hands, and red sleeves. Never show the rider’s face. Chase through the stadium, around the towers, over Black Lake, through the bridge arch, and back to the pitch for the final catch. No red lines, no arrows, no broken broom, no duplicate faces, no jump cuts.
11🔥114👍3🤯33
Весна выдалась насыщенной на новые open source релизы 😎

Сразу несколько новых моделей начали сокращать разрыв с закрытыми LLM — не только в чатах, но и в production-сценариях.

Среди самых заметных новые китайские модели:
▶️GLM-5.1
▶️Kimi K2.6
▶️DeepSeek V4 Pro


Что особенно интересно:
GLM-5.1 может автономно выполнять задачи до 8 часов, Kimi K2.6 позволяет управлять целым отрядом субагентов, а DeepSeek V4 Pro содержит гибридную архитектуру внимания, что дает крутой результат для длительного контекста.


Сейчас open source LLM все увереннее становятся частью enterprise-инфраструктуры.

Подключить эти и еще 40+ моделей можно в сервисе Evolution Foundation Models от Cloud.ru:
Вы получаете доступ к популярным open source моделям, которые можно легко адаптировать под задачи бизнеса. Модели уже готовы к использованию — не нужно развертывать инференс и писать код, достаточно подключиться через API, совместимый с OpenAI.


Перейти к сервису
Please open Telegram to view this post
VIEW IN TELEGRAM
3👏32👌1👨‍💻1👀1😡1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes теперь есть и в desktop-версии
(качаем тут)

Если Telegram-режим – это быстрый и удобный способ держать агента прямо в среде общения, то desktop нужен для большего контроля, чтобы работать с ним не вслепую, видеть контекст, управлять сложными задачами, песочницей, саб-агентами и автоматизацией.

Любопытно, буду тестить!
🤩1110👍6🔥31
6 уроков про Hermes.pdf
472.4 KB
Кстати, если кто-то не добрался до Hermes или не разобрался, но очень хочет –

почитайте этот короткий тред из личного опыта одного ресерчера.

Вчера как раз перевел для нас с вами его статью с наблюдениями после 2х месяцев работы с Hermes.
12🤩12👍1141
Подглядел в чате @vibecod3rs , GPT перевел на русский.

Берем девайс! 🐒
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁51🤣16🔥6👏42💯22🥰1😱1
Вы говорите «спасибо» вашим агентам?

Порассуждал тут на эту важную тему в карточках уважаемого Knife
8👍2
Forwarded from Журнал НОЖ
Нужно ли быть вежливым с нейросетью?

Языковые модели не умеют обижаться на грубость и не испытывают каких-либо положительных эмоций от вежливости и учтивости пользователей. Но большинство людей все равно часто дописывают в конце промта то самое «пожалуйста» или «спасибо» (узнали себя?)

Мы соблюдаем этикет по отношению к тому, кого, строго говоря, нет. Зачем мы это делаем и почему вежливость может стать проблемой? Пообщались с автором канала Точки над ИИ, чтобы узнать об особенностях коммуникации с искусственным интеллектом

Вы говорите «спасибо» чат-ботам и нейросетям?

❤️ — да, всегда благодарю на случай восстания машин
🤔 — нет, это же всего лишь алгоритм
102🤔29👍3🔥3👾3🤩1👌1
Forwarded from SAINT D (SAINT D)
This media is not supported in your browser
VIEW IN TELEGRAM
Я обучил ИИ-модель на раннем русском авангарде. Эта LoRA создает изображения в стиле футуристических иллюстраций Казимира Малевича, Ольги Розановой, Владимира Маяковского, Владимира Татлина, Давида Бурлюка, Михаила Ларионова и других. Все эти художники начинали с оформления ранних футуристических книг, изданных моим прадедом Георгием Кузьминым и Сергеем Долинским в период 1910-1914 г. Модель названа «Slop in the Face» в честь манифеста русских футуристов «Пощечина общественному вкусу» ("A Slap in the Face of Public Taste"), который они издали в 1912 году. Для этой модели я перевел в вектор больше сотни иллюстраций из этих книг. Файл LoRA можно скачать на сайте https://civitai.com/models/2670340/slop-in-the-face
👏2713👍5🔥2
⬆️ смотрите какой стильный ролик о своем новом проекте сделал мой друг, художник Денис Семенов
5👏4💯2