Модель пока в закрытой бете — записаться на ранний доступ можно тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥12❤8🤪5👎2🌚1
Судя по отзывам, лимиты не очень большие — до 4 генераций в сутки.
В первую очередь сервис предназначен для разработчиков, которые хотят протестировать модель перед внедрением в свои продукты — API теперь тоже открыт для всех.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤8❤🔥7🔥3👌1
o4-mini также будет доступна бесплатно.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25❤17🔥8😁3🤯3👌2🕊2❤🔥1
Аналогичные переговоры стартап сейчас ведет с Samsung, детали обсуждаются. Perplexity может стать ассистентом по умолчанию или просто предустанавливаться на смартфоны корейской компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤26👍7🔥6👀4😁2
А еще Perplexity повесили плакат напротив офиса Яндекса в Белграде со словами:
«Величие нельзя клонировать. Его нужно создавать»😁
В команде Perplexity, кстати, много бывших Яндексоидов и стартап продолжает активно их хантить.
«Величие нельзя клонировать. Его нужно создавать»
В команде Perplexity, кстати, много бывших Яндексоидов и стартап продолжает активно их хантить.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁53👍15🔥11😭6❤5💯4👌3❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Пользователь в любой момент может посмотреть, что Grok знает о нем, и попросить «забыть» какую-то информацию.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23👍11😁7👀2😇2👌1
Единственной подобной моделью была Claude Sonnet 3.7, но Gemini 2.5 Flash обходит ее почти во всех бенчмарках при цене в 25 раз ниже.
Как использовать?1️⃣ Перейдите в @GPT4Telegrambot2️⃣ Выберите Gemini 2.5 Flash в разделе /model
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23👍12🔥7😁3👏1🕊1
This media is not supported in your browser
VIEW IN TELEGRAM
🎞 Videohunt.AI — новая нейросеть для создания вирусных видео и хайлайтов длинных роликов.
Можно вставить ссылку на видео прямо из YouTube или Google Диска и попросить ИИ выделить самые интересные моменты или вырезать конкретный отрывок. Кадрирует результат под разные соцсети и создает субтитры (на англ.)
🪐 Попробовать можно здесь — бесплатно можно обработать 60 минут видео.
Можно вставить ссылку на видео прямо из YouTube или Google Диска и попросить ИИ выделить самые интересные моменты или вырезать конкретный отрывок. Кадрирует результат под разные соцсети и создает субтитры (на англ.)
Please open Telegram to view this post
VIEW IN TELEGRAM
❤21👍14😁5👌4🔥3❤🔥1
Media is too big
VIEW IN TELEGRAM
Площадка составляет рейтинг нейросетей на основе слепого голосования пользователей. Начавшись в 2023‑м как исследовательский проект Калифорнийского университета в Беркли, она быстро стала главной витриной для сравнения ИИ‑моделей.
Возможно, LMArena начнет брать плату с разработчиков за представление их моделей в сервисе. При этом платформа останется непредвзятой, настаивает основатель проекта Анастасиос Ангелопулос.
«Арена останется местом, куда любой пользователь Интернета сможет прийти и попробовать пообщаться, использовать ИИ, сравнить разных провайдеров и так далее», — обещает он.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓22👍14❤13😁3👌3❤🔥2
Чип 910C выдает порядка 60% мощности Nvidia H100, на которых, например, построен кластер Colossus компании xAI Илона Маска.
Из-за многолетнего запрета на ввоз в Китай продвинутых чипов Nvidia (а с недавнего времени даже урезанных H20), в Китае возник конкурентный рынок ИИ‑процессоров. Эксперты считают, что «железо» Huawei станет базой для обучения новейших ИИ-моделей в стране. Чипы Huawei, в свою очередь, уже несколько месяцев тестирует DeepSeek.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24❤13❤🔥7😁1
Это не режим отложенных сообщений, а убедительная галлюцинация. В комментариях предполагают, что нейросеть запомнила подобное поведение из диалогов в обучающих данных.
«Вангую: в промпте или системной инструкции было что-то вроде: "Отвечай как фрилансер-копирайтер с десятилетним опытом"», — шутят в реплаях.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁83👍11❤10🔥7🤨2👌1
SICA (Self-Improving Coding Agent) состоит из нескольких под-агентов и базовых нейросетей (основа — Claude 3.5, для сложных рассуждений — o3-mini). SICA создает несколько своих копий, решающих задачу разными способами. Потом находит "лучшую версию себя" и делает ее основной — и так по циклу.
Такой подход позволил улучшить процент успешно решенных случайных задач из бенчмарка SWE Bench Verified с 17% до 53%.
При этом в тестах на математику и науку улучшения минимальные — базовые модели и так в этом хороши, а агент улучшает только инструменты, но не модель в основе.
Самостоятельное дообучение базовой нейросети — следующий этап развития технологии. Но авторы отмечают, что в этом случае нужно значительно усиливать контроль безопасности.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31❤14🔥6❤🔥5🤔2🤯2💘1
Недавно суд признал Google монополистом на рынке веб-поиска — и теперь к августу регуляторы должны определиться с действиями по «оздоровлению рынка». Один из вариантов — заставить Google отказаться от собственного браузера.
В то же время OpenAI уже давно строит планы по созданию собственного ИИ-браузера. Несколько месяцев назад стартап даже нанял нескольких ключевых инженеров, работавших над Google Chrome.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30❤14👎5👍4😁4👌3💘3👏2
This media is not supported in your browser
VIEW IN TELEGRAM
Инженера Microsoft Хулиана Исла мотивировала личная история: в возрасте трех месяцев у его сына начались припадки. Врачам понадобилось 10 месяцев, чтобы поставить верный диагноз — синдром Драве (1 случай на 40 тыс. младенцев). В ходе диагностики из-за ошибочных предположений и неверного лечения ребенку становилось только хуже.
Исла несколько лет прорабатывал идею ранней диагностики болезней с помощью нейросетей. Однажды он написал письмо руководителю — Наделла проникся историей разработчика и быстро предоставил Хулиану и его НКО Foundation ресурсы и связал его с командой Microsoft, занимающейся ИИ в здравоохранении.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28❤20🥰7👌3👎1🔥1😁1
🥈 Мощнейшая модель OpenAI o3 оказалась хуже Gemini 2.5 Pro от Google в рейтинге LMArena.
В слепых сравнениях модели показывают паритет в сложных промптах, математике и кодинге, но o3 уступает Gemini в креативности и следовании инструкциям.
В том же рейтинге o4-mini оказалась ниже Gemini 2.0 Flash (при этом отдельно в математике и сложных промптах она на уровне o3 и Gemini 2.5 Pro), а GPT-4.1 — ниже обновленного DeepSeek v3.
Комментаторы в X разделились: многие соглашаются с тем, что Gemini 2.5 Pro — лучшая модель, при этом некоторые считают рейтинг непрозрачным и неотражающим реальность.
А как вы считаете, какая модель лучше?
🔥 — OpenAI o3
😎 — Gemini 2.5 Pro
В слепых сравнениях модели показывают паритет в сложных промптах, математике и кодинге, но o3 уступает Gemini в креативности и следовании инструкциям.
В том же рейтинге o4-mini оказалась ниже Gemini 2.0 Flash (при этом отдельно в математике и сложных промптах она на уровне o3 и Gemini 2.5 Pro), а GPT-4.1 — ниже обновленного DeepSeek v3.
Комментаторы в X разделились: многие соглашаются с тем, что Gemini 2.5 Pro — лучшая модель, при этом некоторые считают рейтинг непрозрачным и неотражающим реальность.
А как вы считаете, какая модель лучше?
🔥 — OpenAI o3
😎 — Gemini 2.5 Pro
😎76🔥33❤🔥8❤6👍3🤷♂2🎃2👎1🕊1
Иной стратегии у BMW быть не может. В Европе, США и Канаде BMW использует Алексу от Amazon, но в Китае сервис не одобрен. В то же время ведущие китайские автопроизводители уже давно внедряют ИИ.
При этом параллельно BMW создает ИИ-помощника для водителей совместно с Alibaba на базе Qwen.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤45👍12❤🔥6⚡2👌2👎1😁1🍾1👻1
Он работает на базе o4-mini, примерно на 10% слабее максимальной версии, при этом значительно дешевле.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30❤9🔥4😁3👌2
🥇 Российские исследователи нашли способ повысить качество ответов ИИ до 15%, открытие представили вчера на ICLR 2025 в Сингапуре.
Ученые из из T-Bank AI Research предложили новый способ дообучения LLM: модель не только учитывает оценки людей в обучающих данных, но и мнение своей копии, которая периодически обновляется, в соответствии с успехами нейросети.
Новый метод позволяет модели меньше «зацикливаться» на случайных ошибках из датасета и не переносить эти искажения в свои ответы.
В итоге результаты в бенчмарках на общие способности ИИ AlpacaEval 2 и ArenaHard выросли до 15% по сравнению с классическими подходами⤴️ Модели стали отвечать точнее и информативнее, улучшились рассуждения и связность реплик — обычной оптимизацией такого прироста не добиться.
Ученые из из T-Bank AI Research предложили новый способ дообучения LLM: модель не только учитывает оценки людей в обучающих данных, но и мнение своей копии, которая периодически обновляется, в соответствии с успехами нейросети.
Новый метод позволяет модели меньше «зацикливаться» на случайных ошибках из датасета и не переносить эти искажения в свои ответы.
В итоге результаты в бенчмарках на общие способности ИИ AlpacaEval 2 и ArenaHard выросли до 15% по сравнению с классическими подходами
Please open Telegram to view this post
VIEW IN TELEGRAM
❤37👍12🔥7😁4❤🔥1👌1🍾1
Формально авторов даже не обязывают сообщать, что в ленте используются ИИ-технологии, однако при выборе победителя будут учитывать «степень вовлечения человека» в творчество.
В начале года мы рассказывали о скандале вокруг применения ИИ для усиления акцента у Эдриана Броуди в «Бруталисте». Шум, однако, не помешал актеру взять статуэтку за лучшую мужскую роль.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤19👍9👎5🔥3👌3😢1