Для оценки способностей ИИ-моделей им дают специальные тесты — бенчмарки. Они проверяют нейросети в разных областях — от математики до переводов.
С помощью самых сложных бенчмарков специалисты отслеживают, как близки существующие модели к сильному ИИ и оценивают их безопасность.
Исследователи Центра безопасности ИИ и компании Scale AI создали «Последний экзамен человечества» — самый сложный тест, которому когда-либо подвергали искусственный интеллект.
Тест из 3 тыс. вопросов находится в открытом доступе. Его составляли около тысячи ученых (большинство — доктора наук) из 50 стран и разных областей — от аналитической философии до высшей математики и ракетостроения. Авторы 50 лучших вопросов получили по $5 тыс.
❓ Пример вопроса:
У колибри, относящихся к отряду Apodiformes, есть уникальная двусторонняя парная овальная кость (сесамовидная кость), встроенная в каудолатеральную часть расширенного крестообразного апоневроза вставки m. depressor caudae. Сколько парных сухожилий поддерживается этой сесамовидной костью? Ответьте числом.
Экзамен решали шесть ведущих ИИ-моделей: Gemini 2.0 от Google, Claude 3.5 Sonnet от Anthropic, Grok-2 от xAI, GPT-4o и o1 от OpenAI и новая рассуждающая модель DeepSeek-R1 от китайского стартапа. Никто не набрал больше 10%
Самые высокие баллы получили OpenAI-o1 (9,1%) и DeepSeek-R1 (9,4%), но китайская модель не решала часть задач, так как не умеет работать с картинками.
Создатели теста убеждены, что показатели будут быстро расти и к концу 2025 года могут превысить 50%. Возможно, тогда понадобится новый бенчмарк, где ИИ будут задавать вопросы, на которые у людей нет ответов.
Но даже такой мощный ИИ вряд ли станет угрозой ученым-людям, считает один из авторов теста, физик из Беркли Кевин Чжоу. «Есть огромная разница между тем, чтобы сдать тест и быть практикующим физиком или исследователем. Даже ИИ, способный ответить на эти вопросы, может быть не готов помочь в исследованиях, которые менее структурированы», — объясняет он.
Еще по теме:
#бенчмарк #AGI #новости
Please open Telegram to view this post
VIEW IN TELEGRAM
❤176👍97🔥22🌭14🤯7❤🔥6😁5💊4🤗3🫡3
This media is not supported in your browser
VIEW IN TELEGRAM
Разработчик и изобретатель Хоаким Силвейра превратил робот-пылесос Roomba в ИИ-кормушку для своей собаки.
Хоакиму нужно было заменить колесный модуль робота-пылесоса, поэтому он купил похожую старую модель — всего за $7 на онлайн-аукционе. После ремонта он решил превратить лишний пылесос-донор в кое-что новое — «умную» кормушку для своего бультерьера.
«Мозгом» стал одноплатный компьютер Raspberry Pi. В качестве ПО для управления кормушкой Хоаким выбрал Fprime — программную среду, разработанную NASA для управления марсианским дроном Ingenuity. Так появилось название кормушки — «космический пылесос».
Для распознавания пса изобретатель подключил к встроенной в пылесос камере ИИ-модель компьютерного зрения YOLO11. Если камера узнает собаку — срабатывает привод, и робот насыпает питомцу корм из старого бумажного стаканчика. (Силвейра думал напечатать емкость на 3D-принтере, но это увеличило бы стоимость проекта).
Для всех желающих повторить проект Хоаким выложил код в открытый доступ, а на его Youtube-канале можно посмотреть другие его изобретения.
Еще по теме:
#новости #роботы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍95❤57🔥15😁13🤗10🤷8🌭7😍5❤🔥4💘4
Кто создал бесплатного конкурента ChatGPT, действительно ли появление DeepSeek меняет ход ИИ-гонки и что будет дальше? Разбираемся в главной теме недели.
Точно неизвестно. Тренировка V3, на которой основана R1, обошлась в $5,6 млн. Эта сумма не учитывает предварительные запуски и стоимость вычислительного кластера из 2048 карт Nvidia H800.
Компания Wiz обнаружила, что база данных, включающая в том числе историю чатов с DeepSeek, находилась в открытом доступе. «Дыру» оперативно прикрыли.
Илон Маск и CEO Scale AI Александр Ван считают, что у DeepSeek больше серверов GPU — но компания скрывает реальные мощности из-за экспортных ограничений США на чипы. Microsoft предполагает, что DeepSeek могли злоупотреблять использованием API OpenAI при обучении своей модели. Однако доказательств ничему из этого пока нет.
DeepSeek хранит данные в Китае, что тревожит как рядовых пользователей, так и власти США. Сервис подвержен цензуре — на запросы, о внутренней политике КНР нейросеть отвечает далеко не всегда.
С другой стороны, DeepSeek — открытая модель: любой может развернуть ее локально и без ограничений. Так, интегрировал R1 ИИ-поисковик Perplexity — без цензуры и отправки данных в Китай.
📌 Пользоваться DeepSeek-R1 с поиском Perplexity можно в нашем боте!
1️⃣ Перейдите в @GPT4AgentsBot и выберите команду /deepseek
2️⃣ Нажмите🔘 Активировать
50 запросов в день входят в подписку «Премиум Макс».
🔜 Что будет дальше?
В ближайшие недели OpenAI откроет доступ к o3-mini — этот шаг наверняка укрепит позицию компании.
Однако теперь вопрос не в том, смогут ли китайские стартапы натренировать конкурента o3-mini или даже полноценной o3, а как скоро они это сделают?
Так все же, какой сервис сегодня лучший?
❤️ — ChatGPT
🐳 — DeepSeek
🔥 — Другой: Gemini, Claude…
#новости #DeepSeek #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳605❤513👍86🔥51👻9🤷9🌭6🤓6💊5🌚3
OpenAI выпустили в общий доступ свою модель o3-mini, анонсированную в конце прошлого года.
Ключевые особенности:
«Другими словами, она быстрая, дешевая, умная и разработана, чтобы сокрушить DeepSeek», — пишет об o3-mini Wired.
#OpenAI #o3 #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
❤134👍84😁18❤🔥12🔥6🎉4💋4🗿3🍓2💘2
Историк и футуролог Юваль Ной Харари в недавнем интервью рассказал, почему считает искусственный интеллект способным к творчеству и что отличает ИИ от всех других технологий.
«Мне нравится идея расшифровывать "ИИ" не как "искусственный интеллект", а как "иной интеллект". Не в том смысле, что он из космоса, а потому что ИИ обрабатывает информацию и принимает решения совершенно иначе, чем люди или любые органические существа», — говорит Харари.
Еще по теме:
* принадлежит корпорации Meta, признанной в РФ экстремистской
#интервью #Харари
Please open Telegram to view this post
VIEW IN TELEGRAM
❤100👍71🔥13🍌8🤓8❤🔥4🙏3🗿3🤯2😍1
OpenAI выпустила модель o3-mini. Как и предыдущая o1, она оптимизирована для задач в области точных наук (математика, физика, химия, биология) и программирования.
Модель успешно проходит одни из самых сложных тестов на рассуждение и интеллектуальные способности (GPQA и AIME) и показывает более высокие результаты по сравнению с o1 в программировании (Codeforces).
Как пользоваться?
🔴 @GPT4Telegrambot — бот №1 для работы с нейросетями в Telegram: пишет тексты и код, решает задачи, работает с документами, создает картинки, видео и музыку. 19,5 млн пользователей по всему миру.
#ChatGPT #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍128❤87❤🔥18🔥11😁7🤷6🎉4👌4🍓3🤩1
▎DEEPSEEK VS OPENAI
🔴 OpenAI o3-mini уже доступна в @GPT4Telegrambot. Входит в пакет «ChatGPT + DALL•E 3».
▎НОВОСТИ НЕЙРОСЕТЕЙ
▎ПОЧИТАТЬ
▎ИНТЕРВЬЮ
#AIWeek
Please open Telegram to view this post
VIEW IN TELEGRAM
👍135❤71😁13🌭11🔥7🫡7😡7🥱6😘6🤯4
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня OpenAI показали Deep Research — новую агентную систему, которая может самостоятельно проводить комплексные исследования в интернете.
Что умеет:
Deep Research галлюцинирует гораздо меньше других моделей OpenAI, хотя и не лишена этого недостатка полностью. Модель не просто изучает контент, но и создает его, говорит главный исследователь OpenAI Марк Чен. «Наша конечная цель — это модель, которая может сама выявлять и открывать новые знания», — объясняет он.
Еще по теме:
#новости #агенты #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
❤124👍76🔥31❤🔥12🤯10💋6😍5😘5🍓4😱3
Стокгольмский стартап Neko Health привлек $260 млн в новом раунде инвестиций по оценке в $1,8 млрд. Его основатели — Даниель Эк, придумавший Spotify, и создатель компании в сфере «умной энергетики» Watty Хьялмар Нильсон.
В специальной клинике клиент проходит комплексное сканирование организма, в ходе которого оценивается состояние кожи, метаболические риски, здоровье сердечно-сосудистой системы и множество других параметров.
Данные обрабатываются ИИ и передаются врачу Neko, который дает окончательные рекомендации. Протокол исследования разрабатывали шесть лет. Первая клиника компании открылась в Стокгольме в 2023 году, вторая — через год в Лондоне.
Обследование стоит от $250 и занимает час. Через процедуру прошло более 10 тыс. человек, 80% из них забронировали повторный визит через год.
За первый год работы у 14% пациентов выявили требующие внимание нарушения, о которых они и не подозревали. А 1% клиентов фактически спасли жизнь, вовремя выявив смертельно опасные заболевания, заявляют в стартапе.
Neko разрабатывает как оборудование, так и ПО. Средний возраст электрокардиографа в обычной поликлинике составляет 15 лет, говорит Хьялмар Нильсон, а Neko обновляет свои устройства ежегодно.
Компания планирует использовать инвестиции для расширения сети клиник в других странах, в том числе в США. Сейчас в списке ожидания Neko — 100 тыс. человек.
«Я думаю, у нас есть шанс изменить крупнейшую индустрию на планете и достичь ситуации, в которой выигрывают все: снизить затраты для общества, уменьшить страдания и создать выдающийся бизнес», — говорит Даниель Эк.
Еще по теме:
#новости #здоровье #медицина
Please open Telegram to view this post
VIEW IN TELEGRAM
👍205❤94🔥34❤🔥11🌭9🤝7😇5🤷5👌3🗿3
This media is not supported in your browser
VIEW IN TELEGRAM
Flawless AI — британский стартап режиссера Скотта Манна меняет постпродакшн Голливуда с помощью ИИ‑инструментов, позволяющих редактировать диалоги без дорогостоящих пересъемок.
На компанию обратили внимание в 2022 году, когда Манн использовал ее наработки в своем триллере «Вышка». Студия Lionsgate, известная по франшизам «Джон Уик», «Пила» и «Голодные игры», собиралась выпустить ленту в американский прокат. Но изначальная версия фильма содержала 36 ругательств, из-за чего ему грозил рейтинг R (только для взрослых), что сильно сокращает потенциальную аудиторию.
«Они сказали, что в фильме слишком много "fuck"», — рассказывает Манн.
Однако инструменты Flawless позволили заменить большинство нецензурных слов на более мягкие выражения — незаметно для зрителя и без потери качества (см. видео
Технологии Flawless также применялись в фильме «Веном: последний танец». Среди клиентов стартапа на его сайте значатся CNN и Netflix. В последние месяцы зрители все чаще замечают, что Netflix использует ИИ для синхронизации губ при дубляже.
Еще Flawless разработали специальную платформу, позволяющую актерам контролировать изменения, которые вносятся в их игру с помощью ИИ. Созданием системы Artistic Rights Treasury (A.R.T.) занялись на фоне забастовок сценаристов и актеров в 2023 году.
Далеко не все однозначно хорошо воспринимают проникновение нейросетей в индустрию кино. На прошлой неделе мы рассказывали о скандале вокруг фильма «Бруталист» — фаворит Оскара подвергся критике из-за того, что на монтаже венгерский акцент актера Эдриана Броуди сделали более «натуральным» с помощью ИИ.
Еще по теме:
🍿 «Тогда. Сейчас. Потом» — фильм с Томом Хэнксом, который невозможно было снять без ИИ
🍿 Голос Дарта Вейдера «воскресили» с помощью ИИ
#кино #стартап
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍164❤81🔥28💘15🤔7🍌7😁6😍6❤🔥4⚡3
По данным ВОЗ, каждая шестая пара в мире испытывает трудности с зачатием. ЭКО (экстракорпоральное оплодотворение или «зачатие в пробирке») — сегодня самая популярная технология, которая может помочь завести ребенка.
Но процедура дорогая и далеко не всегда приносит результат, особенно для пациенток старше 35 лет. Повысить эффективность ЭКО поможет новый метод с применением ИИ, разработанный учеными из Имперского колледжа Лондона и Университета Глазго.
Нейросеть проанализировала данные более 19 тыс. пациенток в возрасте от 18 до 49 лет, проходивших через ЭКО с 2005 по 2023 год. ИИ определил, какие размеры фолликулов (микросреды для формирования яйцеклетки) в яичниках связаны с более высокими шансами оплодотворения и установил наилучший момент для непосредственного начала процедуры ЭКО. Это может существенно повысить шансы успешной имплантации эмбриона и наступления беременности.
Знания, полученные с помощью ИИ, помогут врачам разработать более эффективные и персонализированные протоколы «зачатия в пробирке». Этот подход также можно применять во многих других областях медицины, где необходимо учитывать множество индивидуальных факторов и оперативно принимать решения.
«Методы ИИ хорошо подходят для анализа сложных данных ЭКО. В будущем ИИ можно будет использовать для выработки точных рекомендаций, чтобы оптимизировать процесс принятия решений и дать каждой паре наилучшие шансы на рождение ребенка», — объясняет репродуктолог и соавтор исследования, доктор Али Аббара.
Еще по теме:
#новости #здоровье #медицина
Please open Telegram to view this post
VIEW IN TELEGRAM
❤149👍88🗿32🔥20🤩14❤🔥10🍌7👌6👾6🍓5
В честь выхода o3-mini CEO OpenAI Сэм Альтман и другие руководители компании лично отвечали на вопросы пользователей Reddit.
Нас ждут крупные новинки от OpenAI и, вероятно, перемены в самой компании.
«Лично я считаю, что мы оказались не на той стороне истории и должны выработать другую стратегию работы с открытым исходным кодом», — делится Альтман.
Компания может раскрыть исходники своих старых моделей, хотя в настоящее время open source «не является главным приоритетом».
Если вы пропустили новинки OpenAI:
#новости #OpenAI #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
👍130❤81🔥19👌7🤣7❤🔥5🙏4🗿4🤷4👻3
Постоянное использование ИИ для поиска информации и принятия решений может ухудшать критическое мышление, выяснили швейцарские ученые. В эксперименте приняли участие 666 человек в возрасте от 17 лет и старше.
Особенно уязвимыми оказались молодые люди до 25 лет. Они чаще полагаются на ИИ в повседневной жизни и показывают самые низкие баллы в тестах на критическое мышление. Люди старше, в среднем, реже используют ИИ и лучше справляются с аналитическими задачами.
В то же время более образованные люди демонстрируют лучшие когнитивные способности, независимо от частоты использования ИИ.
Происходит «когнитивная разгрузка» — перекладывание процесса мышления и решения задач на внешние инструменты. Чем чаще человек делегирует эти процессы ИИ, тем слабее становятся его способности к самостоятельному анализу.
«Эти результаты подчеркивают двоякую природу технологий ИИ. Они повышают удобство и эффективность, но могут приводить к зависимости, снижая критическое мышление», — отмечают авторы эксперимента.
Похожим образом работает «эффект Google», возникший вскоре после того, как веб-поиск стал неотъемлемой частью нашей жизни. Люди стали запоминать не саму информацию, а место, где ее можно найти — ученые называют это «трансактивной памятью».
Исследователи считают, что при правильном подходе ИИ может не заменять, а усиливать аналитические навыки. Они призывают к разработке образовательных программ, которые помогут людям разумно использовать ИИ без ущерба для критического мышления.
А вы замечаете ухудшение критического мышления из-за ИИ?
🎃 — да, все чаще полагаюсь на ботов
❤️ — нет, всегда все проверяю
🙊 — не доверяю ИИ важные задачи
#новости #наука
Please open Telegram to view this post
VIEW IN TELEGRAM
❤483🙊276🎃241👍79🤓12🐳7🏆7🤗7👌6💘6
Мощная рассуждающая модель от Google теперь доступна всем пользователям нашего бота.
Чем интересна?
Как пользоваться?
100 запросов каждую неделю бесплатно. Have fun
#Google #Gemini
Please open Telegram to view this post
VIEW IN TELEGRAM
84👍153❤63😍28🔥13😘7🤣6❤🔥5😁2💘2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Компания Neuralink Илона Маска впервые показала, как пациент с вживленным в мозг нейроимплантом силой мысли управляет роборукой
Он написал маркером слово Convoy — название нового исследования компании по применению нейрочипов в робототехнике. Недавно его проведение одобрили американские регуляторы.
🖥 Первый человек с имплантом Neuralink Ноланд Арбо уже полноценно использует компьютер. Он пишет длинные тексты и играет в игры наравне с теми, кто использует обычную клавиатуру и мышь.
Еще про нейроимпланты:
#новости #neuralink
Please open Telegram to view this post
VIEW IN TELEGRAM
❤199👍90🔥30👾21😱16❤🔥13🤝7😭6😎6😈5
This media is not supported in your browser
VIEW IN TELEGRAM
Привет, друзья! Мы объединили в боте самую нашумевшую модель последних дней DeepSeek-R1 с лучшим интернет-поиском Perplexity.
Что получилось?
Сейчас сервис бесплатный для всех пользователей бота.
Как пользоваться?
Ответ готовится 1-2 минуты. Пример на видео
🔴 @GPT4Telegrambot — бот №1 для работы с нейросетями в Telegram: пишет тексты и код, решает задачи, работает с документами, создает картинки, видео и музыку. 19,5 млн пользователей по всему миру.
Другие обновления:
#DeepSeek #Perplexity
Please open Telegram to view this post
VIEW IN TELEGRAM
105❤183👍96❤🔥24🔥17💘9🤯6😐6😈3😘3🤗1
За несколько лет ИИ модели китайских разработчиков проделали путь от сомнительных «клонов ChatGPT» до полноценных конкурентов продуктов американских бигтехов. Лучшие ИИ-сервисы из Китая — в нашей подборке.
Языковая модель DeepSeek-V3 и построенная на ее основе рассуждающая R1 показывают результаты не хуже GPT-4o и o1 от OpenAI, а в некоторых тестах превосходят их. Есть приложения для iOS и Android.
🔴 Модель DeepSeek-R1 с ИИ-поиском Perplexity доступна @GPT4Telegrambot
Qwen Chat от китайской корпорации Alibaba — мощнейший мультимодальный чат-бот. Умеет распознавать и генерировать картинки и видео, имеет встроенный веб-поиск и интерактивную «песочницу» для выполнения кода. Последняя модель Qwen 2.5-Max показывает результаты сравнимые с DeepSeek-V3 и GPT-4o.
Пользуемся через браузер.
Kling — одна из лучших моделей для создания видео, не уступает Google Veo 2 или Sora от OpenAI. В Kling можно использовать «виртуальную примерочную» и добавлять в видео предметы с фотографий.
🔴 Как пользоваться последней Kling 1.6 Pro в нашем боте — читайте здесь.
Аудио модель от MiniMax скопирует голос по образцу длиной от 10 секунд и озвучит текст до 10 тыс. знаков на 17 языках, включая русский. Также у компании есть мощные модели для генерации видео и текстовый ассистент.
Тестируем на сайте.
Другие полезные подборки:
#топ #deepseek #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍218❤91🔥33❤🔥11💘11😍8🦄6👏5🤷3🤯2
Как ИИ оказался в центре «новой Холодной войны» и как изменится мир с появлением сильного ИИ (AGI) — в новом выпуске своего подкаста Лекс Фридман обсудил с основателем исследовательской компании SemiAnalysis Диланом Пателем и сотрудником Института ИИ Пола Аллена Нейтеном Ламбертом.
Хайлайты:
«Специалисты в ИИ-отрасли уже давно обеспокоены тем, что мы движемся к Холодной войне — или, возможно, уже находимся в ее разгаре», — говорит Нейтен Ламберт.
«Если бы в Китае хотели построить крупнейший в мире дата-центр — они бы это сделали, имей они доступ к чипам. Так что это лишь вопрос времени», — предупреждает Дилан Пател.
Еще по теме:
#новости #подкаст #deepseek
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍180❤89🔥26💊12😁9💘9⚡7🦄7💯6👾3
На этой неделе, 4 февраля, Билл Гейтс выпустил автобиографию под названием «Исходный код: мои истоки». Книга раскрывает секреты личной жизни предпринимателя, рассказывает о его детстве и проливает свет на историю создания Microsoft.
Это первый из запланированных трех томов мемуаров Билла Гейтса.
Собрали для вас самые интересные мысли из книги:
«В моей юности было точное сочетание поддержки и давления, в котором я нуждался: родители дали мне пространство для эмоционального роста и создали возможности для развития моих социальных навыков», — пишет Гейтс в своей книге.
Гейтса за это чуть не исключили — он работал над коммерческой идеей в лаборатории, финансирование которой шло за счет контрактов с Пентагоном. За злоупотребление компьютерными ресурсами Гарварда спустя почти 30 лет из университета едва не выгонят другого студента — Марка Цукерберга.
Больше про Билла Гейтса:
#mustread #Microsoft
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍227❤105🔥24🤣17🐳13🌭12🥱11🤷11👌8❤🔥6