Machinelearning

🚀 Codex CLI

"Модели o3 и o4-mini настолько сильны в программировании, что мы решили упростить их использование и выпустить новый продукт"" — Codex CLI - написал в своем аккаунт Альтман

💻 Codex CLI — это мощный программирующий агент, который работает локально на вашем компьютере.

- Чат-ориентированная разработка: Позволяет взаимодействовать с вашим репозиторием через диалоговый интерфейс.

- Выполнение кода: Способен запускать код, манипулировать файлами и выполнять итерации прямо в терминале.

- Интеграция с системами контроля версий: Обеспечивает работу под управлением систем контроля версий, таких как Git.

🌟 Полностью open source и уже доступен для скачивания!

npm install -g @openai/codex

https://github.com/openai/codex

@ai_machinelearning_big_data

#AI #OpenSource #CodexCLI #Coding #LLM #DevTools

1❤71👍45🔥7🥰6🗿6😁4🤔4

18K viewsedited 17:47

Machinelearning

🚀 Tencent Hunyuan только что выкатили AutoCodeBench — мощный open-source инструмент для проверки способностей ИИ в генерации кода.

Что внутри?
🔹 AutoCodeGen — генерация многоязычных датасетов кода без ручной разметки
🔹 AutoCodeBench — почти 4 000 сложных задач на 20 языках программирования (версии Full / Lite / Complete)
🔹 MultiLanguageSandbox — песочница для работы с поддержкой 30+ языков

C AutoCodeBench можно быстро тестировать LLM в кодинге, сравнивать модели и даже создавать свои бенчмарки.

🟠

Статья: arxiv.org/abs/2508.09101

🟠

Код: github.com/Tencent-Hunyuan/AutoCodeBenchmark

🟠

Датасет: huggingface.co/datasets/tencent/AutoCodeBenchmark

@ai_machinelearning_big_data

#AutoCodeBench #AI #coding

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥90❤19👍17

21.7K views10:40

Machinelearning

🚀

Grok Code Fast 1 — новая модель от xAI, быстрый и недорогой агент для кодинга.

Новая модель для повседневных задач программирования с упором на agentic-coding (циклы рассуждений + вызовы инструментов: grep, терминал, редактирование файлов). Обучена на огромном корпусе кода и дообучена на реальных PR/задачах.

🙌 Модель уже доступна бесплатно на популярных платформах:
GitHub Copilot, Cursor, Cline, Kilo Code, Roo Code, opencode и Windsurf.

Контекст 256k токенов, лимиты: до 2M токенов в минуту и 480 запросов в минуту.

⚡ Особенности:
- Новая лёгкая архитектура, разработанная с нуля
- Заточена на скорость и эффективность
- Показвает хорошие результаты в TypeScript, Python, Java, Rust, C++, Go

💰 Стоимость через xAI API:
- $0.20 / 1M входных токенов
- $1.50 / 1M выходных токенов
- $0.02 / 1M кешированных токенов

в 6 раз дешевле, чем GPT-5.

Команда Grok обещает выпускать регулярные обновления и уже тренирует вариант с мультимодальным вводом, параллельными tool-calls и расширенным контекстом.

🟠

Подробности: https://x.ai/news/grok-code-fast-1

🟠

Гайд по промпт-инжинирингу: https://docs.x.ai/docs/guides/grok-code-prompt-engineering

@ai_machinelearning_big_data

#xAI #Grok #AI #coding

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍69❤22🔥10😁4🍓2🤔1🕊1😈1

28K views20:28

Machinelearning

⚡️ Полнометражный документальный фильм про Python

На Youtube вышла документалка о том, как создавался язык программирования Python и о том, как IT-сообщество сделало его одним из основ современной кодовой базы.

Для тех, кто хочет посмотреть на русском, можно открыть ссылку в Яндекс Браузере и включить нейросетевую озвучку живыми голосами.

@ai_machinelearning_big_data

#coding #Python

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥68👍49❤28💘2🥰1🙈1

22.5K views13:17

Machinelearning

📌

Успех в работе с Claude Code зависит больше от знания дела, чем от умения писать код

Anthropic опубликовала отчёт, в котором утверждает, что главным фактором успеха при работе с ИИ-агентами для программирования оказывается не владение кодом, а понимание самой задачи.

Вывод основан на анализе около 400 тысяч сессий сервиса Claude Code, проведённых примерно 235 тысячами пользователей с октября 2025 по апрель 2026 года.

В типичной сессии человек принимает около 70% решений о том, что делать, тогда как агент берёт на себя примерно 80% решений о том, как это сделать. Иными словами, человек ставит задачу, а ассистент выбирает способ её выполнения.

Чем глубже пользователь разбирается в предметной области, тем больше работы агент выполняет по одной команде. По оценке команды, у новичков одна реплика запускает в среднем около 5 действий ИИ и порядка 600 слов ответа, у экспертов - вдвое больше действий и впятеро больше текста.

Уровень владения при этом определялся не должностью, а тем, насколько точно человек формулирует требования и замечает ошибки агента.

🟡Отдельный вывод касается профессий

При написании кода представители разных специальностей добиваются результата почти так же часто, как профессиональные программисты - все крупные профгруппы укладываются в 7 процентных пунктов от показателей инженеров.

В то же время разрыв между новичками и более опытными заметен. По критерию "подтверждённого успеха" сессии новичков завершались удачно в 15% случаев, а пользователей среднего уровня и выше - в 28–33%.

🟡

Структура работы за 7 месяцев изменилась

Доля сессий, посвящённых исправлению ошибок, упала с 33% до 19%.

Выросла доля задач, связанных с запуском и настройкой программ, анализом данных и подготовкой текстов.

Оценочная стоимость типичной задачи, рассчитанная через сравнение с расценками на биржах фриланса, поднялась в среднем примерно на 25%.

🔜 Описания методик, профилей и запросов - в приложении к отчету.

@ai_machinelearning_big_data

#AI #ML #Coding #Research #Anthropic

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔64💯23👨‍💻16👏14❤9🔥4🥱1

15.1K views05:20

About

Blog

Apps

Platform