Валера Ковальский
15.3K subscribers
567 photos
90 videos
5 files
490 links
Head of AI Engineer | DevOps | Hardware
From IT Admin to Head of AI in 6 years
Автор https://neuraldeep.ru/
Raised $2M+ for human-centric AI startups
github.com/vakovalskii | chat @neuraldeepchat
Download Telegram
Валера Ковальский pinned «Лучшие практики и подходы для RAG Сборка от нашего сообщества @neuraldeep (Пост все еще наполняется…) Очередной раз спросили в чате канала что почитать про RAG (https://tg-me.sbs/neuraldeepchat) Соберем тут все лучшее, присылайте ваши статьи и разборы Ссылки…»
Ну наконец то я теперь вижу прогресс бар процесса /compact в CC

Теперь могу смотреть на него и ждать когда зависнет на 99% =)

Кстати статус лайн от сюда автор вот
😁2913🔥8👍61
Валера Ковальский
NeuralDeep LLM Hub Добавлено: qwen3.6-35b-a3b Второй инстанс под gpt oss 120b whisper large-v3-turbo Возможность в ЛК отключить логирование (тут конечно надо поверить мне на слово) Обе LLM протестированы с codex/opencode/hermes-agent/kiro/cursor Осталось…
https://hub.neuraldeep.ru/

Вот и случилось 1000 регистраций на хабе
Сделано 700 коммитов
5000+ рестартов гейта
Вы сгенерировали 6 млрд токенов
Вызвали Дрифт более 100 000 раз!

Спасибо, что продолжаете тестировать то, что я делаю, и спасибо Паше за помощь в разработке хаба с инфраструктурной стороны!

И на канале уже 15 000 человек! Тоже приятная новость!

А я тем временем всё глубже погружаюсь в автоматизацию разработки хаба с помощью claude code cli и codex cli (напомню, я делаю это в одиночку, и всё это — очень большой эксперимент).
2🔥63👍158🙉2
Найди знакомого блогера
14124🔥19👍7🤡4🤮2🖕1
Drift API Open Beta

Вы просили много раз, держите =)

Теперь ваш Drift может жить где угодно! Интеграция через API доступна ниже
Подробная документация по интеграции:
https://hub.neuraldeep.ru/docs#drift-api

curl -N https://drift.neuraldeep.ru/v1/chat/completions \
-H "Authorization: Bearer dft_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.6-35b-a3b",
"messages": [{"role":"user","content":"Прочитай мой MEMORY.md и перескажи кратко"}],
"stream": true
}'

# События потока возвращают:
# data: {"choices":[{"delta":{"content":"..."}}],...}
# data: [DONE]


Откройте Dashboard → раздел «Drift API tokens» → «+ создать токен».

Теперь можно начать экспериментировать с вашим личным универсальным агентом =)
🔥185🤔3👌2👀1
Походу я слишком часто общаюсь с клодом матом….
😁1099💯6🤝3🔥1
Hermes Desktop следим за трендами?

Мне очень зашел сам формат UI и то, что под капотом hermes cli.
Отсюда родилась идея =)

Сделал нативную интеграцию хаба в это приложение.
Перевести интерфейс на русский.

TODO: что пилится и тестируется.

1) Доделать и проетстировать интеграцию в Битрикс, авторизацию и получение токена в вайбпортала.
2) Перевести интерфейс на русский.
3) Сделать интеграцию с GigaChat (клаудру) + YandexAPI.

Давайте наконец-то сделаем свой Cowork Great Again!

И дав Claw3D воркает!
О любых багах сообщайте в комментариях.
Репо: https://github.com/vakovalskii/hermes-desktop-ru
1🔥4112👍12🤔2😁1
Сравнение топовых harness на локальных моделях

Совместно с rnd отделом red_mad_robot подготовили и провели данный бенчмарк, отдельное спасибо Андрею Иванову за подготовку стендов и проведение бенчмарка!

Модели взяли LLM хаба https://hub.neuraldeep.ru/

Сохраняйте ссылку на бенчмарк, теперь это буде регулярная страничка которую мы будем обновлять!

Бенчмарк: https://hub.neuraldeep.ru/benchmarks

Лидерборд будет пополнятся моделями
Drift планируется к open source в этом году!

gpt oss 120b | Qwen3.6-35B-A3B

Все модели были развернуты на rtx 6000 pro/4090(48gb x2)

Как вывод абсолютный лидер сегодня это hermes agent

Даже удалось погонять на PAC1 от Рината!
👍5627🔥163🤔1
ECOM1

Ну что давайте проверим нагрузку?

Для участия в ECOM1 сделал промокод дает хорошие лимиты для прогона агента на квен и гпт осс

Промокод можно активировать в личном кабинете для всех у кого подписка ниже PRO, подписка действует 7 дней



ECOM1-2026


https://hub.neuraldeep.ru/
🔥1953👍2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Я и мое выгорание
Я и Claude Code с первого раза пилит фичу правильно
Кодинговые агенты всех заменили
Все тесты зеленые с первого раза
Ютуб блогеры продолжают стримить и не лезут в ИИ

Я и мой взлетевший мега AI SaaS выходит на прибыль
1😁101🔥24124👍4💯2
n8n на минималках для курильщика?

Замутил на базе Drift в хабе https://hub.neuraldeep.ru/ agent as a service (aaas).

Запрос на aaas есть? Реализация тоже за 120 минут!

Кстати, за последнее время на хабе зарегистрировалось 1500 человек

И один из зеров векторизировал 1 млн документов «кто ты воин?» =)

В целом на сегодня 10 млрд токенов суммарно прошло через наш хаб

Ещё ЦОД переехал физически и теперь работает более стабильно!

Кстати скоро будет залита из теста страничка https://hub.neuraldeep.ru/news
там вы точно не упустите все новости!

Что еще?
1) встроил vllm-router (крутая штука для кеша)
2) Так и не перешел на sglang O_o
3) Встроил b2b режим покупки моделей по токенам
4) Стабилизировал работу Drift раз 10 ловил регресс =)
5) Вроде настроил пайп создание и деплоя фичей (вроде)
6) Все откладываю почтовый сервис

По MRR отбил аренду колекейшена!
В общем следите за новостями
А ваш карманных эксперт на данныз момент по уши в агентах и в AI (P)(S)DLC!
Stay tuned!
🔥64👍116👏43😁21🤔1
Человек-оркестр это не мем это диагноз

Люблю этот летний утренний хайп сегодня
"накидал агентов они сами всё сделали ты только оркестрируешь, кодинг умер инженеры не нужны!!!"

Так вот скажу как человек который завёл первый MVP хаба за вечер на клоде (11 контейнеров, 15к строк), а потом полтора месяца и 693 коммита доводил его до того что он реально держит прод и принимает деньги

Демка взлетает за сутки, а продукт это месяцы?
Чет не так как продают на ютубе, но возможно я смотрю неправильный ютуб


Скиллы, саб-агенты для ревью, оркестраторы, спеки на 1000 строк, workflow
каждый новый слой не убирал баги а добавлял новые места где они прячутся и добалял мне чертов СДВГ что бы я за всем этим следил!

Регресс ловил раз 10 на ровном месте фича зелёная локально, катишь на прод и оно отваливается на эндпоинте про который агент «забыл»
ни один скилл / плагин / MCP не дал мне гарантии что после раскатки будет ок
ни один =(


Что реально спасло
Реально спасло что у тебя тут армия тестировщиков преданных! @nyxandro
Четкий пайплайн тестов/дел/задач перед выкаткой (он описан скриптом)
А дальше
тесты, логи, тесты, логи, ещё раз логи, потом снова тесты 💀
smoke перед каждым пушем, полный прогон перед продом
читать логи всех сторон системы (vllm, litellm, гейт, вебхук) там вся соль, а не в "агент сказал готово"
деплой не когда модель написала done, а когда зелёный гейт сказал done и я глазами дернул метод и увидел ответ
единственная «фича» которая ни разу не подвела это дисциплина смотреть в логи да через агента но смотреть каждый раз ждать по 5/10/20 минут у терминала и смотреть логи создавать события самому или ждать юзеров


А за счёт чего это вообще едет?

За счёт своей базы, не агентской О_о
тащит то что накоплено за 6 лет карьеры
девопс, сети, линукс, докер
поднять, изолировать, разрулить роутинг, не уронить прод или уронить и поднять!
vllm и модели изнутри
чат-темплейты, constrained decoding, harmony, парсеры тулов, я лазил в кишки и переписывал
железо, нагрузка, температуры: знаю что мои 4090 48гб или rtx6000 держат и когда кипят, а не гадаю
питон, бекенд, фронтенд: что б прочитать что нагенерил агент и понять где он наврал
агент без этой базы это джун с уверенным тоном
на проде опасная штука


Человек-AI-оркестр не миф, но сделали меня им не агенты и уж точно не супер скилл или md файл

я стал им за 6 лет, пока руками поднимал инфру, ронял и чинил прод, лез в инференс, считал нагрузку и температуры
агент это рычаг, а опора это те самые 6 лет в голове
поэтому всё что нужно что б хаб не просто крутился а начал приносить деньги и принимать платежи я настроил сам
роутинг, sticky-кеш, биллинг через юкассу, лимиты, грейсы, рефанды, изоляция песочниц, бекапы, мониторинг
агент писал код, а что куда и зачем решал я


И тут небольшая ремарка про психику

По ощущениям на сегодня у меня либо раздвоение личности, либо продуктивность на уровне целой команды
пока сам не разобрал что именно
но визит к специалисту чувствую точно не помешает 🙂


Моё решение чутка сложнее мобильного приложения с бекендом и прокси к облачным ллмкам
тут свой инференс на своём железе, мультисервис, изоляция, биллинг, b2b по токенам, агент со своей песочницей, часть живет в k8s
поэтому это и не делается за сутки
поэтому мне и интересно
поэтому я и вкладываю столько времени
будь это тонкий клиент к api gpt мне стало бы скучно через день



Агенты замена инженера сегодня?
Нет
Они дают рычаг тому у кого есть на что опереться
думать, резать на куски, проверять, читать логи и нести ответственность за прод всё ещё ты
и тянет это твоя база по всему стеку собранная годами, а не очередной плагин
чем проще обвязка тем надёжнее едет: пара промптов в рукаве, context7, web search, playwright и железная дисциплина тестов
остальное лестницы из спичек, проще сжечь чем поддерживать

Так что когда вам в сотый раз скажут «оркестратор агентов всех заменил»
покажите мой пост и мой хаб
попросите показать логи
и тесты
и что было когда он раскатил это на прод
и что было когда у него было 200 рпс
и спросите сколько лет он до этого собирал свою базу 😈
Please open Telegram to view this post
VIEW IN TELEGRAM
21🔥15254👍33💯207🤔3🤝2
SOTA OCR на хабе

Теперь вы можете строить свои решения вместе с сервисом https://sotaocr.com/ от @glebkudr1

На базе нашего хаба, это нативная интеграция с его сервисом в рамках нашей стратегии развития таких решений в РФ


https://hub.neuraldeep.ru/docs#ocr
🔥56👍114
Голосуем за модели!

В нашем полку прибыло видеопамяти

Какую модель вы хотели бы увидеть на хабе?

Heretic не предлагать 😈

Предложения жду в комментариях.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19🔥8