Каким чат-ботом вы пользуетесь чаще всего?
Anonymous Poll
17%
Чат с Алисой (на базе YandexGPT)
28%
ChatGPT
24%
DeepSeek
4%
GigaChat
2%
Gemini
3%
Grok
2%
Claude
3%
Другим
16%
Не пользуюсь
😁88 44🤔30 19👍10🔥7❤4🥱1
Что такое RAG?
Языковые модели отвечают, исходя из данных, на которых их обучали. Чтобы модель использовала другую информацию, её можно дообучить, но проще использовать RAG (Retrieval Augmented Generation) — генерацию с внешними знаниями. Этот метод позволяет дополнить ответы данными, которые не были заложены при обучении.
Что это за данные?
🔸 Специализированные материалы — документация проекта, база знаний компании, учебные материалы и тому подобное.
🔸 Актуальная информация из интернета. Например, RAG используется в Поиске с Нейро для генерации ответа нейросетью с опорой на источники из интернета.
Как это работает?
Подключённые к RAG-системе данные разбивают на небольшие фрагменты — чанки (англ. chunk — кусок). Каждый чанк превращают в эмбеддинг — векторное представление, сохраняющее смысл данных. Пользовательский запрос тоже превращают в эмбеддинг, и система ищет в базе данных подходящие по смыслу фрагменты. Затем они вместе с запросом подаются в нейросеть, которая генерирует финальный ответ.
Пользовательский запрос → преобразование запроса в вектор → поиск релевантных данных в базе знаний → объединение найденной информации с запросом → генерация итогового ответа языковой моделью.
Что даёт RAG в сравнении с другими методами?
Метод позволяет обновлять знания языковой модели без её дообучения. А ещё RAG снижает вероятность галлюцинаций по сравнению с генерацией «из головы», то есть без доступа к внешним данным.
Ещё один способ снизить частоту галлюцинаций — загрузить в модель все данные вместе с запросом пользователя. Но для этого она должна уметь обрабатывать длинные тексты, а искать нужную информацию в большом объёме данных будет непросто. RAG же даёт модели только релевантные фрагменты, не перегружая её лишней информацией — получается быстрее и дешевле.
Подписывайтесь 👉 @techno_yandex
Please open Telegram to view this post
VIEW IN TELEGRAM
👍117 33 17🔥15❤10🥱5👎2😁2
Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex × @carsnosleep
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍160🔥72❤28 12😁6 5👎3🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🌡️🤖 Одна и та же нейросеть может фантазировать или быть предельно точной — за это отвечает температура генерации. Разбираемся, что это и как работает.
Температура генерации — это параметр, определяющий уровень креативности текста, создаваемого языковой моделью.
Он влияет на выбор каждого следующего токена: при низкой температуре модель чаще выбирает самые вероятные, при высокой — менее ожидаемые. В первом случае тексты получаются строгими и формальными, во втором — нестандартными и образными. Ответы на один и тот же запрос, сгенерированные с низкой температурой, будут похожими, а с высокой — разными.
Для чего это нужно?
Управление температурой генерации помогает подстраивать поведение нейросети под конкретную задачу. Например для написания кода или аналитических статей температура должна быть низкой, а для стихов, переводов и художественных текстов — высокой.
Как настроить температуру?
У каждого чат-бота есть температура по умолчанию, обеспечивающая сбалансированную генерацию. Часто в качестве температуры по умолчанию используется 0.7–1. Как правило, она выставляется создателем чат-бота и пользователь не может на неё повлиять.
Разработчикам доступна точная настройка температуры через API. Температура обычно измеряется либо по шкале от 0 до 1, либо от 0 до 2 — в зависимости от провайдера LLM и используемого им SDK.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
Температура генерации — это параметр, определяющий уровень креативности текста, создаваемого языковой моделью.
Он влияет на выбор каждого следующего токена: при низкой температуре модель чаще выбирает самые вероятные, при высокой — менее ожидаемые. В первом случае тексты получаются строгими и формальными, во втором — нестандартными и образными. Ответы на один и тот же запрос, сгенерированные с низкой температурой, будут похожими, а с высокой — разными.
Для чего это нужно?
Управление температурой генерации помогает подстраивать поведение нейросети под конкретную задачу. Например для написания кода или аналитических статей температура должна быть низкой, а для стихов, переводов и художественных текстов — высокой.
Как настроить температуру?
У каждого чат-бота есть температура по умолчанию, обеспечивающая сбалансированную генерацию. Часто в качестве температуры по умолчанию используется 0.7–1. Как правило, она выставляется создателем чат-бота и пользователь не может на неё повлиять.
Разработчикам доступна точная настройка температуры через API. Температура обычно измеряется либо по шкале от 0 до 1, либо от 0 до 2 — в зависимости от провайдера LLM и используемого им SDK.
Подписывайтесь 👉 @techno_yandex
Please open Telegram to view this post
VIEW IN TELEGRAM
👍102🔥33 20❤13
🦠 В 1986 году два брата из Пакистана случайно запустили первую эпидемию компьютерного вируса для MS-DOS. Благодаря этому родилась индустрия антивирусов.
Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
👍213❤50🔥42 28😐3