Глоссарий

29 AI-чатбот термина, просто определены

RAG, embeddings, галлюцинация, PHI редакция, UPL safeguards, Quiz Mode, vertical specialisation, multi-tenant — каждый термин заземлён в конкретном SLAtech примере. Связано из FAQ и матрицы сравнения.

Термины

29 записей

AI-чатбот: Программный агент, который интерпретирует ввод на естественном языке от посетителя и отвечает в той же форме — обычно через веб-виджет, мессенджер-канал (WhatsApp, Telegram) или голосовой интерфейс. Современные AI-чатботы работают на больших языковых моделях (LLM) и retrieval-augmented generation (RAG).
RAG (Retrieval-Augmented Generation): Техника заземления LLM: до генерации ответа система извлекает наиболее релевантные чанки из вектор-стора, засеянного контентом клиента, затем передаёт их в LLM как контекст. Устраняет зависимость LLM от обучающих знаний — ответы заземлены в контенте клиники/отеля/фирмы и не галлюцинируют по ценам/политике.
Галлюцинация: Когда LLM генерирует контент, звучащий правдоподобно, но не подкреплённый retrieved context или фактически некорректный. Особенно опасны в регулируемых вертикалях (клинические советы, юридические позиции, цены). SLAtech surfaces per-response hallucination flag в admin Inbox.
Embedding: Высокоразмерный численный вектор, представляющий семантическое значение текстового чанка. Два семантически близких выражения имеют похожие embeddings. SLAtech использует text-embedding-3-small от OpenAI с 1536 размерностями, хранится в Qdrant.
Vector Store: БД, оптимизированная для cosine-similarity поиска по миллионам embeddings. SLAtech использует Qdrant под ClientId каждого тенанта, со строгой multi-tenant изоляцией.
Chunk: Небольшая порция индексированного контента (обычно 200-500 токенов), которую возвращает retrieval pipeline как citation source. Chunks извлекаются из крупных документов (PDF, веб-страницы, FAQ) во время ingestion.
Cosine Similarity: Мера семантической близости между двумя embeddings, значение в [0, 1] (1 = идентичны). Retrieval pipeline SLAtech фильтрует chunks по конфигурируемому ScoreThreshold (default 0.5).
Multi-Tenant: Архитектурный паттерн, где один deployment обслуживает множество платящих тенантов с изолированными data partitions. SLAtech multi-tenant на каждом слое: таблицы БД, коллекции Qdrant, Sentry проекты, audit logs.
Fine-Tuning: Тренировка LLM на tenant-специфичном датасете для специализации тона или знаний. SLAtech НЕ делает fine-tuning на клиентских данных — tenant content исключён из training pipeline по контракту.
LLM-as-Judge: Паттерн, где один LLM оценивает output другого LLM на factuality, hallucination и confidence. SLAtech запускает LLM-as-Judge на каждый ответ бота и surfaces три скора в admin Inbox.
Temperature: Параметр sampling LLM, контролирующий случайность вывода (0 = детерминистично, 1 = креативно). SLAtech defaults к 0.3 для grounded клиент-facing ответов и 0.7 для креативных реплик в low-stakes каналах.
Top-K Retrieval: Параметр retrieval pipeline, контролирующий сколько chunks возвращается на запрос. SLAtech defaults к TopK=10, clamped в [1, 20]. Higher TopK даёт LLM больше контекста но повышает latency и cost.
System Prompt: Инструктивный текст, предваряющий каждый LLM call, определяющий роль, тон, ограничения. SLAtech ships per-vertical default system prompt, который клиенты могут override в admin платформе.
Token: Единица, на которой работают LLMs — примерно 4 символа или ¾ английского слова. Тарификация per-token. SLAtech репортит per-query token usage и cost в API response.
Context Window: Максимальное число токенов, которое LLM может обработать в одном запросе. GPT-4o имеет 128k token window.
Streaming (SSE): Server-Sent Events транспорт, доставляющий LLM output токен-за-токеном по мере генерации. Cuts perceived latency на ~70% vs ожидания полного ответа.
Citation: Ссылка, показанная рядом с ответом бота, указывающая на source content, использованный для grounding. Ответы SLAtech ship { sourceUrl, snippet } per citation.
PHI / PII: Protected Health Information и Personally Identifying Information — категории, регулируемые HIPAA (US), GDPR (EU) и аналогичными фреймворками. Медицинская и юридическая вертикали SLAtech ship ingest-time PHI/PII редактор.
GDPR: General Data Protection Regulation (EU 2016/679). SLAtech GDPR-compliant по умолчанию: EU-hosted инфраструктура, sub-processors по SCC 2021/914.
Sub-Processor: Третья сторона, которая обрабатывает клиентские данные от имени SLAtech (OpenAI для LLM inference, SendGrid для email, Sentry для observability, Cloudflare для CDN). Публичный список на /ru/sub-processors/.
UPL (Unauthorized Practice of Law): Compliance ограничение юридической индустрии, запрещающее не-юристам предлагать юридический совет. UPL safeguard SLAtech Legal маршрутизирует каждый substantive юридический вопрос в attorney follow-up.
Quiz Mode: Функция SLAtech Education, превращающая каждый загруженный урок в randomised practice quiz. Drives и live Q&A bot, и per-topic self-test loop.
Vertical Specialisation: Архитектурный паттерн поставки нескольких industry-tuned bots (клиника, гостеприимство, юр., и т.д.) вместо одного generic чатбота. SLAtech ships девять вертикалей.
Lead Capture: Workflow бота, собирающий имя + email + intent посетителя и пушащий в CRM. SLAtech поддерживает HubSpot, Salesforce, Pipedrive нативно и любую in-house CRM через generic JSON-POST webhook.
Calendar Sync: Двусторонняя интеграция с Google Calendar / Outlook так чтобы бот мог читать live availability, бронировать слоты, отправлять напоминания и обрабатывать отмены.
Channel: Где бот встречает visitor — web widget, Telegram, WhatsApp Business, Instagram DM, email. SLAtech bundles web + Telegram + WhatsApp в Pro.
Confidence Score: Число 0-1, представляющее уверенность LLM в ответе, derived from retrieval scores + LLM-as-Judge output. SLAtech surfaces confidence per response в admin Inbox.
Knowledge Base: Корпус tenant-контента (FAQ entries, PDFs, scraped web pages, manually-curated articles), который grounds ответы бота через RAG. Ingestion pipeline SLAtech запускает document extraction, chunking, embedding и Qdrant upsert.
Self-Hosted vs Cloud: Self-hosted = клиент запускает бота на собственной инфраструктуре. Cloud = vendor запускает всё. SLAtech cloud-only по умолчанию; Enterprise tier предлагает single-tenant deployment, который mirrors self-host benefits без ops burden.

Не хватает термина?

Напишите основателю — мы добавляем термины по мере того, как покупатели их спрашивают.

Предложить термин FAQ