Глоссарий
29 AI-чатбот термина, просто определены
RAG, embeddings, галлюцинация, PHI редакция, UPL safeguards, Quiz Mode, vertical specialisation, multi-tenant — каждый термин заземлён в конкретном SLAtech примере. Связано из FAQ и матрицы сравнения.
Термины
29 записей
- AI-чатбот
- Программный агент, который интерпретирует ввод на естественном языке от посетителя и отвечает в той же форме — обычно через веб-виджет, мессенджер-канал (WhatsApp, Telegram) или голосовой интерфейс. Современные AI-чатботы работают на больших языковых моделях (LLM) и retrieval-augmented generation (RAG).
- RAG (Retrieval-Augmented Generation)
- Техника заземления LLM: до генерации ответа система извлекает наиболее релевантные чанки из вектор-стора, засеянного контентом клиента, затем передаёт их в LLM как контекст. Устраняет зависимость LLM от обучающих знаний — ответы заземлены в контенте клиники/отеля/фирмы и не галлюцинируют по ценам/политике.
- Галлюцинация
- Когда LLM генерирует контент, звучащий правдоподобно, но не подкреплённый retrieved context или фактически некорректный. Особенно опасны в регулируемых вертикалях (клинические советы, юридические позиции, цены). SLAtech surfaces per-response hallucination flag в admin Inbox.
- Embedding
- Высокоразмерный численный вектор, представляющий семантическое значение текстового чанка. Два семантически близких выражения имеют похожие embeddings. SLAtech использует text-embedding-3-small от OpenAI с 1536 размерностями, хранится в Qdrant.
- Vector Store
- БД, оптимизированная для cosine-similarity поиска по миллионам embeddings. SLAtech использует Qdrant под ClientId каждого тенанта, со строгой multi-tenant изоляцией.
- Chunk
- Небольшая порция индексированного контента (обычно 200-500 токенов), которую возвращает retrieval pipeline как citation source. Chunks извлекаются из крупных документов (PDF, веб-страницы, FAQ) во время ingestion.
- Cosine Similarity
- Мера семантической близости между двумя embeddings, значение в [0, 1] (1 = идентичны). Retrieval pipeline SLAtech фильтрует chunks по конфигурируемому ScoreThreshold (default 0.5).
- Multi-Tenant
- Архитектурный паттерн, где один deployment обслуживает множество платящих тенантов с изолированными data partitions. SLAtech multi-tenant на каждом слое: таблицы БД, коллекции Qdrant, Sentry проекты, audit logs.
- Fine-Tuning
- Тренировка LLM на tenant-специфичном датасете для специализации тона или знаний. SLAtech НЕ делает fine-tuning на клиентских данных — tenant content исключён из training pipeline по контракту.
- LLM-as-Judge
- Паттерн, где один LLM оценивает output другого LLM на factuality, hallucination и confidence. SLAtech запускает LLM-as-Judge на каждый ответ бота и surfaces три скора в admin Inbox.
- Temperature
- Параметр sampling LLM, контролирующий случайность вывода (0 = детерминистично, 1 = креативно). SLAtech defaults к 0.3 для grounded клиент-facing ответов и 0.7 для креативных реплик в low-stakes каналах.
- Top-K Retrieval
- Параметр retrieval pipeline, контролирующий сколько chunks возвращается на запрос. SLAtech defaults к TopK=10, clamped в [1, 20]. Higher TopK даёт LLM больше контекста но повышает latency и cost.
- System Prompt
- Инструктивный текст, предваряющий каждый LLM call, определяющий роль, тон, ограничения. SLAtech ships per-vertical default system prompt, который клиенты могут override в admin платформе.
- Token
- Единица, на которой работают LLMs — примерно 4 символа или ¾ английского слова. Тарификация per-token. SLAtech репортит per-query token usage и cost в API response.
- Context Window
- Максимальное число токенов, которое LLM может обработать в одном запросе. GPT-4o имеет 128k token window.
- Streaming (SSE)
- Server-Sent Events транспорт, доставляющий LLM output токен-за-токеном по мере генерации. Cuts perceived latency на ~70% vs ожидания полного ответа.
- Citation
- Ссылка, показанная рядом с ответом бота, указывающая на source content, использованный для grounding. Ответы SLAtech ship { sourceUrl, snippet } per citation.
- PHI / PII
- Protected Health Information и Personally Identifying Information — категории, регулируемые HIPAA (US), GDPR (EU) и аналогичными фреймворками. Медицинская и юридическая вертикали SLAtech ship ingest-time PHI/PII редактор.
- GDPR
- General Data Protection Regulation (EU 2016/679). SLAtech GDPR-compliant по умолчанию: EU-hosted инфраструктура, sub-processors по SCC 2021/914.
- Sub-Processor
- Третья сторона, которая обрабатывает клиентские данные от имени SLAtech (OpenAI для LLM inference, SendGrid для email, Sentry для observability, Cloudflare для CDN). Публичный список на /ru/sub-processors/.
- UPL (Unauthorized Practice of Law)
- Compliance ограничение юридической индустрии, запрещающее не-юристам предлагать юридический совет. UPL safeguard SLAtech Legal маршрутизирует каждый substantive юридический вопрос в attorney follow-up.
- Quiz Mode
- Функция SLAtech Education, превращающая каждый загруженный урок в randomised practice quiz. Drives и live Q&A bot, и per-topic self-test loop.
- Vertical Specialisation
- Архитектурный паттерн поставки нескольких industry-tuned bots (клиника, гостеприимство, юр., и т.д.) вместо одного generic чатбота. SLAtech ships девять вертикалей.
- Lead Capture
- Workflow бота, собирающий имя + email + intent посетителя и пушащий в CRM. SLAtech поддерживает HubSpot, Salesforce, Pipedrive нативно и любую in-house CRM через generic JSON-POST webhook.
- Calendar Sync
- Двусторонняя интеграция с Google Calendar / Outlook так чтобы бот мог читать live availability, бронировать слоты, отправлять напоминания и обрабатывать отмены.
- Channel
- Где бот встречает visitor — web widget, Telegram, WhatsApp Business, Instagram DM, email. SLAtech bundles web + Telegram + WhatsApp в Pro.
- Confidence Score
- Число 0-1, представляющее уверенность LLM в ответе, derived from retrieval scores + LLM-as-Judge output. SLAtech surfaces confidence per response в admin Inbox.
- Knowledge Base
- Корпус tenant-контента (FAQ entries, PDFs, scraped web pages, manually-curated articles), который grounds ответы бота через RAG. Ingestion pipeline SLAtech запускает document extraction, chunking, embedding и Qdrant upsert.
- Self-Hosted vs Cloud
- Self-hosted = клиент запускает бота на собственной инфраструктуре. Cloud = vendor запускает всё. SLAtech cloud-only по умолчанию; Enterprise tier предлагает single-tenant deployment, который mirrors self-host benefits без ops burden.
Не хватает термина?
Напишите основателю — мы добавляем термины по мере того, как покупатели их спрашивают.