Проекты - AI-аналитика клиентских обращений и обратной связи

NLP-пайплайн, который собирает отзывы и обращения из десятков каналов, определяет тему и тональность, выделяет повторяющиеся проблемы и инсайты для менеджмента.

Формат
Демо-проект
Тип системы
Data Science и предиктивная аналитика
Отрасли
ритейл, банки, телеком, SaaS

Как это работает

Собирает отзывы из десятков каналов, выделяет повторяющиеся проблемы и присылает менеджменту еженедельный отчёт.

  1. 1
    Отзывы со всех каналов
  2. 2
    Тема и тональность каждого сообщения
  3. 3
    Инсайты и алерты в Slack
live · пример

Запрос

4 830 отзывов из App Store, 2ГИС и Zendesk за неделю
обработка

Ответ системы

Новая проблема: 47 жалоб на невозможность отменить подписку через приложение, +180% за неделю. Рекомендация: приоритет на исправление.

Задача

Клиенты оставляют отзывы, жалобы и пожелания в десятках каналов: почта, чаты, формы на сайте, соцсети, отзовики, сторы приложений, опросы NPS. Ручной анализ невозможен — никто не может прочитать тысячи сообщений в неделю и сделать из них выводы.

Маркетологи видят верхушку айсберга: самые громкие жалобы в соцсетях или самые эмоциональные отзывы. Менеджмент принимает решения вслепую — без понимания, что происходит в хвосте распределения и какие проблемы только начинают расти.

Классические BI-инструменты не помогают: они работают с табличными данными, а не с текстом. Тегирование вручную не масштабируется. Нужен NLP-пайплайн, который превратит тексты в структурированные данные.

Что мы построили

Пайплайн, который собирает тексты из всех каналов, извлекает темы и тональность, выделяет повторяющиеся проблемы и показывает их в дашборде.

Сбор данных:

  • Коннекторы к почте, Zendesk, VK, Telegram-каналам, App Store / Google Play, отзовикам (Яндекс.Карты, 2ГИС, Banki.ru).
  • Нормализация текста: очистка от HTML, удаление подписей, склейка пересылаемых сообщений в треды, определение языка.

Классификация темы:

  • Дообученная модель на основе sentence-transformers. Классификатор размечает каждое сообщение одной или несколькими темами из заранее определённого дерева (качество продукта, доставка, поддержка, цена, интерфейс и т.д.).
  • Для новых тем, которые не попали в классификатор, работает кластеризация. Раз в неделю пайплайн находит новые кластеры и предлагает аналитику их пометить как новые темы.

Анализ тональности:

  • Модель определяет тональность (позитив / нейтрал / негатив) с учётом контекста. Работает с русским языком, сарказмом и отрицаниями.
  • Отдельно — определение эмоций: раздражение, разочарование, удивление, восхищение. Это помогает отличить «просто нейтральную жалобу» от «клиент горит и уйдёт завтра».

Извлечение инсайтов через LLM:

  • На агрегированных данных LLM извлекает повторяющиеся проблемы: не «клиент недоволен», а «клиенты жалуются, что товар не помещается в стандартную упаковку».
  • Генерирует еженедельный отчёт: топ-10 новых проблем, топ-10 растущих тем, рекомендации по приоритизации.

Дашборд и алерты:

  • Визуализация трендов по неделям, распределение тем, тепловая карта проблем по продуктам, динамика NPS.
  • Алерты: если доля негатива по какой-то теме выросла на 20% за неделю, менеджмент получает уведомление в Slack или на почту.

Стек технологий

  • Python
  • transformers
  • sentence-transformers
  • HDBSCAN кластеризация
  • GigaChat / Claude
  • ClickHouse
  • Metabase / Superset
  • Airflow

Метрики системы

точность определения темы
~89%
точность тональности
~92%
обращений в минуту пропускная способность
10 000+
каналов-источников данных
30+
Топ тем за неделю (доля обращений)
Отмена подписки28%
Скорость работы приложения22%
Оплата и возвраты18%
Поддержка14%

Что показывает этот проект

  • NLP-пайплайн на проде. Не «взяли готовую модель и получили графики», а настоящий пайплайн с обучением, оценкой качества, мониторингом дрейфа и регулярным переобучением.
  • Кластеризация новых тем. Мир меняется, появляются новые проблемы — система должна уметь их находить, а не жить в рамках заранее размеченного классификатора.
  • LLM для инсайтов, а не для тегирования. Мы используем LLM там, где она реально даёт ценность — в извлечении и формулировке инсайтов. А тегирование делает дообученная классическая модель, потому что она дешевле и стабильнее на массовом трафике.
  • Визуализация для бизнеса. Инженерный пайплайн без дашборда бесполезен. Мы продумываем не только ML-часть, но и то, как менеджмент будет смотреть на результат и принимать решения.

Другие наши проекты.

ai_hub — платформа для прототипирования AI-фич

Внутренняя площадка, где мы обкатываем AI-фичи на реальных сценариях до выката в прод: каталог прототипов, доступы, чат-оркестратор и RAG.

Подробнее

AI-движок для онлайн-образования

Модульный движок, на котором работает AI-тьютор: ведёт диалог со студентом, проверяет домашние работы, помнит учебный прогресс и даёт аналитику преподавателю.

Подробнее

Готовы обсудить задачу?

Начнём с бесплатного 30-минутного AI-аудита. Разберём ваши процессы и честно скажем, где AI даст эффект, а где нет.

Наши контакты

  • Россия, Ростов-на-Дону
    344019, Ростовская область, г.о. город Ростов-на-Дону, г. Ростов-на-Дону, ул. 11-я Линия, зд. 39
  • start@qwerty.digital
    8 (995) 797 17 17
    Telegram: @qwerty_digital_bot