AI ассистент на базе LLM (GigaChat API) и Whisper

Командой LikeVR был реализован проект, дающий пользователю возможность общения голосом с виртуальным персонажем в реальном времени. Решение было использовано на стенде компании на выставке ПМЭФ, и было предназначено для привлечения внимания, и автоматизации общения с посетителями в формате консультанта. Решение было реализовано на базе движка Unity и включало несколько модулей:

  1. Трехмерная сцена с виртуальным персонажем, с ригом тела и лицевым ригом. Лицевой риг работал в связке с lip sync модулем Salsa. Также, отдельно были доработаны некоторые анимации фонем
  2. Модуль распознавания голоса в текст
  3. Интеграция GigaChat API, через которую полученный текст отправлялся в гигачат, а также получался ответ от него. Дополнительно был настроен контекст коммуникации шаблон промпт-сета, и настроен доступ к библиотекам, хранящим данные, используемые в ответах (информация о компании и т.д.)
  4. Локально используемая модель Whisper, для которой был настроен голос виртуального ассистента. Модуль предназначен для озвучивания текста, полученного от гигачата.

Среднее время ответа, в зависимости от объема запроса и ответа составило 1,8 с

Последние статьи

Связаться с нами

Моментальный расчёт