ИИ-суфлёр для медконференций: 95% точность распознавания

Web
Команда
1
ML-инженер
Техстек
Fastapi
WebRTC
WebSocket
SocketIO
PyTorch
ONNXRuntime
Docker
Web
О клиенте
Лидер в области лабораторной диагностики, агрегирующий результаты анализов с ведущих медлабораторий и поставляющий цифровые сервисы на медицинские конференции.
Компания предоставляет организаторам мероприятий платформу для повышения качества контента, включая инструменты для поддержки докладчиков и слушателей в обработке сложной медицинской информации.


Бизнес-задачи
Дать докладчикам инструмент‑суфлер на отдельном экране с транскрипцией их речи в реальном времени.
Обеспечить синхронный перевод выступления в текст, включая большое количество медицинских терминов и латыни.
Сделать возможность для слушателей получать текст доклада и перевод на личные устройства по ссылке.
Реализовать решение с минимальными требованиями к инфраструктуре заказчика.
Вызов
Основным вызовом стали ограничения инфраструктуры: изначально с командой клиента обсуждалась архитектура с развёртыванием собственных моделей распознавания речи и перевода на стороне клиента, однако выяснилось, что у заказчика нет подходящих вычислительных мощностей и бюджета под их поддержку.
Дополнительно усложняли задачу: доменная область (медицина с большим количеством узкоспециализированной терминологии и латыни), жёсткие сроки до первой конференции и отсутствие полноценного пайплайна офлайн‑оценк и качества распознавания.

