Отчеты о тревел-грантах: конференция INTERSPEECH 2020

Двадцать первая международная конференция INTERSPEECH 2020 в этом году проводилась с 25 по 29 октября в городе Шанхай, Китай. Но в связи с пандемией COVID-19, организаторами конференции было принято решение провести конференцию в онлайн формате.


Участники конференции должны были подготовить две версии доклада в видео формате: краткая версия (1,5 минуты), состоящая из титульного и обзорного слайда, и длинная версия (15 минут), детально описывающая весь доклад. На презентацию доклада отводилось 5 минут: 1,5 минуты на короткое видео, которое проигрывалось волонтерами во время конференции, и 3,5 минуты для ответов на вопросы. Короткие и полные видео-презентации докладов доступны на официальном сайте INTERSPEECH20. Конференция INTERSPEECH была посвящена таким вопросам, как: (1) восприятие речи человеком, (2) фонетика, фонология речи, (3) анализ паралингвистических явлений в речи и в языке, (4) распознавание речи, (5) анализ речи и звуковых сигналов, (6) кодирование и улучшение речи, (7) синтез речи, (8) распознавание речи — обработка речевого сигнала, надежность акустического моделирования и адаптация, анализ лингвистических компонентов, технологии и системы распознавания речи, (9) обработка разговорной речи — обобщение, понимание, перевод и поиск информации в речи.


В этом году сотрудники лаборатории речевых и многомодальных интерфейсов Маркитантов М.В, Верхоляк О.В. и Карпов А.А., совместно с иностранными коллегами из Германии и Нидерландов принимали участие в международном соревновании по компьютерной паралингвистике (ComParE — Interspeech Computational Paralinguistics ChallengE) в подзадачах Breathing, Mask и Elderly Emotion и заняли первые места в подзадачах Breathing и Elderly Emotion. По результатам ComParE были подготовлены и представлены 2 доклада.


На конференции были представлены доклады:

  • Maxim Markitantov, Denis Dresvyanskiy, Danila Mamontov, Heysem Kaya, Wolfgang Minker, Alexey Karpov “Ensembling End-to-End Deep Models for Computational Paralinguistics Tasks: ComParE 2020 Mask and Breathing Sub-Challenges”;
  • Gizem Soğancıoğlu, Oxana Verkholyak, Heysem Kaya, Dmitrii Fedotov, Tobias Cadée, Albert Ali Salah, Alexey Karpov “Is Everything Fine, Grandma? Acoustic and Linguistic Modeling for Robust Elderly Speech Emotion Recognition”. Статьи опубликованы в трудах высокорейтинговой международной конференции INTERSPEECH 2020.