Нейросеть научилась переводить текст в жестовую речь

Разработчики из Великобритании научили нейросеть превращать текст в видео, на котором человек произносит этот же текст на языке жестов. Статья, посвященная новому алгоритму, приближенному к искусственному интеллекту, появилась на портале arXiv.org.

В отличие от существующих алгоритмов такого типа, новая разработка британских ученых проверяет результаты своей работы после отрисовки видео — за счет этого качество работы растет на порядок. О том, как устроена технология, рассказали ее авторы — ученые под руководством Ричарда Боудена из Университета Суррея.

"Особенность нашего алгоритма — более качественный синтез кистей, которые очень важны для корректной передачи информации при помощи жестовых языков. ИИ принимает данные в виде текста и создает скелетную модель тела, которая используется для передачи текста в виде жестов", — говорит Боуден, добавляя, что для переноса векторных движений на реалистичное видео используется сверточная нейросеть U-Net.

Результаты нейросети размечались при помощи алгоритма OpenPose. Алгоритм сравнивал свои результаты с результатами аналогичной работы, проделанной людьми, и совершенствовался, достигнув в итоге значительного прогресса. Авторы технологии говорят, что речь идет о самом качественном в мире ИИ-сурдопереводчике — новый алгоритм значительно превосходит существующие аналоги.

Мне нравится
12