Китайская компания Alibaba анонсировала нейросеть под названием EMO (Emote Portrait Alive), которая способна анимировать фотографии, заставив человека на фото петь или говорить.
Нейросеть обучали на 250 часах видеороликов, включая отрывки фильмов и выступления музыкантов. EMO напрямую преобразует звуковой сигнал в видео, а его длительность зависит от загруженного аудио. Разработчики отметили, что нейросеть может создавать реалистичные видео с разговорами и пением в разных стилях, что превосходит существующие современные методики по выразительности и реалистичности.
В данный момент технология находится на ранней стадии разработки и непонятно, когда появится в общем доступе.