Microsoft представила нейромережу VALL-E, яка може
скопіювати голос будь-якої людини — для цього їй потрібно не більше трьох секунд запису оригінального голосу.
Система включає нейронну мовну модель,
в основі якої лежить EnCodec. Вона розділяє голос людини на компоненти та зіставляє зі своєю базою даних, будуючи нові фрази.
@itmemeua