Get Mystery Box with random crypto!

Початок ери синтетичних голосів в аудіокнигах? Про спроби зде | Перехідник на Книжковий бункер

Початок ери синтетичних голосів в аудіокнигах?

Про спроби здешевити процес створення аудіокниг говорять давно. Це найдорожчий книжковий формат: його собівартість вища, ніж у паперової та електронної книг. Наприклад, є статистика, що у США створення 10-годинної аудіокниги (еквівалент 75’000 слів) коштуватиме видавцеві від $3000 до $15000 за умови, що озвучує книгу професійний, але не зірковий актор.

Сучасні технології швидко запропонували вихід — перетворення тексту на аудіо за допомогою штучного інтелекту. Зараз вже навіть є більш-менш офіційний термін — «synthetic narration».

Загальноприйнятним є твердження, що ці «синтетичні» голоси не можуть дати читачеві ні відтінків чи емоцій, ані належної якості начитки. Тому деякі сервіси доступу до аудіокниг навіть прямо вказують: «Ми не використовуємо штучні голоси, працюємо лише зі справжніми професійними акторами».

А далі на арену виходить корпорація Google. Її спеціалісти разом із обраними видавництвами протестували бета-версію власної системи «synthetic narration». Результат пілотного проєкту перевищив усі сподівання!

Відтепер у 6 країнах світу (США, Британія, Канада, Іспанія, Австралія, Нова Зеландія) будь-яке видавництво може скористатися цією технологією у сервісі Google Play Books. Штучний інтелект начитає текст книги англійською та/або іспанською мовами. Доступно 35 різних синтетичних голосів. Для таких аудіокниг — видавець отримуватиме 52% доходів від продажу аудіокниги, решту забиратиме Google.

До слова, коли думаємо «ох, і як же передати емоцію, інтонацію штучним голосом?», треба постійно нагадувати собі, що є величезна категорія академічних книг, а найбільшим шматом комерційної категорії є нонфікшн для дорослих. І вони не вимагають аж такого рівня нарації, як худліт.

Тому вже можна приглядатися до нової фази розвитку «synthetic narration», бо за цими 6 країнами та 2 мовами явно підуть інші.