Карел Ґотт повертається в ефір. Частину його книжки «Мій шлях до щастя» озвучив штучний інтелект його голосом
Автобіографічна книжка Карела Ґотта «Мій шлях до щастя» (Má cesta za štěstím), видана 2021 року, отримала унікальну аудіоверсію. Голос співака створив штучний інтелект. Це стало можливим завдяки Західночеському університетові в Плзені, який працює з технологією синтезу мови ще з 1990-х років, і компанії SpeechTech. Чи відчуєте ви різницю, коли почуєте зразки? Чи має штучний інтелект свої межі? Скільки часу присвятив проєктові шефрежисер Чеського радіо?
«Первісна ідея полягала в тому, що в рамках святкування 100-річчя Чеського радіо ми не хотіли тільки озиратися на минуле, а хотіли створити якийсь проєкт, який буде дивитися в майбутнє, тому штучний інтелект, природно, був серед пропозицій. А те, до чого радіо найближче, — це голоси, тому так усе і сталося», — пояснює створення проєкту «Ґотт назавжди» (GOTT NAVŽDY) програмний директор Ондржей Новачек.
А креативний продюсер Чеського радіо Лукаш Сапік додає: «Коли ми вирішили, що підемо в цьому напрямку, то шукали матеріал, який можна було б обробити таким чином, і знайшли автобіографію дуже відомої людини, яка мала великий зв’язок із радіо і в той же час уже не була з нами, тому не могла сама прочитати цю автобіографію своїм справжнім голосом».
«Такого запису потрібно досить багато. Ми записали з Карелом Ґоттом 250 програм «Знов перегляну цей фільм» (Zpátky si dám tenhle film). У кожній частині він говорить по 15—20 хвилин. Ми думали, скільки нам не вистачає. Коли ми передали це компанії, яка створювала цю голосову модель, то вона пізніше зв’язалася з нами і сказала, що їй було б потрібно більше, що їй цього замало», — згадує Ондржей Новачек.
І який результат? Чи відчуєте ви різницю, коли послухаєте запис?
Загалом Ґотт говорить дві з половиною години
Шефрежисер Алеш Врзак витратив на підготовку проєкту пів року роботи. Він пояснює, як саме буде використовуватися синтез голосу в окремих частинах: «Зазвичай це два, іноді три абзаци. Це близько десяти відсотків від кожної частини. Але якщо ви помножите це на ту величезну кількість, то фактично отримаєте дві з половиною години чистого Карела Ґотта».
Більшу частину книжки начитав актор Іґор Бареш: «Мені б це ніколи в житті на думку не спало. Мушу визнати, що Карел Ґотта мав дуже яскраве, насичене життя. Це найбільше, я думаю, за обсягом, що я досі начитав для радіо. Більшість начиток бувають із десяти чи п’ятнадцяти частин. А ця начитка має їх майже 75».
Слухачі почують загалом 49 вибраних розділів. Уся автобіографія в повному звучанні вийде у вигляді аудіокниги восени. Як зазначає креативний продюсер Лукаш Сапік, голос Ґотта, створений штучним інтелектом, стане вишенькою на торті.
Але штучний інтелект показав і свою обмеженість: «Синтез усе ще недосконалий. У нас було речення, де голос, створений штучним інтелектом, мав сказати, що Карел Ґотт зустрів когось на вечірці після оголошення результатів опитування телеглядачів про найулюбленіші обличчя і передачі телебачення TýTý. У нас було 60 версій цього речення, і в жодній із них голос штучного інтелекту не зміг вимовити «TýTý». У всіх 60 версіях він сказав: «Після вечірки те-довгий іпсилон-те-довгий іпсилон».
А як насправді створюється штучний голос?
«Спрощено можна сказати, що він розрізав Карела Ґотта на окремі літери. Потім ми дали йому текст, який хотіли начитати, і він склав літери назад у нові слова, які ми від нього хотіли, але це справді велике спрощення», — пояснює Лукаш Сапік.
Івана Ґоттова: Карел був зачарований новими технологіями, проєкт привів би його в захват
Усе було зроблено з дозволу дружини Ґотта Івани Ґоттової. «Улюбленою фразою Карела була: «А що на це скажуть люди?» Але через те, що Карел любив дивувати своїх шанувальників і друзів, а також захоплювався новими технологіями й інноваціями, я була переконана в душі, що він був би в захваті і підтримав би цей проєкт».
«Ніхто ніколи не робив тут нічого подібного на такому рівні. Я відчуваю полегшення від того, що через рік ми змогли дотягнути його до кінця, що він вийшов якісним. У той же час я відчуваю напругу, тому що в Карела Ґотта, можливо, мільйони шанувальників у цій країні, і кожен буде оцінювати це. Але мене справді захоплює те, що ми так трохи ніби кинули виклик долі, ми так трохи ніби повернули Карела Ґотта серед нас», — сказав програмний директор Чеського радіо Ондржей Новачек.
Радіо замовило юридичний аналіз і розробило загальні правила поводження з синтезованим голосом. Наприклад, ідеться про те, що штучний інтелект ніколи не має сказати нічого такого, чого б насправді не сказала дана людина. Ніщо не повинно бути вирвано з контексту і використано для інших цілей, і завжди має бути зазначено, що голос був створений штучним інтелектом.