Додаткова цінність через аудіо. Чому «Forbes Україна» почали озвучувати свої тексти

Додаткова цінність через аудіо. Чому «Forbes Україна» почали озвучувати свої тексти

П’ятниця, 24 Січня, 2025

Кейси й рішення

Вероніка Нановська

Розвиток технологій значно змінив споживання контенту. Однією з останніх тенденцій, що швидко набирає обертів, стала аудіоозвучка статей. В Україні такі формати вже впроваджують кілька медіа, зокрема мережа гіперлокальних видань «Місцеві медіа», «24 канал» і hromadske. Досвід останніх показав, що озвучка позитивно впливає на «глибину перегляду» сайту та збільшує час, проведений користувачем на платформі. 

9 січня Head of Digital Forbes Віктор Кіщак повідомив про запуск аудіоновин із використанням голосу редакторки Forbes. Ми запитали про мету нового формату, процес впровадження його на сайті й нюанси роботи із сервісами.

Навіщо Forbes аудіоозвучка

«Ще до стрибка в розвитку OpenAI, західні медіа вже мали змогу синтезувати та озвучувати тексти англійською. Для української мови це довгий час залишалося проблемою», — каже Віктор Кіщак. 

Останні кілька років ми спостерігаємо стійкий інтерес до аудіоформатів у провідних західних медіа. У The Economist чи Wall Street Journal аудіоформат текстів існує вже понад п’ять років. Їхні сервіси, зазначає Кіщак, дають змогу користувачам обирати між читанням і слуханням текстів, що спрощує споживання контенту і є конкурентною перевагою. 

Впровадження озвучки текстів стало не лише даниною моді, а й вагомим інструментом для розширення авдиторії та підвищення її залученості. З розвитком технологій синтезу голосу, які впроваджують такі компанії як OpenAI та ElevenLabs, цей процес стає все доступнішим для різних мов, включно з українською.

Forbes запустив новий формат понад місяць тому, хоча вже давно планували озвучення текстів як одну з переваг для передплатників. Наразі озвучують лише матеріали за пейволом. Читачі, які не оформили підписку на видання, бачитимуть лише пропозицію оформити її. Для підписників аудіоформат стає доступним без обмежень.

Як це впроваджувалося

Для озвучки Кіщак обрав сервіс ElevenLabs. Програма дає змогу створювати голосові клони авторів. Для швидкого клонування завдяки 5–10 хвилинам запису власного голосу можна створити його цифрову копію для озвучення текстів. Такий запис буде менш точним.

«Я протестував ElevenLabs, записавши свій голос у примітивних умовах. Результат вразив — навіть не у студійних умовах сервіс створив хорошу копію мого голосу», — розповідає Head of digital Forbes.

Натомість для професійного клонування голосу потрібно записати від 30 хвилин до двох годин аудіо з чіткою дикцією та різноманітними текстами. Також сервіс має бібліотеку голосів. Наразі голосів з українською мовою мало, проте можна знайти універсальні варіанти, спеціалізовані для певного типу контенту (наприклад, лекцій або інформаційних матеріалів).

Команда записувала кілька голосів для озвучення, щоб обрати найкращий. Наразі тексти авторок на сайті Forbes озвучує жіночий голос редакторки Таїси Мельник, а авторів — чоловічий, який поки що взяли з бібліотеки голосів. Наразі в команді думають, кого залучити для озвучування. Оскільки використовуючи озвучення, яке базується на голосі конкретної людини, необхідно узгоджувати юридичні моменти, видання формує необхідні документи. Наприклад, якщо редактор або редакторка, чий голос використовується, звільниться, необхідно заздалегідь визначити, чи можна продовжувати використовувати цей голос. 

На сайті є окрема сторінка, де зібрані всі тексти з аудіоозвучкою. Вона може працювати як стримінг: після ввімкнення першого тексту, наступні озвучуватимуться автоматично.

Аудіоверсії текстів на Forbes Україна

Поряд з аудіоверсією також є попередження, що воно згенероване штучним інтелектом і може мати помилки вимови. 

Аудіоверсії текстів на Forbes Україна

Проблеми із запуском формату

Для роботи нової технології залучали редакторів, які записували аудіо на основі текстів із різних тематик — від IT та інновацій до матеріалів про війну. Це дало змогу створити голосові моделі, які відображають стиль авторів і тембр їхнього голосу. Однак виникли й труднощі:

Відтворення цифр і спеціальних термінів. Сервіси ШІ-озвучки непогано навчились говорити українською приблизно півтора року тому. І хоча зараз озвучення стало набагато точнішим, воно все ще потребує вдосконалення. Одним із викликів стала некоректна озвучка цифр та абревіатур. Наприклад, «10 000» озвучується як «десять три нулі» або просто проковтує цифри. Проблеми можуть виникати і з назвами компаній або технічними термінами. Це можна розв`язати через створення словників для специфічних термінів.

Технічні обмеження й вартість. Наприклад, тексти, що перевищують 10 000 знаків, не можна озвучити без попередньої розбивки. Більш масштабні проєкти вимагають тарифів із більшими лімітами (до 500 тисяч знаків або більше). У тарифі за $100 доступна озвучка 500 000 знаків на місяць. Для Forbes цього вистачає на майже 100 текстів. Крім того, потрібно враховувати регенерування текстів: якщо в опублікованому вами матеріалі будуть фактологічні помилки, то після їх виправлення в тексті потрібно перегенерувати аудіо.

Тарифи сервісу ElevenLabs

Якість записів. Голосові клони іноді демонструють різницю в якості через неідеальні умови запису чи особливості дикції авторів. Для клонування команда використала 30-хвилинні записи, проте для професійного озвучування рекомендують використовувати запис на 2 години. Також для кращої якості звуку краще записувати голоси у студії. 

Кіщак радить користуватися Support-підтримкою: там завжди пояснять незрозумілі моменти й підкажуть варіанти впровадження. Можна також скористатися гайдом.

Планування промо

Важливим аспектом впровадження озвучення є правильне просування. Якщо авдиторія звикла до традиційного текстового контенту, необхідно активно інформувати про нову функцію. 

Віктор Кіщак пояснює, що це можна робити через соцмережі, розсилки, «попапи» на сайті та інші канали комунікації. Для цього доцільно розробити чіткий план промоактивностей, які допоможуть поширити інформацію.

Наразі Forbes відстежує такі метрики:

За кілька тижнів після запуску видання завдяки аудіо помітило десятки нових підписників і тисячі прослуховувань.