Як світові медіа експериментують з аудіо

Одна з цікавих переваг (а часто й небезпек) штучного інтелекту — відтворення усного мовлення. Деякі редакції вже використовують штучний інтелект для створення аудіоверсій текстових статей. Про це зазначає Марк Літтл — медіапідприємець і консультант, який модерував панель «Новий голос журналістики: аудіоновини в епоху штучного інтелекту» на цьогорічному International Journalism Festival у Перуджі. Спікерами панелі стали:

Шеріл Брумлі — керівниця відділу аудіо The Financial Times;
Езра Іман — директор зі стратегії та інновацій NPO — ГО, яка адмініструє суспільне мовлення Нідерландів;
Лена Беате Хамборг Педерсен — старша продукт-менеджерка норвезької газети Aftenposten.

Також переповідаємо основне з розмови «Видавничі аудіопрограми в Європі та США: що далі для аудіоновин?» Мукули Девічанда — керівника аудіопрограм для NYT Audio — з Рене Каплан — керівницею відділу новин на франко-німецькому міждержавному культурному телеканалі ARTE про аудіопрограми й розвиток аудіозастосунків.

Як редакції можуть використовувати аудіо?

Редакція норвезької щоденної газети Aftenposten помітила, що багато передплатників видання не користуються підпискою. Крім того, редакція прагнула «омолодити» авдиторію, оскільки її середній вік у виданні був 52 роки. Команда припустила, що саме слухачі залишаються передплатниками газетами довше.

Редакція раніше вже використовувала штучний інтелект. Зокрема, три роки тому видання спробувало клонувати голос одного з ведучих подкасту.

«Ми також помітили, що все більше людей купують airpods, тож це була чудова можливість для авдиторії взаємодіяти з нашим контентом під час бігу, поїздок на роботу, приготування їжі чи прибирання», — говорить Лена Беате Хамборг. Вона додає, що проти англійської версії озвучки, звучання норвезькою не було ідеальним. Проте це все одно була ще одна можливість для редакції охопити більшу авдиторію, яка бачила в цьому цінність.

Перші експерименти надихнули Aftenposten створити плейлисти.

За останні роки редакція дізналася, що більшість аудіостатей тривають приблизно три з половиною хвилини. Це незручний формат, оскільки доводиться постійно перемикати на наступний запис. Щоб розв’язати проблему безперервного прослуховування, команда створила списки відтворення. Завдяки цьому збільшилася кількість прослуханих статей підряд на одного підписника — від одного-двох до п’яти-восьми. Пізніше плейлисти вирішили персоналізувати, проте, каже Лена, люди люблять нове й цікавляться не лише тими темами, які пропонує їм алгоритм.

Інклюзивність

Aftenposten також створили продукт для дітей, які мають дислексію або розлад уваги. Крім того, приблизно 25 % дітей, віком від 9 до 14 років (серед тих, хто може обирати формат), обирають аудіо. Команда також пропонує текстові й аудіоматеріали мігрантам сімома різними мовами, серед яких і українська.

Аудіо зі штучним інтелектом також робить контент доступним і для дорослих, які мають труднощі з читанням. Лена Педерсен каже, що плакала, коли отримала листа від 30-річної жінки зі РДУГ (розладом дефіциту уваги з гіперактивністю, — ред.): «Вона сказала, що ніколи не могла прочитати наші статті, і щаслива, що тепер може їх слухати».

Зараз команда експериментує з коротшими текстами для аудіо, щоб іншим способом озвучувати цитати й абревіатури.

Езра Іман каже, що Голландський фонд громадського мовлення NPO довго працює з радіо й телебаченням, тому має вибудувану розгалужену екосистему аудіо. Зокрема, команда створила відеоподкаст для дітей від 8 до 12 років, які мають проблеми зі слухом. Проте використання штучного інтелекту змінило процеси в організації, оскільки тепер вона враховує всі можливості штучного інтелекту й машинного навчання. До звичайних процесів додалося, зокрема, генерування рекомендацій контенту й маркування.

Також команда мовника розглядає нові способи редагування аудіо, експериментує зі створенням голосових клонів і перекладом, щоб не обмежуватися лише нідерландською мовою.

Зв’язки з авдиторією

Іман наголошує, що у NPO хочуть використовувати штучний інтелект для налагодження зв’язків, залучення й утримання нової авдиторії, підвищення довіри й медіаграмотності. У проєкти додали ШІ-зображення для візуалізації. Також команда створила проєкт з інтерактивними прогулянками — слухачі можуть почути фрагмент історії Нідерландів, перебуваючи в якомусь історичному місці.

Серед успіхів у цьому напрямі The New York Times — 100 млн завантажень для всього свого аудіоконтенту на місяць, включно із флагманським подкастом The Daily — найбільшим новинним подкастом у США. За останні пів року застосунок видання NYT Audio, в якому зібрали всі щоденні матеріали видання в одному місці, завантажили мільйон разів. Застосунком можуть користуватися лише передплатники. Мукул Девічанд каже, що це все одно, що натиснути кнопку play на The New York Times.

Редакція також випускає Reporter Reads — аудіоконтент, де репортер читає частину своєї історії, а потім ділиться процесом роботи над нею. Торік там створили 2300 таких історій, в яких взяли участь 600 репортерів.

Читати більше: The New York Times планує автоматично озвучувати статті

Недоліки й обмеження впровадження ШІ в аудіо

Редакція Aftenposten отримує багато листів про те, що штучний інтелект усуває людську участь у більшості сфер нашого життя, і робить це надто добре. Зокрема, важко відрізнити штучний клонований голос, коли той говорить американською англійською. Проте інші мови досі вимагають доопрацювання. Наприклад, у скандинавських мовах значення слова дуже залежить від наголосу. Поки що штучний інтелект із цим не може впоратися. Лена Педерсен каже, що інколи люди думають, ніби редакція найняла людину, яка погано озвучує тексти норвезькою. Натомість команда працює з лінгвістом, який виправляє неправильно промовлені слова.

Езра Імен каже, що, ймовірно, цієї проблеми не буде через рік, оскільки моделі штучного інтелекту швидко розвиваються. Він вважає, що справжня проблема може виникнути тоді, коли до функцій ШІ додаватимуть емоції. Наприклад, коли редакції замінюватимуть голос очевидця подій, який хоче залишитися анонімним: скільки смутку потрібно додати в репліку? Лена додає, що неважливо чи голос штучний, чи справжній. Головне — контент і теми, які цікавлять вашу авдиторію.

Орієнтування на слухача

Шеріл Брумлі, керівниця відділу аудіо The Financial Times, говоритье, що видання намагається розширити авдиторію завдяки аудіо й технологіям. Вона каже, що команда не використовує штучний інтелект активно для нових ініціатив, проте намагається впровадити інновації у свої старі проєкти. Наприклад, від 2016 року The Financial Times випускало інтерв’ю у програмі TechTonic, а 2019 року переформатувалося. Пізніше команда провела опитування, в якому зрозуміла, що авдиторія не може виробити звичку слухати довгі епізоди, тому цьогоріч команда почала робити короткі подкасти, розбавляючи їх довшими версіями.

Рене Каплан, керівниця відділу новин суспільного мовника ARTE, зазначила, що рекламний ринок подкастів скорочується, і є відчуття, що подкасти досягли свого піка. Зокрема, у США вже є мільйони подкастів, тож ринок перенасичений цим форматом.

Редактор програм NYT Мукула Девічанд каже, що подкастинг не застрахований від тих самих проблем, що й решта індустрії новин: попит на якість, довіра «під мікроскопом», дезінформація й величезний вибір різних пропозицій для споживачів. Редакції почали закривати свої подкаст-відділи, серед яких BBC, NPR.

Проте попит на цифрове аудіо все одно зростає.

Команда створила застосунок NYT Audio, в якому прагне робити менше акцентів на шоу і більше — на побудові стосунків зі слухачами.

Гонитва за новим

«Подкаст — це монолог або діалог, до якого люди приходять, щоби створити фактично парасоціальні стосунки з автором [відчуття близькості споживача медіа до відомої персони — авт.], а не лише отримати інформацію та розважитися. Я думаю, що можливості штучного інтелекту можуть підірвати цю близькість», — каже керівниця відділу аудіо The Financial Times Шеріл Брумлі. За її словами, побудова близьких стосунків виробляє звичку споживати продукт, тому команда медіа обережно ставиться до технологій ШІ. Подкасти слухають під час поїздок, обіду, миття посуду й у спортзалі, і поки що ці речі незмінні, щоб думати про радикальні зміни формату. Важливо, каже Брумлі, — зберегти фокус на авдиторії та її потребах, а не на самому лише факті застосування інновацій.

Марк Літтл додає, що рутина — звички й розпорядок дня — важливіші для зумерів, ніж загальні вподобання: «Ми всі шукаємо нову блискучу річ, яку одразу зможемо виробляти. Проте гонитва за нею — поганий спосіб упроваджувати інновації».

Езра Іман підсумовує, що редакції можуть припуститися помилок, але вибудувати загальну стратегію та правила можна через експерименти.

Читайте також:

Як світові медіа експериментують з аудіо? Кейси FT, NYT, NPO й Aftenposten

Як редакції можуть використовувати аудіо?

Інклюзивність

Зв’язки з авдиторією

Недоліки й обмеження впровадження ШІ в аудіо

Орієнтування на слухача

Гонитва за новим

Читайте також

«Медіамейкер» зупиняє роботу. Що буде далі?

«Китайське обладнання з польськими етикетками». Розслідування від «18000» про те, яке медобладнання в Черкасах купують за десятки мільйонів гривень

22 пацієнти втратили зір після ін’єкцій. Як NGL.media розбиралися в тому, що сталося в офтальмології на Тернопільщині

Незадекларована розкіш. Як «18000» вивчали розрив між доходами та способом життя родини секретаря Черкаської міськради

«Жирний мільйон»: як розслідувачі «Четвертої влади» виявили закупівлю владою жиру невідомого походження в Рівному

Розслідувальна журналістика в дії: 10 кейсів того, як медіа викривали корупцію в регіонах України

Хто ми?

Медіамейкер

Розділи

Соцмережі