У дослідженні The European Broadcasting Union, яке провели 2024 року, вказують, що редакції не вміють ставити потреби потенційних клієнтів на перше місце, думаючи про інновації. Коли в 1990-х роках інтернет підривав журналістику, у відповідь більшість редакцій перенесли свою логіку роботи із друком на вебсайти. Вони робили те, що вміли, а не те, що може знадобитися їхнім користувачам. Навіть великі технологічні компанії не застраховані від цього мислення: Google Glass і Metaverse, кажуть у звіті, поки що не задовольнили потреби клієнтів.
Нерідко експерименти з ШІ у виданнях обертаються низкою помилок чи гучним провалом. Але це не означає, що нову технологію треба боятися чи оминати
Розглядаємо кейси із дослідження і переповідаємо статтю Гейба Булларда для NiemanReports, в якому він наводить вдалі приклади, де ШІ допоміг редакціям оптимізувати роботу, налагодити зв’язок із читачами й охопити нові авдиторії.
Експерименти видань із ШІ
Публічний запуск таких генераторів зображень, як DALL-E і Stable Diffusion, а також чат-бота ChatGPT призвів до того, що користувачі заполонили соцмережі текстами та зображеннями, які генерує ШІ. Деякі медіа теж почали експерименти з ШІ, які інколи доводиться зупиняти. Так, на початку 2023 року сайт технологічних новин CNET оголосив, що призупиняє свою програму написання статей за допомогою штучного інтелекту після того, як статті містили не лише багато помилок, але й плагіат.
Матіас Допфнер, генеральний директор німецького видавництва Axel Springer, яке нещодавно придбало Politico, написав у лютому в електронному листі компанії, що ШІ має потенціал зробити незалежну журналістику кращою, ніж вона коли-небудь була — або просто замінити її. У січні Buzzfeed оголосив, що використовуватиме технологію OpenAI для автоматизації написання своїх фірмових вікторин. Пізніше компанія закрила BuzzFeed News і почала публікувати статті про подорожі, написані за допомогою ШІ.
Читати більше: Редакції експериментують із ШІ, але меншість використовує його у своїй роботі
Водночас The New York Times, CNN, Reuters, Chicago Tribune, ABC і австралійські бренди Community Media блокують вебсканер OpenAI. NYT також розглядає судовий позов проти OpenAI за порушення прав інтелектуальної власності. Це доповнює довгий список позовів, з якими вже стикається OpenAI.
Читати більше: Що кажуть закони різних країн про авторські права та штучний інтелект
Утім, впровадження ШІ в редакційні процеси також має величезні переваги. Дослідження, яке провів Reuters Institute, показало, що дві третини опитаних редакцій використовують штучний інтелект для персоналізації читацького досвіду. ШІ автоматизує багато завдань і допомагає редакціям достукатися до читачів онлайн новими мовами та конкурувати на глобальному рівні. Він вивчає історії видавців, щоб знайти закономірності в поведінці читачів, і використовує ці закономірності, щоб пропонувати читачам історії, на які вони з більшою ймовірністю натискатимуть. ШІ навіть заповнює шаблонні абзаци й допомагає авторам з чернетками.
Основна роль журналістики для людей і суспільства не змінилася з роками. Медіа так само як і раніше мають надавати факти як основу для ухвалення рішень і публічних дебатів, притягати владу до відповідальності, пояснювати, навчати, налагоджувати зв’язок громадськості з елітами й навпаки тощо. Проте в сучасному інформаційному й комунікаційному середовищі журналістика стикається з уникненням і відсутністю інтересу до новин, зниженням довіри, дезінформацією та конкуренцією з альтернативами новинам.
Ми можемо лише припускати, що люди хочуть персоналізованих новин. Щоб зрозуміти це, потрібно дослідити поведінку користувачів, оскільки специфіка новин відрізняється від списку відтворення Spotify, де користувачі можуть слухати схожі пісні знову і знову. Ось чому дивувати людей чимось свіжим і невідомим залишатиметься однією з головних завдань журналістики. Щоб подолати ці виклики, деякі медіакомпанії вже оновили свої стратегії, орієнтуючись, зокрема, на нові технології і потреби. Тепер, наприклад, ШІ-інструменти можуть зробити контент більш доступним, представивши його в різних форматах для різної авдиторії (перетворювати текстові матеріали на відео тощо).
Оновлення погоди й ситуації із заторами
Британський мовник BBC і німецька громадська телерадіокомпанія Rundfunk Berlin-Brandenburg (RBB) запровадили автоматичні метеорологічні служби із синтетичними голосами до прогнозів, які надають люди.
BBC пропонує місцевий аудіопрогноз із оновленнями чотири рази на день щодня. Синтетичний голос BBC навчався на 3000 промовлених людиною реченнях, щоби створити голосовий клон, який може читати прогноз погоди. Зареєстровані користувачі в новинних застосунках BBC, які слухають радіо через розумні колонки з використанням голосового асистента Alexa, також чують синтетичний голосовий прогноз погоди. Він підлаштовується під населений пункт за поштовим індексом користувача після новин місцевої радіостанції. А RBB використовує ШІ, щоб надавати інформацію про дорожній рух кожні 15 хвилин.
Обидві компанії попереджають користувачів про те, що звіти про погоду читаються синтетичним голосом у їхніх продуктах.
Медіа помітили збільшення інтересу до програми, оскільки інформація про погоду й затори має високий попит. Це також економічно ефективно, оскільки такі впровадження відносно дешеві для розроблення новими моделями ШІ. Водночас компанії не використовують (і не планують) штучний інтелект у новинах (хоча BBC стверджує, що синтетичний голос можуть використати для начитування іншого контенту, якщо в майбутньому це буде потрібно).
Живі субтитри для івентів
Щороку VRT (фламандські громадські медіа) проводять De Warmste Week. Це семиденна радіотрансляція з площі ‘t Zand у місті Брюгге, де вони збирають гроші й інформують людей про різні благодійні організації та справи. Окрім радіотрансляції, програма доступна на цифровій платформі VRT Max.
De Warmste Week хотіли впровадити живі субтитри для шоу. Для цього VRT почали співпрацю з EuroVox — ШІ-інструментом транскрипції та перекладу від EBU (Європейської спілки радіомовлення і телебачення). Прямі транскрипти автоматично інтегрувалися у відеосигнал на VRT MAX. Більшість людей (85 % із 1200 опитаних) оцінили таку послугу, навіть якщо транскрипція не завжди була ідеальною.
Обслуговуванням споживачів у VRT займалося шість людей, а до розроблення залучили різні команди з радіо й телебачення. Цей процес зайняв трохи більше ніж місяць. Наразі у VRT думають, як інтегрувати технологію далі.
Автоматична транскрипція аудіоновин
Австралійська телерадіомовна корпорація (ABC) і Шведське радіо (SR) роблять стенограми подкастів, щоб покращити доступність аудіоконтенту. SR працює із проєктом для авдиторії з вадами слуху: дослідження Шведського радіо показало, що 1,5 млн шведів із 10,5 млн населення мають певні проблеми зі слухом.
ABC розробила власну платформу транскрипції на основі штучного інтелекту, яка інтегрована в її систему керування контентом. Ця платформа використовує машинне навчання для постійного покращення якості транскрипції. ABC тестує цю платформу з середини 2023 року й покращує її функціональність, оскільки різноманітність контенту створила для команди розробників багато проблем. Зокрема, ABC вручну виправляє всі свої розшифровки (в корпорації вважають, що стенограми найбільш корисні для коротких, попередньо записаних звітів і для невеликих інтерв’ю, а контент із багатьма голосами, музикою та звуковими ефектами може бути заскладним для ШІ).
На відміну від ABC, SR автоматично транскрибує у своєму застосунку без нагляду людини. Тексти супроводжуються застереженням про те, що вони можуть містити помилки. Проте радіо має цілу команду розробників, які займаються ШІ-інструментами для текстів. Автоматична транскрипція є одним із головних їхніх завдань.
За словами обох компаній, за останній рік точність транскрипції суттєво покращилася, але для подальшого редагування та форматування потрібно багато ручної роботи.
Пояснення складних тем
Коли читачі зустрічають незнайомі терміни, вони можуть втратити зацікавленість. Тому статті BBC News мають бути доступними для будь-якої авдиторії: чи то новачки, чи знайомі з темою читачі.
Мовник створив прототип під назвою Tell Me More, який використовує автоматизацію та машинне навчання, зокрема GPT-3, для ідентифікації складних термінів у статті. Модель бере інформацію для пояснень з опублікованого контенту BBC. Ці чернетки потім можуть доопрацювати журналісти й додати їх у пояснювальний блок, що надає додатковий контекст статтям.
Відгуки авдиторії показали, що короткі пояснення на сторінці допомогли зробити новини більш доступними й корисними.
Взаємодія з авдиторією
Німецький суспільний мовник Bayerischer Rundfunk (BR) прагнув ефективніше взаємодіяти зі своїми онлайн-користувачами. Однак, отримуючи понад 4000 коментарів щодня, важко визначити ті, які потребують відповідей від редакції (тобто запитання чи пропозиції для тем). Крім того, менеджерам важко відповідати на безліч запитів від користувачів.
Лабораторія новин BR24 запровадила новий редакційний формат під назвою Dein Argument («Ваш аргумент»), який подають разом зі статтями BR24 на сайті. Dein Argument відбирає серед усіх повідомлень ті, які можуть підпадати під QA для редакції. Далі працює два інструменти:
- Інструмент розпізнавання коментарів. Він сканує розділ коментарів BR24 і шукає ті, які безпосередньо стосуються питань. Їх автоматично пересилають до редакторів Dein Argument через Microsoft Teams.
- Інструмент пошуку відповідей. Він допомагає команді швидко шукати відповіді на конкретні запитання користувачів у величезній базі даних BR24. Згодом інструмент пропонує відповідні текстові модулі для потенційних відповідей.
Наразі обидві системи штучного інтелекту на стадії раннього бета-тестування. Але навіть тепер результати є обнадійливими й команда вже планує перевести систему на регулярну роботу.
Збільшення доходів від читачів із кастомним ChatGPT
Незалежна південноафриканська платформа цифрових новин Daily Maverick використовує бізнес-модель, засновану на доходах від членства. Конверсія відбувається через електронну пошту. Оскільки різні типи авдиторії реагують на різні види маркетингових повідомлень, це, кажуть у медіа, вимагає багато складного копірайтингу.
Команда склала список найефективніших маркетингових повідомлень, які вона розсилає авдиторії. На основі цього розробляють гайд зі стилю копірайтингу й посібник для тих, хто займається маркетингом. Також створили спеціальний кастомний ChatGPT. Особа, яка відповідає за написання розсилок, отримує першу чернетку копії повідомлення до спільноти, яку генерує ШІ на основі заданих параметрів у боті. Потім це повідомлення налаштовують для різних сегментів авдиторії, яку визначила система електронної розсилки новин.
Аналіз Daily Maverick показує, що це підвищило коефіцієнт конверсії приблизно на 15–20 %. Крім того, це заощаджує кошти, оскільки GPT виконує свою роботу за $20 на місяць, що дешевше ніж наймання копірайтера. Проте кастомний чат-бот потрібно навчити базових даних, у цьому випадку — прикладів ефективних маркетингових повідомлень. Таким чином, важливо вимірювати успіх копії та робити висновки з цього. Після того, як всі вхідні дані підготують, навчання моделі можна виконати за 30 хвилин. А копірайтера можна навчити використовувати GPT ще протягом 30–60 хвилин.
The Daily Maverick планує створити індивідуальних «персональних помічників» на базі великих мовних моделей для всіх своїх штатних працівників, щоб перевіряти їхній контент, вносити пропозиції та допомагати авторам краще орієнтуватися англійською мовою (оскільки для багатьох із них це друга мова).
Переклад
У травні 2022 року фінський суспільний мовник Yle помітив аудиторію, до якої не достукався, — це десятки тисяч українців, які переїхали до Фінландії через повномасштабне вторгнення. Мовник пропонував новини фінською, шведською, англійською та російською мовами, проте знайти фінських журналістів, які б розмовляли українською, було важко.
Проєктний менеджер Yle News Lab Яркко Рюйнянен каже: коли почалася війна, кожна медіакомпанія була зацікавлена в українцях. Замість того, щоб переписувати статті новою мовою, Yle звернулася до програмного забезпечення для перекладу. Команда створила інструмент, який пропускав статті через чотири різні типи перекладацьких програм і представляв результати співробітникам, які знали обидві мови. Це дало змогу Yle публікувати переклад новин українською мовою з такою швидкістю, яка була б неможливою, якби новини писали та подавали одразу українською, як це відбувається з багатьма статтями для російськомовної та англомовної служб Yle.
За місяць до того, як Yle опублікував свої перші статті українською мовою, французька газета Le Monde запустила англомовне видання. Проєкт розпочався, коли репортер запропонував написати серію статей про французькі вибори 2022 року англійською мовою. Знаючи про ефективність машинного перекладу, Le Monde розглядала можливість запуску розсилки, яка пропонувала би 10–15 із понад 100 статей, які газета публікує щодня, у перекладі англійською мовою. Але штучний інтелект дав можливість запустити ціле англомовне видання.
Воно пропонує 40 статей щодня у будні та 30 статей щодня у вихідні. Як і україномовні матеріали Yle, англомовні публікації Le Monde пишуть та редагують рідною мовою видання, потім перекладають на англійську за допомогою штучного інтелекту. Перед публікацією це перевіряє редактор. Цей процес називають постредагуванням машинного перекладу (MTPE), і він дає змогу невеликій групі людей виконувати роботу багатьох.
До того, як стаття потрапляє на головну сторінку англомовного сайту, вона проходить через чотири пари очей і одну програму штучного інтелекту.
Le Monde співпрацює із зовнішніми компаніями, які спеціалізуються на MTPE (машинному перекладі). Одна з них — TranslationServices.com, яка пропускає статті через програму перекладу зі штучним інтелектом DeepL. Цей інструмент не просто перекладає слово за словом, як людина, що гортає словник. Він пов’язує фрази та контекст між словами.
Проте цей інструмент ще не настільки розвинений, щоб створювати переклади, які Le Monde публікував би без перевірки. Є пунктуаційні розбіжності та культурні відмінності, як-от опис органів місцевого самоврядування. Крім того, як зазначає Люк Палдер, виконавчий директор Translation Services, часто втрачається літературний стиль, і певні поняття можуть потребувати додаткових пояснень для аудиторії за межами Франції.
Le Monde також має посібник зі стилю для перекладачів, який пояснює ці відмінності та допомагає впорядкувати перевірку машинного перекладу.
Мета Le Monde — зробити англомовне видання джерелом прибутку. Газета сподівається мати 100 000 англомовних передплатників до 2025 року. Видання вважає своїми конкурентами BBC, The New York Times та The Washington Post. Ефективність ШІ дала змогу їм почати конкурувати з цими виданнями в глобальному масштабі.
Yle зіткнувся зі схожим викликом, коли шукав аудиторію для своїх українських новин. У них є читачі, але не так багато, як вони сподівалися. Самулі Сілланпяя, технічний директор Yle News Lab, припускає: це може бути пов’язано з тим, що аудиторія, на яку вони розраховують, воліє отримувати новини в іншому форматі. На щастя, штучний інтелект також можна використовувати для перекладу аудіо- та відеосюжетів, і Yle розглядає можливість його впровадження.
Аналіз тексту
Багато репортерів уже користуються системами штучного інтелекту, які є трохи простішими, ніж ChatGPT, і менш складними, ніж MTPE. Такі програми, як Grammarly, наприклад, сканують тексти на наявність граматичних помилок. Також вони пропонують способи уникнути фраз, які є технічно правильними, але можуть бути стилістично небажаними, наприклад, пасивний стан або поганий синтаксис.
2022 року співробітники The Atlanta Journal-Constitution побачили можливість переробити електронну розсилку, яку вони надсилають передплатникам у другій половині дня. Зак МакГі, старший директор із питань взаємодії з цифровою аудиторією газети каже: у них виникла гіпотеза, що це було б чудовим місцем для надання персоналізованих рекомендацій, тоді як інші розсилки газети куруватимуть редактори.
Для цього газета звернулася до бельгійської фірми Twipe, яка пропонує видавцям розсилки, що повністю куруються та розсилаються машиною. Програмне забезпечення Twipe працює за допомогою ШІ, який призначає категорії контенту видавця. У багатьох редакціях людина, яка завантажує історію в систему управління контентом, призначає теги та категорії на основі прочитаного тексту. Ці теги корисні не лише для рекомендацій, але й для визначення того, наскільки популярною є та чи інша тема. Але ці теги також можуть застосовуватися непослідовно. Штучний інтелект Twipe читає сотні статей і групує їх за категоріями на основі моделей використання слів, знаходячи тенденції, які людина може не помітити.
Twipe також аналізує історії, на які читач натискав, поки був авторизований у своєму акаунті. Потім він зіставляє історію цього користувача зі своїми автоматично створеними темами. Отримана розсилка — поєднання цих рекомендацій та історій, які є найбільш популярними на сайті видавця.
Наразі приблизно 50 000 передплатників Atlanta Journal-Constitution отримують щоденний післяобідній електронний лист, який повністю складає та надсилає штучний інтелект, з матеріалами, що базуються на їхній історії читання. МакГі каже, що ще 50 000 отримують розсилки, які редагує людина. Коефіцієнт відкритих листів, створених людиною, становить приблизно 5 %, тоді як для листів Twipe — 6,5 %. МакГі визнає, що це невеликий показник, але за шість місяців, протягом яких вони тестували розсилки, він зріс.
Інститут некомерційних новин (INN), що об’єднує понад 400 незалежних редакцій по всій країні, використовує програмне забезпечення Overtone для сортування сотень історій, які щодня публікують його партнери. Це сортування корисне для видавців у колективі, які можуть захотіти поділитися роботою партнера зі своєю аудиторією, але не мають часу прочитати кожну історію. ШІ класифікує історії за темами та форматами та представляє короткий список текстів, які відповідають критеріям видавця для поширення.
Зараз багато медіакомпаній запускають власні програми з підтримкою штучного інтелекту. Одним із прикладів є ШІ-інструмент для оптимізації робочих процесів MAGNA від данської медіагрупи JP/Politikens Hus.
Наприкінці 2023 року для журналістів медіа EkstraBladet із цієї медіагрупи впровадили тестову версію MAGNA, яку використовували у:
- статтях: для формування короткого змісту тексту, ідей заголовків, скорочення й пошуку схожих статей;
- прямих етерах: для резюмування ключових моментів, ідей заголовків й аналізу відгуків читачів;
- архіві: для розширеного пошуку, створення інформаційного блоку (бекграунду), резюмування справи.
Перевірка джерел та фактів
Цей вид аналізу можна використати не лише для узгодження історій з інтересами читачів. Інженери Yle досліджують, як штучний інтелект може сканувати історії для пошуку ознак упередженості. Це починається з відстеження демографічної інформації, походження та політичної приналежності джерел. У поєднанні з іншими аналітичними інструментами це означатиме, що редакція зможе бачити, кого цитують із яких питань, з якою частотою і в якому типі матеріалів.
Цей аудит джерел може піти ще далі, якщо застосувати NLP під назвою «аналіз настроїв». Це спосіб, за допомогою якого штучний інтелект визначає тон, вивчаючи зв’язок між словами. Деякі редакції використовують його, щоб попереджати редакторів про ненависні або агресивні пости в коментарях. Поєднання цього методу з тегами тем і відстеженням джерел допоможе їм «з’ясувати, яку термінологію використовують для обговорення певних тем», що, можливо, дасть змогу виявити несвідому упередженість в історіях.
Крім того, найкращим інструментом для боротьби з ШІ, що вводить в оману, може стати сам ШІ — інструмент, запрограмований на розпізнавання зображень або тексту, створених іншою машиною. 2023 року студент коледжу на ім’я Едвард Тіан випустив застосунок під назвою GPTZero, який оцінює ймовірність того, що текст був написаний ШІ.
Такі програми, як GPTZero, працюють, по суті, вимірюючи складність речень і діапазон вибору слів на письмі. ШІ має тенденцію повторювати шаблони, і детектори ШІ шукають їх. Тому NLP можна використовувати для пошуку мовних патернів, які часто зустрічаються в дезінформації:гіперзаангажованості, відсутності джерел, нечітких тверджень, токсичності. Такі інструменти можуть сортувати потік онлайн-контенту і виявляти дезінформацію, написаний штучним інтелектом текст і глибокі фейки з тією ж швидкістю, з якою їх створюють. А це набагато швидше, ніж може працювати будь-який фактчекер, що перевіряє факти.
Історії, які пише штучний інтелект
Не всі матеріали, написані штучним інтелектом, обов’язково є дезінформацією або містять неточності. Тисячі, а можливо, й мільйони споживачів новин уже отримали інформацію від статей, створених штучним інтелектом. Ще до того, як зайнятися перекладами, Yle почав використовувати ШІ для відстеження голосувань законодавців. Forbes має власні інструменти, які допомагають журналістам оптимізувати заголовки, генерувати описи та рекомендувати зображення для статті. AP використовує ШІ для звітування про прибутки компаній, щоб дати журналістам час зосередитися на глибоких репортажах, а The Washington Post використовувала технологію ШІ для репортажів про Олімпіаду та вибори.
Читати більше: AP укладає угоду з OpenAI щодо обміну новинами та технологіями
ШІ може писати такі статті, тому що вони засновані на відомих подіях, які дають чіткі дані: хокейні матчі закінчуються з рахунком, корпорації регулярно подають фінансові звіти, результати голосування публікуються у відкритому доступі.
Компанія Narrativa, яка генерує природну мову та співпрацює з видавцями, створила технологію, що лежить в основі інструменту, який The Wall Street Journal використовує для написання статей, комбінуючи абзаци про ринкові тенденції та фінансові дані. Проте Аліса Цайслер, тодішній редактор із досліджень і розробок The Wall Street Journal, зазначає, що коли комп’ютер зосереджується на питанні «що», репортери можуть зосередитися на питанні «чому».
Інструмент Narrativa навчається на даних із Dow Jones та архівів журналу — абзаци, які він пише, мають інституційний голос газети. Це також усуває питання власності на історію, написану машиною, яка навчена на роботі десятків тисяч різних людей. Девід Льоренте, генеральний директор Narrativa каже, що редакції мають використовувати лише свої архіви, якщо вони хочуть створювати власний контент і володіти інтелектуальною власністю. Зокрема, умови OpenAI вимагають, щоб кожен, хто публікує текст, створений за допомогою цього інструменту, позначав його як такий.
Навіть з такою підготовкою, каже Льоренте, ШІ краще використовувати для допомоги з абзацами, а не цілими історіями: «Мовні моделі — це не моделі знань, і їх ніколи не можна використовувати для написання статей, а лише для того, щоб допомогти журналістам у виконанні певних завдань». Він додає, що GPT3 або ChatGPT чудово підходять для виконання традиційних завдань з обробки природної мови, таких як узагальнення, перефразування, вилучення інформації. Це тому, що ChatGPT та інші працюють як агрегатори — знаходять лише те, що вже існує, а не те, що ще тільки належить знайти.
Ще одним застосуванням ШІ в редакції може бути створення коротких підсумків історій для поширення їх у пресрелізах, розсилках, соцмережах або на інших платформах. Незабаром це може стати більш поширеною практикою. В опитуванні місцевих редакцій новин, опублікованому 2022 року, Associated Press виявило, що підсумовування є одним з найбільш популярних інструментів ШІ.
Також партнер AP, фірма Agolo може не тільки підсумовувати текст, але й перетворювати текстові статті на сценарії для трансляції. У цих випадках штучний інтелект використовується після того, як людина зробила репортаж і написала історію. Він не замінює репортера, а скоріше зменшує частину його робочого навантаження.
Опитування AP показує: багато невеликих редакцій хочуть, щоб ШІ виконував ті завдання, які забирають час у журналістів, але є важливими. Ці завдання включають узагальнення не лише історій, а й стенограм урядових засідань. Сюди входить додавання метаданих до фотографій та історій, транскрибування інтерв’ю та відео, написання субтитрів та багато іншої роботи, яка стала рутинною в цифрову епоху журналістики.
Деякі видання вже встановили правила щодо використання ШІ. Свої правила вже оприлюднили Wired, Reuters, CNET, Associated Press та Insider. Видання The Guardian створило робочу групу щодо впровадження ШІ та оприлюднило три принципи використання інструментів GenAI, а Financial Times призначили першу редакторку штучного інтелекту.
Читайте також: Як «онбордити» ШІ в редакцію без шкоди для журналістів, матеріалів і довіри аудиторії