Деякі експерименти з ШІ у виданнях обертаються низкою помилок чи гучним провалом. Але це не означає, що нову технологію треба боятися чи оминати. Гейб Буллард у статті для NiemanReports розглядає вдалі приклади, де ШІ допоміг редакціям оптимізувати роботу, налагодити зв’язок із читачами та охоплювати нові аудиторії.
Експерименти видань із ШІ
Публічний запуск таких генераторів зображень, як DALL-E і Stable Diffusion, а також чат-бота ChatGPT призвів до того, що користувачі заполонили соцмережі текстами та зображеннями, які генерує ШІ. Деякі медіа теж почали експерименти з ШІ, які інколи доводиться зупиняти. Так, на початку цього року сайт технологічних новин CNET оголосив, що призупиняє свою програму написання статей за допомогою штучного інтелекту після того, як статті містили не лише багато помилок, але й плагіат.
Матіас Допфнер, генеральний директор німецького видавництва Axel Springer, яке нещодавно придбало Politico, написав у лютому в електронному листі компанії, що ШІ має потенціал зробити незалежну журналістику кращою, ніж вона коли-небудь була — або просто замінити її. У січні Buzzfeed оголосив, що використовуватиме технологію OpenAI для автоматизації написання своїх фірмових вікторин. Пізніше компанія закрила BuzzFeed News і почала публікувати статті про подорожі, написані за допомогою ШІ.
Читати більше: Редакції експериментують із ШІ, але меншість використовує його у своїй роботі
Водночас The New York Times, CNN, Reuters, Chicago Tribune, ABC і австралійські бренди Community Media блокують вебсканер OpenAI. NYT також розглядає судовий позов проти OpenAI за порушення прав інтелектуальної власності. Це доповнює довгий список позовів, з якими вже стикається OpenAI.
Читати більше: Що кажуть закони різних країн про авторські права та штучний інтелект
Утім, впровадження ШІ в редакційні процеси також має величезні переваги. Дослідження, яке провів Reuters Institute, показало, що дві третини опитаних редакцій використовують штучний інтелект для персоналізації читацького досвіду. ШІ автоматизує багато завдань і допомагає редакціям достукатися до читачів онлайн новими мовами та конкурувати на глобальному рівні. Він вивчає історії видавців, щоб знайти закономірності в поведінці читачів, і використовує ці закономірності, щоб пропонувати читачам історії, на які вони з більшою ймовірністю натискатимуть. ШІ навіть заповнює шаблонні абзаци й допомагає авторам з чернетками.
Переклад
У травні 2022 року фінський суспільний мовник Yle помітив аудиторію, до якої не достукався, — це десятки тисяч українців, які переїхали до Фінландії через повномасштабне вторгнення. Мовник пропонував новини фінською, шведською, англійською та російською мовами, проте знайти фінських журналістів, які б розмовляли українською, було важко.
Проєктний менеджер Yle News Lab Яркко Рюйнянен каже: коли почалася війна, кожна медіакомпанія була зацікавлена в українцях. Замість того, щоб переписувати статті новою мовою, Yle звернулася до програмного забезпечення для перекладу. Команда створила інструмент, який пропускав статті через чотири різні типи перекладацьких програм і представляв результати співробітникам, які знали обидві мови. Це дало змогу Yle публікувати переклад новин українською мовою з такою швидкістю, яка була б неможливою, якби новини писали та подавали одразу українською, як це відбувається з багатьма статтями для російськомовної та англомовної служб Yle.
За місяць до того, як Yle опублікував свої перші статті українською мовою, французька газета Le Monde запустила англомовне видання. Проєкт розпочався, коли репортер запропонував написати серію статей про французькі вибори 2022 року англійською мовою. Знаючи про ефективність машинного перекладу, Le Monde розглядала можливість запуску розсилки, яка пропонувала би 10–15 із понад 100 статей, які газета публікує щодня, у перекладі англійською мовою. Але штучний інтелект дав можливість запустити ціле англомовне видання.
ВоноТепер першим елементом у верхній частині домашньої сторінки Le Monde є кнопка для вибору між французькою та англійською мовами. Англійське видання пропонує 40 статей щодня у будні та 30 статей щодня у вихідні. Як і україномовні матеріали Yle, англомовні публікації Le Monde пишуть та редагують рідною мовою видання, потім перекладають на англійську за допомогою штучного інтелекту. Перед публікацією це перевіряє редактор. Цей процес називають постредагуванням машинного перекладу (MTPE), і він дає змогу невеликій групі людей виконувати роботу багатьох.
До того, як стаття потрапляє на головну сторінку англомовного сайту, вона проходить через чотири пари очей і одну програму штучного інтелекту.
Le Monde співпрацює із зовнішніми компаніями, які спеціалізуються на MTPE (машинному перекладі). Одна з них — TranslationServices.com, яка пропускає статті через програму перекладу зі штучним інтелектом DeepL. Цей інструмент не просто перекладає слово за словом, як людина, що гортає словник. Він пов’язує фрази та контекст між словами.
Проте цей інструмент ще не настільки розвинений, щоб створювати переклади, які Le Monde публікував би без перевірки. Є пунктуаційні розбіжності та культурні відмінності, як-от опис органів місцевого самоврядування. Крім того, як зазначає Люк Палдер, виконавчий директор Translation Services, часто втрачається літературний стиль, і певні поняття можуть потребувати додаткових пояснень для аудиторії за межами Франції.
Le Monde також має посібник зі стилю для перекладачів, який пояснює ці відмінності та допомагає впорядкувати перевірку машинного перекладу.
Мета Le Monde — зробити англомовне видання джерелом прибутку. Газета сподівається мати 100 000 англомовних передплатників до 2025 року. Видання вважає своїми конкурентами BBC, The New York Times та The Washington Post. Ефективність ШІ дала змогу їм почати конкурувати з цими виданнями в глобальному масштабі.
Yle зіткнувся зі схожим викликом, коли шукав аудиторію для своїх українських новин. У них є читачі, але не так багато, як вони сподівалися. Самулі Сілланпяя, технічний директор Yle News Lab, припускає: це може бути пов’язано з тим, що аудиторія, на яку вони розраховують, воліє отримувати новини в іншому форматі. На щастя, штучний інтелект також можна використовувати для перекладу аудіо- та відеосюжетів, і Yle розглядає можливість його впровадження.
Аналіз тексту
Багато репортерів уже користуються системами штучного інтелекту, які є трохи простішими, ніж ChatGPT, і менш складними, ніж MTPE. Такі програми, як Grammarly, наприклад, сканують тексти на наявність граматичних помилок. Також вони пропонують способи уникнути фраз, які є технічно правильними, але можуть бути стилістично небажаними, наприклад, пасивний стан або поганий синтаксис.
2022 року співробітники The Atlanta Journal-Constitution побачили можливість переробити електронну розсилку, яку вони надсилають передплатникам у другій половині дня. Зак МакГі, старший директор із питань взаємодії з цифровою аудиторією газети каже: у них виникла гіпотеза, що це було б чудовим місцем для надання персоналізованих рекомендацій, тоді як інші розсилки газети куруватимуть редактори.
Для цього газета звернулася до бельгійської фірми Twipe, яка пропонує видавцям розсилки, що повністю куруються та розсилаються машиною. Програмне забезпечення Twipe працює за допомогою ШІ, який призначає категорії контенту видавця. У багатьох редакціях людина, яка завантажує історію в систему управління контентом, призначає теги та категорії на основі прочитаного тексту. Ці теги корисні не лише для рекомендацій, але й для визначення того, наскільки популярною є та чи інша тема. Але ці теги також можуть застосовуватися непослідовно. Штучний інтелект Twipe читає сотні статей і групує їх за категоріями на основі моделей використання слів, знаходячи тенденції, які людина може не помітити.
Twipe також аналізує історії, на які читач натискав, поки був авторизований у своєму акаунті. Потім він зіставляє історію цього користувача зі своїми автоматично створеними темами. Отримана розсилка — поєднання цих рекомендацій та історій, які є найбільш популярними на сайті видавця.
Наразі приблизно 50 000 передплатників Atlanta Journal-Constitution отримують щоденний післяобідній електронний лист, який повністю складає та надсилає штучний інтелект, з матеріалами, що базуються на їхній історії читання. МакГі каже, що ще 50 000 отримують розсилки, які редагує людина. Коефіцієнт відкритих листів, створених людиною, становить приблизно 5 %, тоді як для листів Twipe — 6,5 %. МакГі визнає, що це невеликий показник, але за шість місяців, протягом яких вони тестували розсилки, він зріс.
Інститут некомерційних новин (INN), що об’єднує понад 400 незалежних редакцій по всій країні, використовує програмне забезпечення Overtone для сортування сотень історій, які щодня публікують його партнери. Це сортування корисне для видавців у колективі, які можуть захотіти поділитися роботою партнера зі своєю аудиторією, але не мають часу прочитати кожну історію. ШІ класифікує історії за темами та форматами та представляє короткий список текстів, які відповідають критеріям видавця для поширення.
Перевірка джерел та фактів
Цей вид аналізу можна використати не лише для узгодження історій з інтересами читачів. Інженери Yle досліджують, як штучний інтелект може сканувати історії для пошуку ознак упередженості. Це починається з відстеження демографічної інформації, походження та політичної приналежності джерел. У поєднанні з іншими аналітичними інструментами це означатиме, що редакція зможе бачити, кого цитують із яких питань, з якою частотою і в якому типі матеріалів.
Цей аудит джерел може піти ще далі, якщо застосувати NLP під назвою «аналіз настроїв». Це спосіб, за допомогою якого штучний інтелект визначає тон, вивчаючи зв’язок між словами. Деякі редакції використовують його, щоб попереджати редакторів про ненависні або агресивні пости в коментарях. Поєднання цього методу з тегами тем і відстеженням джерел допоможе їм «з’ясувати, яку термінологію використовують для обговорення певних тем», що, можливо, дасть змогу виявити несвідому упередженість в історіях.
Крім того, найкращим інструментом для боротьби з ШІ, що вводить в оману, може стати сам ШІ — інструмент, запрограмований на розпізнавання зображень або тексту, створених іншою машиною. Раніше цього року студент коледжу на ім’я Едвард Тіан випустив застосунок під назвою GPTZero, який оцінює ймовірність того, що текст був написаний ШІ.
Такі програми, як GPTZero, працюють, по суті, вимірюючи складність речень і діапазон вибору слів на письмі. ШІ має тенденцію повторювати шаблони, і детектори ШІ шукають їх. Тому NLP можна використовувати для пошуку мовних патернів, які часто зустрічаються в дезінформації:гіперзаангажованості, відсутності джерел, нечітких тверджень, токсичності. Такі інструменти можуть сортувати потік онлайн-контенту і виявляти дезінформацію, написаний штучним інтелектом текст і глибокі фейки з тією ж швидкістю, з якою їх створюють. А це набагато швидше, ніж може працювати будь-який фактчекер, що перевіряє факти.
Історії, які пише штучний інтелект
Не всі матеріали, написані штучним інтелектом, обов’язково є дезінформацією або містять неточності. Тисячі, а можливо, й мільйони споживачів новин уже отримали інформацію від статей, створених штучним інтелектом. Ще до того, як зайнятися перекладами, Yle почав використовувати ШІ для відстеження голосувань законодавців. Forbes має власні інструменти, які допомагають журналістам оптимізувати заголовки, генерувати описи та рекомендувати зображення для статті. AP використовує ШІ для звітування про прибутки компаній, щоб дати журналістам час зосередитися на глибоких репортажах, а The Washington Post використовувала технологію ШІ для репортажів про Олімпіаду та вибори.
Читати більше: AP укладає угоду з OpenAI щодо обміну новинами та технологіями
ШІ може писати такі статті, тому що вони засновані на відомих подіях, які дають чіткі дані: хокейні матчі закінчуються з рахунком, корпорації регулярно подають фінансові звіти, результати голосування публікуються у відкритому доступі.
Компанія Narrativa, яка генерує природну мову та співпрацює з видавцями, створила технологію, що лежить в основі інструменту, який The Wall Street Journal використовує для написання статей, комбінуючи абзаци про ринкові тенденції та фінансові дані. Проте Аліса Цайслер, тодішній редактор із досліджень і розробок The Wall Street Journal, зазначає, що коли комп’ютер зосереджується на питанні «що», репортери можуть зосередитися на питанні «чому».
Інструмент Narrativa навчається на даних із Dow Jones та архівів журналу — абзаци, які він пише, мають інституційний голос газети. Це також усуває питання власності на історію, написану машиною, яка навчена на роботі десятків тисяч різних людей. Девід Льоренте, генеральний директор Narrativa каже, що редакції мають використовувати лише свої архіви, якщо вони хочуть створювати власний контент і володіти інтелектуальною власністю. Зокрема, умови OpenAI вимагають, щоб кожен, хто публікує текст, створений за допомогою цього інструменту, позначав його як такий.
Навіть з такою підготовкою, каже Льоренте, ШІ краще використовувати для допомоги з абзацами, а не цілими історіями: «Мовні моделі — це не моделі знань, і їх ніколи не можна використовувати для написання статей, а лише для того, щоб допомогти журналістам у виконанні певних завдань». Він додає, що GPT3 або ChatGPT чудово підходять для виконання традиційних завдань з обробки природної мови, таких як узагальнення, перефразування, вилучення інформації. Це тому, що ChatGPT та інші працюють як агрегатори — знаходять лише те, що вже існує, а не те, що ще тільки належить знайти.
Ще одним застосуванням ШІ в редакції може бути створення коротких підсумків історій для поширення їх у пресрелізах, розсилках, соцмережах або на інших платформах. Незабаром це може стати більш поширеною практикою. В опитуванні місцевих редакцій новин, опублікованому 2022 року, Associated Press виявило, що підсумовування є одним з найбільш популярних інструментів ШІ.
Також партнер AP, фірма Agolo може не тільки підсумовувати текст, але й перетворювати текстові статті на сценарії для трансляції. У цих випадках штучний інтелект використовується після того, як людина зробила репортаж і написала історію. Він не замінює репортера, а скоріше зменшує частину його робочого навантаження.
Опитування AP показує: багато невеликих редакцій хочуть, щоб ШІ виконував ті завдання, які забирають час у журналістів, але є важливими. Ці завдання включають узагальнення не лише історій, а й стенограм урядових засідань. Сюди входить додавання метаданих до фотографій та історій, транскрибування інтерв’ю та відео, написання субтитрів та багато іншої роботи, яка стала рутинною в цифрову епоху журналістики.
Деякі видання вже встановили правила щодо використання ШІ. Свої правила вже оприлюднили Wired, Reuters, CNET, Associated Press та Insider. Видання The Guardian створило робочу групу щодо впровадження ШІ та оприлюднило три принципи використання інструментів GenAI, а Financial Times призначили першу редакторку штучного інтелекту.
Читайте також: Як «онбордити» ШІ в редакцію без шкоди для журналістів, матеріалів і довіри аудиторії