ШІ-боти допомагають фермам вебконтенту копіювати роботи провідних видань

ШІ-боти допомагають фермам вебконтенту копіювати роботи провідних видань

Четвер, 24 Серпня, 2023

Вероніка Нановська

NewsGuard — інструмент, який відображає рейтинги довіри для понад 7500 новинних та інформаційних вебсайтів — виявив 37 контент-ферм. Вони розміщують статті, що містять тексти, фотографії та цитати, які скопіювали з головних новинних видань. Про це пише Bloomberg.

Про що йдеться у звіті NewsGuard?

Сайти, зокрема DailyHeadliner.com і TalkGlitz.com, беруть контент у таких видань, як The New York Times, Reuters і CNN. Вони переважно публікують останні новини, контент про стиль життя, не вказують авторів і не покликаються на оригінальні тексти. 

У звіті NewsGuard згадується використання штучного інтелекту цими сайтами. Сервіс виявив на кожному з них статті з однаковою ознакою: автоматизованим повідомленням про помилку. Наприклад, на сайті GlobalVillageSpace.com за останні шість місяців виявили 17 статей із помилками в текстах від штучного інтелекту. В останніх двох рядках тексту йдеться: «Як модель мови ШІ, я не можу гарантувати точність цієї статті, оскільки вона була написана не мною. Однак я зробив усе можливе, щоб переписати статтю так, щоб вона була зручною для Google».

Водночас невідомо, чи такі сайти використовували ChatGPT або Google Bard. OpenAI спеціально забороняє використовувати свої моделі ШІ для «плагіату», а Google забороняє використовувати свій генеративний ШІ для створення та розповсюдження «контенту, призначеного для дезінформації, спотворення або введення в оману», зокрема згенерованого ШІ контенту. Проте OpenAI та Google не відповіли на запити Bloomberg News про коментарі.

Чому медіа занепокоєні?

Агрегатори новин і подібні до них контент-ферми існують вже давно, прагнучи генерувати трафік через пошукові системи. NewsGuard опублікував звіт, в якому виявив майже 50 новинних вебсайтів, які повністю наповнюють за допомогою ШІ, а пізніше — 141 бренд, які вкладають кошти на рекламу на таких сайтах.

Раніше група найбільших світових медіаорганізацій написала відкритий лист, в якому закликала компанії з розроблення ШІ переглянути правила використання матеріалів, захищених авторським правом. Крім того, автори подають позови через порушення авторських прав, хоча бюро авторських прав США наголошує, що твори ШІ не підлягають авторському праву. Також використання ШІ-контенту стало помітною причиною страйків голлівудських акторів і сценаристів. 

Нещодавно The New York Times заблокувала вебсканер GPTBot. Тепер OpenAI не зможе використовувати контент видання для навчання своїх моделей ШІ. Водночас інформаційне агентство Associated Press нещодавно підписало угоду з OpenAI про ліцензування частини архіву статей AP та дослідження використання генеративного штучного інтелекту в новинах. OpenAI також виділила $5 млн Американському журналістському проєкту (AJP), який шукатиме шляхи підтримки місцевих новин за допомогою ШІ.

Читати більше:

NewsGuard