Компанії, які розробляють ШІ-моделі, вважають, що інтернет має бути для них відкритим місцем для навчання.

Видання оновлюють сторінки з правилами обслуговування, аби ШІ не навчався на їхньому контенті. Чому це важливо?

П’ятниця, 11 Серпня, 2023

Середовище, Технології та платформи

Вероніка Нановська

Багато великих мовних моделей навчаються за допомогою контенту вебсайту без дозволу, а деякі бренди хочуть отримати компенсацію за використання твоїх даних. Компанії, які розробляють ШІ-моделі, вважають, що інтернет має бути для них відкритим місцем для навчання. Розповідаємо, що відбувається в цьому протистоянні.

Заклики ШІ-компаній

Google каже, що системи ШІ мусять мати можливість сканувати та використовувати роботу видань, якщо вони не відмовляться від цього. Це вже певним чином відбувається: у квітні The Washington Post опублікувала звіт, у якому показує вебсайти, які використовувалися для навчання чат-ботів ШІ. Водночас Google, Microsoft і розробник ChatGPT OpenAI не надають конкретних відомостей про джерела навчання своїх технологій.

Раніше у своїй заяві на розгляд уряду Австралії нормативно-правової бази щодо штучного інтелекту компанія Google заявила, що законодавство про авторське право потрібно змінити, щоб дозволити генеративним системам штучного інтелекту збирати дані з інтернету. Компанія закликала австралійських політиків сприяти «системам авторського права, які дозволяють належне та чесне використання захищеного авторським правом контенту, щоб забезпечити навчання моделей штучного інтелекту в Австралії на широкому та різноманітному діапазоні даних».

Як може змінитися авторське право? 

Водночас Докторка Кейлін Манварінг, старша викладачка права та правосуддя UNSW, сказала Guardian Australia, що авторське право буде однією з великих проблем, з якими зіткнуться генеративні системи ШІ в найближчі роки.

Вона додала, що в різних країнах закони відрізняються щодо того, як системи штучного інтелекту можуть використовувати контент, але саме поняття системи відмови переверне авторське право з ніг на голову: «Якщо ви хочете відтворити щось, що належить власнику авторських прав, ви маєте отримати його згоду, а не домовленість про відмову».

Читайте більше: Що кажуть закони різних країн про авторські права та штучний інтелект

Крім того, генеративні чат-боти штучного інтелекту, такі як ChatGPT від OpenAI, працюють подібно до ботів пошукових систем, які сканують і збирають інформацію з сайтів, щоб показувати їх у результатах пошуку.  Люди використовували ChatGPT OpenAI, щоб обійти PayWall і лише у березні Google і Microsoft оголосили про намір безпосередньо відповідати на запитання користувачів за допомогою генеративного штучного інтелекту, а не спрямовувати їх на сторонні вебсайти під час пошуку в мережі.

Видання можуть вимкнути здатність ботів сканувати їхній контент, проте наразі складно відрізнити ШІ-ботів від ботів пошукових систем, таких як Google, які дають змогу сторінкам індексуватися та з’являтися в результатах пошуку.

Яким зараз є рішення?

Наразі видання змінюють свої умови обслуговування, щоб запобігти використанню ШІ-компаніями контенту медіаорганізації для навчання своїх систем.

У Digiday намагались знайти єдиний підхід до боротьби зі штучним інтелектом. Одним із прикладів такого рішення може бути підписання угод із компаніями, що розробляють штучний інтелект, такими як OpenAI. Це минулого місяця зробила Associated Press, яка нещодавно підписала угоду з OpenAI про ліцензування частини архіву статей. 

Водночас The New York Times оновила свою сторінку з умовами обслуговування. У розділі про заборонене використання тепер чітко зазначено, що контент не можна використовувати для навчання систем машинного навчання або ШІ. А новинна компанія News Corp ініціювала переговори з компаніями штучного інтелекту щодо оплати за копіювання статей новин.

Google | ШІ