Компанія Google заявила, що використовуватиме весь загальнодоступний контент в інтернеті для створення своїх інструментів штучного інтелекту. Про це йдеться в оновленій політиці конфіденційності корпорації.
Що ще є в документі
У попередній редакції документа, про що пише Gizmodo, компанія заявляла, що дані використовуватимуться для «мовних моделей». Тепер ідеться про «моделі ШІ». Також окрім Google Translate, до переліку увійшов Bard та Cloud AI.
Зазвичай розробники використовують контент, який доступний публічно, адже наразі це питання ніяк не регулюється. Проте Google заявив право на все, що користувачі розміщували в загальнодоступних інтернет-сервісах, зокрема на сайтах відгуків, публікаціях у блозі чи на сторінках у соцмережах. Це все може стати основою для навчання систем ШІ.
Нагадаємо, раніше The Washington Post аналізували набір даних Google C4, на якому великі компанії навчають мовні моделі. Туди входило 15 млн вебресурсів, зокрема ми знайшли там і сайти українських медіа.
Поки незрозуміло, чи це є законним. Законодавство про ШІ тільки формується в різних країнах. Зокрема нещодавно ми робили огляд врегулювання питань авторського права, пов’язаних із ШІ, у США, Європі й Україні.
Платформи виступають проти
Керівники Twitter і Reddit особливо обурені проблемою ШІ та вимкнули вільний доступ до своїх API, щоб унеможливити завантаження великої кількості дописів. Це нібито мало на меті захистити соцмережі від компаній, які збирають їхню інтелектуальну власність.
Введення плати за використання API у Reddit призвело до закриття неофіційних застосунків платформи, а велика кількість модераторів субредітів оголосила безстроковий страйк.
Пізніше Ілон Маск обмежив кількість переглядів твітів на добу. Він пояснює це як боротьбу з «екстремальним рівнем збору даних та маніпуляцій системою» і стверджує, що це «тимчасовий надзвичайний захід» через «крадіжку даних».