Вони оцінили відповіді бота на «правильність, послідовність і лаконічність» і виявили, що ChatGPT має маленький хитрий трюк, щоб переконати людей, що він «розумний»

Чому люди більше довіряють порадам ChatGPT, ніж інших користувачів інтернету — дослідження Purdue University

Середа, 16 Серпня, 2023

Вероніка Нановська

Дослідники з університету Пердью проаналізували відповіді ChatGPT на 517 запитань, розміщених на Stack Overflow — сайті запитань і відповідей для розробників програмного забезпечення та інженерів. Вони оцінили відповіді бота на «правильність, послідовність і лаконічність» і виявили, що ChatGPT має маленький хитрий трюк, щоб переконати людей, що він «розумний» (хоча сам OpenAI попереджає, що бот може писати «правдоподібні, але неправильні або безглузді відповіді»). Про це пише Business Insider.

Що показує дослідження?

12 програмістів, яких попросили оцінити 2000 випадково вибраних запитань. Їх запитали, чому вони віддають перевагу: відповідям ChatGPT чи відповідям на Stack Overflow. Учені виявили, що 52 % відповідей ChatGPT були абсолютно неправильними, а 77 % — надлишково довгими та нечіткими. 

Водночас майже 40 % опитаних досі віддають перевагу відповідям ChatGPT через розширену та чітку структуру відповідей, навіть якщо вони були неправильними.

Також дослідження показало: хоча ChatGPT працює напрочуд добре у багатьох випадках, він часто припускається помилок. Значна частина надлишкової, надмірної та нерелевантної інформації з’являється, тому що:

Чому йому довіряють?

Дослідження показало, що коли помилку нелегко перевірити, користувачі часто не виявляють її або недооцінюють. Крім того, коли відповідь містить очевидну помилку, 2 з 12 учасників все одно позначили її як правильну й віддали перевагу цій відповіді.  Так відбувається зокрема тому, що відповіді чат-бота мають багатші лінгвістичні особливості, що змушує користувачів віддавати їм перевагу та не звертати уваги на невідповідності.

Інтерв’ю з учасниками дослідження показують, що ввічлива мова, чітко сформульовані відповіді в стилі підручника та повнота у відповідях роблять абсолютно неправильні відповіді правильними. 

Учені наголошують, що відповіді, які лише здаються правильними, є найбільш фатальними. Вони можуть легко ввести в оману користувачів, особливо коли їм бракує знань або засобів, щоб легко перевірити правильність відповіді. Ще небезпечніше, коли людина не бере участі в генеруванні, а отримані результати автоматично використовуються іншим штучним інтелектом. У таких ситуаціях ланцюжок помилок поширюватиметься.

Читати більше:

ChatGPT