п’ять основних відмінностей GPT-4 від попередніх моделей

OpenAI анонсували GPT-4. Які можливості в моделі наступного покоління? 

Середа, 15 Березня, 2023

Вероніка Нановська

OpenAI анонсувала нову мовну модель штучного інтелекту GPT-4. Компанія стверджує, що ця модель демонструє продуктивність на рівні людини в різних професійних і академічних тестах. Вона більш креативна та може розв’язувати складні проблеми з більшою точністю.  

Компанія надає відкритий код OpenAI Evals для повідомлень про недоліки в моделях ШІ, оскільки системи ще мають багато проблем від попередників. Зокрема, тенденцію вигадувати інформацію (або «галюцинації») та здатність генерувати мову ворожнечі. 

TechCrunch виділив п’ять основних відмінностей GPT-4 від попередніх моделей. Коротко розповідаємо про них.

Різниця від попередніх версій

Мультимодальність

ChatGPT і GPT-3 були обмежені текстом. GPT-4 є мультимодальною. Вона може аналізувати одночасно як текст, так і зображення, що дає змогу їй інтерпретувати більш складні вхідні дані. Відповідає GPT-4 лише текстом.

Партнерство з Be My Eyes показує, як GPT-4 допомагає незрячим людям і людям зі слабким зором описувати те, що бачить їхній телефон. Наприклад, якщо користувач надішле фотографію вмісту холодильника, віртуальний волонтер зможе не тільки правильно визначити, що у ньому, але й проаналізувати, що можна приготувати з цих інгредієнтів. Інструмент запропонує кілька рецептів і надішле покроковий посібник із приготування.

Переглянути цей допис в Instagram

Допис, поширений Be My Eyes (@bemyeyesapp)

Система пояснює меми та може розв’язувати завдання:

OpenAI
OpenAI
OpenAI

GPT-4 важче обманути

GPT-4 навчалася на великій кількості шкідливих підказок, які користувачі надавали OpenAI. Наприклад, про те, як утекти з в’язниці. 

Згідно з описом OpenAI, GPT-3.5 (на якій працює ChatGPT) був «тестовим запуском» системи. Компанія витратила пів року на ітеративне вирівнювання GPT-4 і стверджує, що вдосконалила теоретичні основи. Це зробило результати навчання моделі більш передбачуваними. 

Компанія зменшила схильність моделі реагувати на запити щодо забороненого контенту на 82 % проти GPT-3.5. GPT-4 також реагує на чутливі запити (наприклад, медичні поради та самоушкодження) на 29 % частіше.

OpenAI

Краща пам’ять

Великі мовні моделі тренуються на мільйонах вебсторінок, книг та інших текстових даних. Але в розмові з користувачем вони можуть видати обмежену кількість інформації. 

GPT-3.5 має межу 4096 токенів, що дорівнює приблизно 8000 слів або чотирьом-п’яти сторінкам книги. GPT-4 має 32 768 токенів — максимальну кількість, що приблизно дорівнює 64 000 слів або 50 сторінок тексту.

Це означає, що під час розмови або створення тексту ШІ зможе тримати в пам’яті до 50 сторінок. Модель пам’ятатиме, про що ви говорили 20 сторінок тому в чаті. Пишучи оповідання чи есе, вона зможе посилатися на події, які відбулися 35 сторінок тому.

Багатомовність

У світі ШІ переважають англомовні користувачі. Англійською також проводять тестування. Але можливості великих мовних моделей можна застосувати до будь-якої письмової мови.

GPT-4 здатна з високою точністю відповідати на тисячі запитань з кількома варіантами відповідей 26 мовами, зокрема й українською. Найкраще вона працює з романськими та германськими мовами, але добре узагальнює й інші.

OpenAI

Зміна поведінки ШІ

Керованість у ШІ означає здатність змінювати свою поведінку на вимогу. Замість класичної особистості ChatGPT із фіксованою багатослівністю, тоном і стилем, розробники (а незабаром і користувачі ChatGPT) можуть прописати метод взаємодії свого ШІ з користувачами відповідно до потреб. Наприклад, попросити відповідати так, ніби на інтерв’ю.

(фото з прикладами)

OpenAI
OpenAI

Доступ

Нова модель доступна для широкого загалу з обмеженнями через ChatGPT Plus, щомісячну підписку OpenAI на ChatGPT за $20. Залежно від попиту компанія створить новий рівень підписки для активнішого використання GPT-4. Проте також пропонуватимуть певну кількість безплатних запитів до GPT-4.

OpenAI вже співпрацює з низкою компаній. Це, зокрема, Duolingo, Be My Eyes, Stripe і Khan Academy.

Також нова модель буде доступна як API для розробників, але лише для текстових запитів. Ціна становить $0.03 за 1 000 токенів prompt і $0.06 за 1 000 токенів completion за рекомендовану версію. Обмеження за замовчуванням — 40 000 токенів на хвилину і 200 запитів на хвилину. Пізніші версії ChatGPT, з доступом до 

32 768 токенів, становить $0.06 за 1000 токенів prompt і $0.12 за 1000 токенів completion.

Читайте також:

ChatGPT | GPT-4 | OpenAi | ШІ