OpenAI анонсували GPT-4. Які можливості в моделі наступного покоління?

OpenAI анонсувала нову мовну модель штучного інтелекту GPT-4. Компанія стверджує, що ця модель демонструє продуктивність на рівні людини в різних професійних і академічних тестах. Вона більш креативна та може розв’язувати складні проблеми з більшою точністю.

Компанія надає відкритий код OpenAI Evals для повідомлень про недоліки в моделях ШІ, оскільки системи ще мають багато проблем від попередників. Зокрема, тенденцію вигадувати інформацію (або «галюцинації») та здатність генерувати мову ворожнечі.

TechCrunch виділив п’ять основних відмінностей GPT-4 від попередніх моделей. Коротко розповідаємо про них.

Різниця від попередніх версій

Мультимодальність

ChatGPT і GPT-3 були обмежені текстом. GPT-4 є мультимодальною. Вона може аналізувати одночасно як текст, так і зображення, що дає змогу їй інтерпретувати більш складні вхідні дані. Відповідає GPT-4 лише текстом.

Партнерство з Be My Eyes показує, як GPT-4 допомагає незрячим людям і людям зі слабким зором описувати те, що бачить їхній телефон. Наприклад, якщо користувач надішле фотографію вмісту холодильника, віртуальний волонтер зможе не тільки правильно визначити, що у ньому, але й проаналізувати, що можна приготувати з цих інгредієнтів. Інструмент запропонує кілька рецептів і надішле покроковий посібник із приготування.

Переглянути цей допис в Instagram

Допис, поширений Be My Eyes (@bemyeyesapp)

Система пояснює меми та може розв’язувати завдання:

GPT-4 важче обманути

GPT-4 навчалася на великій кількості шкідливих підказок, які користувачі надавали OpenAI. Наприклад, про те, як утекти з в’язниці.

Згідно з описом OpenAI, GPT-3.5 (на якій працює ChatGPT) був «тестовим запуском» системи. Компанія витратила пів року на ітеративне вирівнювання GPT-4 і стверджує, що вдосконалила теоретичні основи. Це зробило результати навчання моделі більш передбачуваними.

Компанія зменшила схильність моделі реагувати на запити щодо забороненого контенту на 82 % проти GPT-3.5. GPT-4 також реагує на чутливі запити (наприклад, медичні поради та самоушкодження) на 29 % частіше.

Краща пам’ять

Великі мовні моделі тренуються на мільйонах вебсторінок, книг та інших текстових даних. Але в розмові з користувачем вони можуть видати обмежену кількість інформації.

GPT-3.5 має межу 4096 токенів, що дорівнює приблизно 8000 слів або чотирьом-п’яти сторінкам книги. GPT-4 має 32 768 токенів — максимальну кількість, що приблизно дорівнює 64 000 слів або 50 сторінок тексту.

Це означає, що під час розмови або створення тексту ШІ зможе тримати в пам’яті до 50 сторінок. Модель пам’ятатиме, про що ви говорили 20 сторінок тому в чаті. Пишучи оповідання чи есе, вона зможе посилатися на події, які відбулися 35 сторінок тому.

Багатомовність

У світі ШІ переважають англомовні користувачі. Англійською також проводять тестування. Але можливості великих мовних моделей можна застосувати до будь-якої письмової мови.

GPT-4 здатна з високою точністю відповідати на тисячі запитань з кількома варіантами відповідей 26 мовами, зокрема й українською. Найкраще вона працює з романськими та германськими мовами, але добре узагальнює й інші.

Зміна поведінки ШІ

Керованість у ШІ означає здатність змінювати свою поведінку на вимогу. Замість класичної особистості ChatGPT із фіксованою багатослівністю, тоном і стилем, розробники (а незабаром і користувачі ChatGPT) можуть прописати метод взаємодії свого ШІ з користувачами відповідно до потреб. Наприклад, попросити відповідати так, ніби на інтерв’ю.

(фото з прикладами)

Доступ

Нова модель доступна для широкого загалу з обмеженнями через ChatGPT Plus, щомісячну підписку OpenAI на ChatGPT за $20. Залежно від попиту компанія створить новий рівень підписки для активнішого використання GPT-4. Проте також пропонуватимуть певну кількість безплатних запитів до GPT-4.

OpenAI вже співпрацює з низкою компаній. Це, зокрема, Duolingo, Be My Eyes, Stripe і Khan Academy.

Також нова модель буде доступна як API для розробників, але лише для текстових запитів. Ціна становить $0.03 за 1 000 токенів prompt і $0.06 за 1 000 токенів completion за рекомендовану версію. Обмеження за замовчуванням — 40 000 токенів на хвилину і 200 запитів на хвилину. Пізніші версії ChatGPT, з доступом до

32 768 токенів, становить $0.06 за 1000 токенів prompt і $0.12 за 1000 токенів completion.

Читайте також:

Різниця від попередніх версій

Мультимодальність

GPT-4 важче обманути

Краща пам’ять

Багатомовність

Зміна поведінки ШІ

Доступ

Читайте також

Шукаєте інформацію про медіа та можливості для них? Підписуйтеся на новий проєкт «Рівні медіа»

«Медіамейкер» зупиняє роботу. Що буде далі?

«Китайське обладнання з польськими етикетками». Розслідування від «18000» про те, яке медобладнання в Черкасах купують за десятки мільйонів гривень

22 пацієнти втратили зір після ін’єкцій. Як NGL.media розбиралися в тому, що сталося в офтальмології на Тернопільщині

Незадекларована розкіш. Як «18000» вивчали розрив між доходами та способом життя родини секретаря Черкаської міськради

Безплатний курс із PR від комунікаційної академії «КомА» (реєстрація до 6 липня)

Хто ми?

Медіамейкер

Розділи

Соцмережі