OpenAI анонсувала нову мовну модель штучного інтелекту GPT-4. Компанія стверджує, що ця модель демонструє продуктивність на рівні людини в різних професійних і академічних тестах. Вона більш креативна та може розв’язувати складні проблеми з більшою точністю.
Компанія надає відкритий код OpenAI Evals для повідомлень про недоліки в моделях ШІ, оскільки системи ще мають багато проблем від попередників. Зокрема, тенденцію вигадувати інформацію (або «галюцинації») та здатність генерувати мову ворожнечі.
TechCrunch виділив п’ять основних відмінностей GPT-4 від попередніх моделей. Коротко розповідаємо про них.
Різниця від попередніх версій
Мультимодальність
ChatGPT і GPT-3 були обмежені текстом. GPT-4 є мультимодальною. Вона може аналізувати одночасно як текст, так і зображення, що дає змогу їй інтерпретувати більш складні вхідні дані. Відповідає GPT-4 лише текстом.
Партнерство з Be My Eyes показує, як GPT-4 допомагає незрячим людям і людям зі слабким зором описувати те, що бачить їхній телефон. Наприклад, якщо користувач надішле фотографію вмісту холодильника, віртуальний волонтер зможе не тільки правильно визначити, що у ньому, але й проаналізувати, що можна приготувати з цих інгредієнтів. Інструмент запропонує кілька рецептів і надішле покроковий посібник із приготування.
Система пояснює меми та може розв’язувати завдання:
GPT-4 важче обманути
GPT-4 навчалася на великій кількості шкідливих підказок, які користувачі надавали OpenAI. Наприклад, про те, як утекти з в’язниці.
Згідно з описом OpenAI, GPT-3.5 (на якій працює ChatGPT) був «тестовим запуском» системи. Компанія витратила пів року на ітеративне вирівнювання GPT-4 і стверджує, що вдосконалила теоретичні основи. Це зробило результати навчання моделі більш передбачуваними.
Компанія зменшила схильність моделі реагувати на запити щодо забороненого контенту на 82 % проти GPT-3.5. GPT-4 також реагує на чутливі запити (наприклад, медичні поради та самоушкодження) на 29 % частіше.
Краща пам’ять
Великі мовні моделі тренуються на мільйонах вебсторінок, книг та інших текстових даних. Але в розмові з користувачем вони можуть видати обмежену кількість інформації.
GPT-3.5 має межу 4096 токенів, що дорівнює приблизно 8000 слів або чотирьом-п’яти сторінкам книги. GPT-4 має 32 768 токенів — максимальну кількість, що приблизно дорівнює 64 000 слів або 50 сторінок тексту.
Це означає, що під час розмови або створення тексту ШІ зможе тримати в пам’яті до 50 сторінок. Модель пам’ятатиме, про що ви говорили 20 сторінок тому в чаті. Пишучи оповідання чи есе, вона зможе посилатися на події, які відбулися 35 сторінок тому.
Багатомовність
У світі ШІ переважають англомовні користувачі. Англійською також проводять тестування. Але можливості великих мовних моделей можна застосувати до будь-якої письмової мови.
GPT-4 здатна з високою точністю відповідати на тисячі запитань з кількома варіантами відповідей 26 мовами, зокрема й українською. Найкраще вона працює з романськими та германськими мовами, але добре узагальнює й інші.
Зміна поведінки ШІ
Керованість у ШІ означає здатність змінювати свою поведінку на вимогу. Замість класичної особистості ChatGPT із фіксованою багатослівністю, тоном і стилем, розробники (а незабаром і користувачі ChatGPT) можуть прописати метод взаємодії свого ШІ з користувачами відповідно до потреб. Наприклад, попросити відповідати так, ніби на інтерв’ю.
(фото з прикладами)
Доступ
Нова модель доступна для широкого загалу з обмеженнями через ChatGPT Plus, щомісячну підписку OpenAI на ChatGPT за $20. Залежно від попиту компанія створить новий рівень підписки для активнішого використання GPT-4. Проте також пропонуватимуть певну кількість безплатних запитів до GPT-4.
OpenAI вже співпрацює з низкою компаній. Це, зокрема, Duolingo, Be My Eyes, Stripe і Khan Academy.
Також нова модель буде доступна як API для розробників, але лише для текстових запитів. Ціна становить $0.03 за 1 000 токенів prompt і $0.06 за 1 000 токенів completion за рекомендовану версію. Обмеження за замовчуванням — 40 000 токенів на хвилину і 200 запитів на хвилину. Пізніші версії ChatGPT, з доступом до
32 768 токенів, становить $0.06 за 1000 токенів prompt і $0.12 за 1000 токенів completion.
Читайте також:
- Чат-бот ChatGPT: що потрібно знати видавцям
- Медійник спробував створити фейкове видання за допомогою ChatGPT. Ось що з цього вийшло
- Редакції експериментують із ChatGPT, але меншість використовує ШІ у своїй роботі
- Медіа критикують OpenAI за використання статей для навчання ChatGPT
- Новий виток конкуренції в пошуку: огляд анонсів про ШІ від Google та Microsoft