Компанія Google 13 серпня запустила Gemini Live, що дає змогу вести поглиблені голосові чати з ШІ-ботом Gemini на смартфонах. Функція працює у фоновому режимі й на заблокованому телефоні, тому розмову можна призупинити й відновити в будь-який момент. Переваги Gemini Live описує TechCrunch.
Які переваги Gemini Live?
Як стверджує Google, завдяки вдосконаленому мовному движку діалог із Gemini став більш послідовний, емоційно виразний і реалістичний. Чат-боту можна поставити додаткові запитання та він адаптується до мовних шаблонів у реальному часі.
«Ви можете розмовляти з Gemini й вибирати один із 10 нових голосів, що мають природне звучання, якими він може відповідати. Ви навіть можете говорити у власному темпі або перервати відповідь уточнювальним запитанням, як і в будь-якій іншій розмові», — пояснює Google.
Gemini Live працює у режимі «вільні руки» — у фоновому режимі або коли телефон заблоковано.
Чим це краще за голосовий режим ChatGPT?
З липня 2024 року OpenAI надав користувачам доступ до оновлених реалістичних голосових відповідей GPT-4o. Як пише TechCrunch, однією з переваг Gemini Live над голосовим режимом ChatGPT є краща пам’ять. Архітектура генеративної моделі, що лежить в основі Live, Gemini 1.5 Pro і Gemini 1.5 Flash, має довше «контекстне вікно» Це означає, що чат-бот може приймати й обмірковувати велику кількість даних.
Нагадаємо, що оновлена модель Gemini 1.5 Flash стала доступною у понад 230 країнах. Розробники обіцяють швидші та якісніші відповіді, покращення аргументації та розумінні зображень. Дивіться в нашому матеріалі хронологію поступових змін у Gemini.