Microsoft запустила функцію Azure AI Speech, яка дає змогу анімувати зображення та синтезувати голос, щоб легше й дешевше створювати відео.

Microsoft додає функцію створення власних аватарів на основі ШІ

П’ятниця, 17 Листопада, 2023

Марина Кулініч

Microsoft запустила функцію Azure AI Speech, яка дає змогу анімувати зображення та синтезувати голос, щоб легше й дешевше створювати відео. Про це компанія пише у своєму блозі.

Навіщо це?

Компанія пояснює впровадження функції тим, що традиційне створення відео потребує багато часу та коштів. Аватар, який може відтворювати текст у вигляді мовлення через голосові моделі, допоможе генерувати відеоконтент ефективніше. Користувачі зможуть користуватися Azure AI Speech для створення навчальних відео, презентацій продуктів тощо. Також функція робить синтезований голос більш природним, ніж він був до цього. Його можна застосовувати для створення віртуальних помічників, чатботів тощо.

Як працює Azure AI Speech?

Щоб створити відео, спершу текст вводять в аналізатор, потім аудіосинтезатор прогнозує акустичні характеристики промови та синтезує голос. Нейронний синтез мовлення синхронізує зображення та звук.

Microsoft пропонує дві окремі функції синтезу мовлення:

Створення спеціального аватара доступне лише після реєстрації та для обмеженого використання. Microsoft зазначає, що розробила функцію синтезу мовлення для захисту прав суспільства, сприяння прозорій взаємодії між людиною та комп’ютером, протидії дезінформації, зокрема дипфейків. 

Що вміє Azure AI Speech?

Для створення відеоаватара необхідно:

На прикладі цифрового помічника в онлайн-магазині Microsoft наводить можливості інтерактивного аватара:

Microsoft | ШІ | Штучний інтелект