Розшифровка інтерв'ю з аудіо й відео в текст: кращі інструменти

Як розшифрувати інтерв’ю? Оглядаємо інструменти для транскрибування аудіо й відео

П’ятниця, 23 Лютого, 2024

Продукт

Дар'я Свистуха

Скільки разів ви бідкалися, що попереду — кілька годин ручного розшифровування інтерв’ю? На щастя, ми нарешті на тій стадії, де починають з’являтися технологічні рішення для автоматизації цього процесу. За допомогою штучного інтелекту сервіси роблять достатньо точний текстовий варіант, розрізняють голоси, виокремлюють ключові моменти інтерв’ю, а також там зберігається розшифровка інтерв’ю.

 «Медіамейкер» ділиться добіркою транскрибаторів, які можуть допомогти вам із наступним текстом. Якщо спробували ще якісь хороші програми для розшифровки записів та хочете поділитися досвідом — пишіть нам на mail@mediamaker.me.

Otter.ai 

Що може. Автоматично транскрибує аудіофайли й аналізує розмови, щоби зробити короткі підсумки, виділити завдання та відповідальних. Приєднується до Zoom, MS Teams і Google Meet, щоб автоматично розшифровувати розмову та ділитися нотатками. Також його можна синхронізувати з Dropbox.

Як користуватися. Доступний через вебсайт і мобільні застосунки. Користувачі можуть завантажувати аудіофайли або підключати сервіс під час конференцій.

Яка вартість. Пропонує безплатний план із обмеженими можливостями — 300 хвилин транскрибування на місяць і 30 хвилин на розмову. Для доступу до розширених функцій доступні платні тарифи, вартість яких залежить від обсягу використання. Режим Pro коштує $10 на місяць (якщо сплачувати за рік) — 1200 хвилин на місяць, 90 хвилин на розмову. Тут також доступні командні опції: словник, теги для спікерів і призначення завдань колегам. Business режим за $20 на місяць (якщо сплачувати за рік) надасть 6000 хвилин, чотири години на розмову, функції адміністратора та приєднання до трьох одночасних віртуальних зустрічей, щоб автоматично писати й ділитися нотатками. 

Pinpoint

Що може. Розшифровує аудіозаписи й відео, а також зчитує тексти, написані від руки, й відскановані документи. Можна завантажувати файли будь-якого формату й розміру. Готова розшифровка розбивається на фрази з таймінгом, її можна редагувати на сайті. Також програма не припинить шифрувати, навіть якщо закрити вкладку або вимкнути комп’ютер. 

Як користуватися. Отримати доступ до Pinpoint можна за особистим Google-акаунтом. Для початку треба подати заявку на повний доступ, а коли його відкриють, можна буде створювати власні тематичні колекції й додавати туди файли.  Щоб завантажити файл для розшифровування, можна натиснути «Додати документи» на сторінці колекції. На сторінці колекції можна скористатися пошуком за ярликами з іменами людей, назвами місць чи організацій.

Яка вартість. Компанія Google не стягує плату за використання Pinpoint.

Transkriptor

Що може. Автоматично транскрибувати аудіо й відео в текст, створювати автоматичні нотатки для нарад за допомогою асистента зі штучним інтелектом. Також боту з ШІ можна поставити питання щодо ваших розмов, відео та голосових записів, й він реагує миттєво. Розпізнає голос одночасно кількох мовців. Має розширені параметри експорту — файли TXT, SRT, Word або звичайний текст.

Як користуватися. Необхідно спочатку авторизуватися через Google або зареєструватися за допомогою електронної пошти. Додайте ваш файл Transkriptor згенерує онлайн-транскрипції усього за кілька хвилин й повідомить вас поштою, коли транскрипція буде готова. Далі документ можна редагувати, завантажувати й ділитися. 

Яка вартість. Для тестування безплатно надають 90 хвилин, далі потрібно вибрати свій тариф. «Полегшений» за $59,95 на рік надає п’ять годин розшифровки на місяць, тариф «Преміум» за $149,95 — 40 годин на місяць.  

Happyscribe

Що може. Універсальна платформа для розшифровування аудіозаписів та генерування субтитрів. Можна завантажувати файли будь-якого формату, а також перекладати їх на 60 мов. Легко інтегрувати з програмами за допомогою Zapier, а також можна розшифровувати відео з YouTube тощо. Усі файли захищені й залишаються приватними. 

Як користуватися. Необхідно авторизуватися на сайті.

Яка вартість. Безплатна версія надає кілька пробних хвилин. Базовий план коштує $17 й надає 120 хвилин на місяць, експорт у TXT, SRT і Word. Версія Pro щомісяця стягує $29 за 300 хвилин транскрипції, експорт у 10 різних форматах і підтримку в чаті. Найдорожча підписка на бізнес-версію коштує $49 за 600 хвилин на місяць.

FreeSubtitles.Ai

Що може. Транскрибує аудіо й відео в текст за допомогою автоматичного перекладу. Можна завантажити як файл із субтитрами чи розшифровку в форматі .txt.

Як користуватися. Необхідно створити обліковий запис на сайті, якщо хочете зберігати історію розшифровок. Якщо ні, то можна завантажувати файли без авторизації. 

Яка вартість. Безплатний тариф: максимальний розмір файлу 300 Мб, максимальна тривалість 1 година, транскрипція: середня модель Whisper (висока точність). Транскрибування скасується, якщо ви закриєте вкладку браузера. Платний тариф — $0,99 за одну годину: максимальний розмір файлу 10 Гб, максимальна тривалість 10 годин, транскрипція: Whisper Model Large V2 (найкраща точність). Розшифровування можна запускати без відкритої вкладки браузера.

Fireflies.Ai

Що може. Крім розшифровки аудіо й відео, сервіс може автоматично приєднуватися до дзвінків і робити підсумки зустрічей і розшифровку розмови. Інтегрується з такими програмами, як Google Meet, Zoom, Teams Webex, Ringcentral, Aircall та іншими платформами.

Як користуватися. Потрібно авторизуватися на сайті.

Яка вартість. У безплатній версії можна зберігати до 800 хвилин розшифрованого матеріалу. У платній — за $10 доступні 8000 хвилин для зберігання. Можливість завантажити стенограми та записи, створити розумні пошукові фільтри, відстежувати ключові слова й теми, користувацька лексика, інтеграції CRM, Zapier, Slack. За $19 на місяць доступна необмежена транскрипція та зберігання, захоплення екрана відео, групи користувачів, необмежена кількість інтеграцій.

Textfromtospeech 

Що може. Робить транскрипцію аудіо чи відео файлу й може озвучити те, що ви надрукували Збільшувати й зменшувати розмір тексту, зберегти розшифровку в форматах doc та txt. Підтримує різні мови, розрізняє чоловічі й жіночі голоси. 

Як користуватися. Сервіс працює онлайн. Для початку роботи необхідно натиснути на «Почати диктувати» й надати дозвіл програмі, щоб перевести голос у текст, використовувати мікрофон. 

Яка вартість. Безплатний онлайн-доступ для транскрибування в реальному часі.  Розшифровка завантажених аудіо та відео коштує $0,083 за одну хвилину. 

Чат-бот «Переписувач»

Що може. Центр журналістських розслідувань Nikcenter 2023 року розробив чат-бот у Telegram для розшифровки аудіо та відео. Чат-бот працює з усіма форматами файлів, але відеофайли можна надіслати через DropBox. Один користувач може надіслати три запити на день.

Як користуватися. Аудіофайли розміром менше ніж 20 мегабайтів можна надіслати безпосередньо в чат-бот, більші — завантажити в DropBox і скопіювати посилання в чат.

Яка вартість. Чат-бот безплатний. 

GoodTape

Що може. Сервіс розшифровує файли, дає змогу редагувати розшифровку й переглядати таймкоди, а також завантажити її як документ.

Як користуватися. У безплатній версії обмеження — три розшифровки на місяць до 30 хвилин кожна. У платній версії можна завантажити до 20 годин на місяць.

Яка вартість. 15 євро на місяць

журналісти | програми | розшифрування | транскрибатори | ШІ | Штучний інтелект