Розшифровка інтерв'ю з аудіо й відео в текст: кращі інструменти

Як розшифрувати інтерв’ю? Оглядаємо інструменти, якими можна транскрибувати аудіо й відео в текст

П’ятниця, 23 Лютого, 2024

Корисне, Продукт

Дар'я Свистуха

Скільки разів ви бідкалися, що попереду — кілька годин ручного розшифровування інтерв’ю? На щастя, ми нарешті на тій стадії, де починають з’являтися технологічні рішення, які дають змогу автоматично транскрибувати аудіо в текст. За допомогою штучного інтелекту сервіси роблять достатньо точний текстовий варіант, розрізняють голоси, виокремлюють ключові моменти інтерв’ю, а також там зберігається розшифровка інтерв’ю.

 «Медіамейкер» ділиться добіркою транскрибаторів, які можуть допомогти вам із наступним текстом. Якщо спробували ще якісь хороші програми для розшифровки записів та хочете поділитися досвідом — пишіть нам на mail@mediamaker.me.

Otter.ai 

Сайт тут.

Що може. Автоматично транскрибує аудіофайли й аналізує розмови, щоби зробити короткі підсумки, виділити завдання та відповідальних. Приєднується до Zoom, MS Teams і Google Meet, щоб автоматично розшифровувати розмову та ділитися нотатками. Також його можна синхронізувати з Dropbox.

Як користуватися. Доступний через вебсайт і мобільні застосунки. Користувачі можуть завантажувати аудіофайли або підключати сервіс під час конференцій.

Яка вартість. Пропонує безплатний план із обмеженими можливостями — 300 хвилин транскрибування на місяць і 30 хвилин на розмову. Для доступу до розширених функцій доступні платні тарифи, вартість яких залежить від обсягу використання. Режим Pro коштує $10 на місяць (якщо сплачувати за рік) — 1200 хвилин на місяць, 90 хвилин на розмову. Тут також доступні командні опції: словник, теги для спікерів і призначення завдань колегам. Business режим за $20 на місяць (якщо сплачувати за рік) надасть 6000 хвилин, чотири години на розмову, функції адміністратора та приєднання до трьох одночасних віртуальних зустрічей, щоб автоматично писати й ділитися нотатками. 

Pinpoint

Сайт тут.

Що може. Розшифровує аудіозаписи й відео, а також зчитує тексти, написані від руки, й відскановані документи. Можна завантажувати файли будь-якого формату й розміру. Готова розшифровка розбивається на фрази з таймінгом, її можна редагувати на сайті. Також програма не припинить шифрувати, навіть якщо закрити вкладку або вимкнути комп’ютер. 

Як користуватися. Отримати доступ до Pinpoint можна за особистим Google-акаунтом. Для початку треба подати заявку на повний доступ, а коли його відкриють, можна буде створювати власні тематичні колекції й додавати туди файли.  Щоб завантажити файл для розшифровування, можна натиснути «Додати документи» на сторінці колекції. На сторінці колекції можна скористатися пошуком за ярликами з іменами людей, назвами місць чи організацій.

Яка вартість. Компанія Google не стягує плату за використання Pinpoint.

Transkriptor

Шукайте його тут.

Що може. Автоматично транскрибувати аудіо й відео в текст, створювати автоматичні нотатки для нарад за допомогою асистента зі штучним інтелектом. Також боту з ШІ можна поставити питання щодо ваших розмов, відео та голосових записів, й він реагує миттєво. Розпізнає голос одночасно кількох мовців. Має розширені параметри експорту — файли TXT, SRT, Word або звичайний текст.

Як користуватися. Необхідно спочатку авторизуватися через Google або зареєструватися за допомогою електронної пошти. Додайте ваш файл Transkriptor згенерує онлайн-транскрипції усього за кілька хвилин й повідомить вас поштою, коли транскрипція буде готова. Далі документ можна редагувати, завантажувати й ділитися. 

Яка вартість. Для тестування безплатно надають 90 хвилин, далі потрібно вибрати свій тариф. «Полегшений» за $59,95 на рік надає п’ять годин розшифровки на місяць, тариф «Преміум» за $149,95 — 40 годин на місяць.  

Happyscribe

Перейти до сайту.

Що може. Універсальна платформа для розшифровування аудіозаписів та генерування субтитрів. Можна завантажувати файли будь-якого формату, а також перекладати їх на 60 мов. Легко інтегрувати з програмами за допомогою Zapier, а також можна розшифровувати відео з YouTube тощо. Усі файли захищені й залишаються приватними. 

Як користуватися. Необхідно авторизуватися на сайті.

Яка вартість. Безплатна версія надає кілька пробних хвилин. Базовий план коштує $17 й надає 120 хвилин на місяць, експорт у TXT, SRT і Word. Версія Pro щомісяця стягує $29 за 300 хвилин транскрипції, експорт у 10 різних форматах і підтримку в чаті. Найдорожча підписка на бізнес-версію коштує $49 за 600 хвилин на місяць.

FreeSubtitles.Ai

Сервіс тут.

Що може. Транскрибує аудіо й відео в текст за допомогою автоматичного перекладу. Можна завантажити як файл із субтитрами чи розшифровку в форматі .txt.

Як користуватися. Необхідно створити обліковий запис на сайті, якщо хочете зберігати історію розшифровок. Якщо ні, то можна завантажувати файли без авторизації. 

Яка вартість. Безплатний тариф: максимальний розмір файлу 300 Мб, максимальна тривалість 1 година, транскрипція: середня модель Whisper (висока точність). Транскрибування скасується, якщо ви закриєте вкладку браузера. Платний тариф — $0,99 за одну годину: максимальний розмір файлу 10 Гб, максимальна тривалість 10 годин, транскрипція: Whisper Model Large V2 (найкраща точність). Розшифровування можна запускати без відкритої вкладки браузера.

Fireflies.Ai

Більше тут.

Що може. Крім розшифровки аудіо й відео, сервіс може автоматично приєднуватися до дзвінків і робити підсумки зустрічей і розшифровку розмови. Інтегрується з такими програмами, як Google Meet, Zoom, Teams Webex, Ringcentral, Aircall та іншими платформами.

Як користуватися. Потрібно авторизуватися на сайті.

Яка вартість. У безплатній версії можна зберігати до 800 хвилин розшифрованого матеріалу. У платній — за $10 доступні 8000 хвилин для зберігання. Можливість завантажити стенограми та записи, створити розумні пошукові фільтри, відстежувати ключові слова й теми, користувацька лексика, інтеграції CRM, Zapier, Slack. За $19 на місяць доступна необмежена транскрипція та зберігання, захоплення екрана відео, групи користувачів, необмежена кількість інтеграцій.

Textfromtospeech 

Сайт тут.

Що може. Робить транскрипцію аудіо чи відео файлу й може озвучити те, що ви надрукували Збільшувати й зменшувати розмір тексту, зберегти розшифровку в форматах doc та txt. Підтримує різні мови, розрізняє чоловічі й жіночі голоси. 

Як користуватися. Сервіс працює онлайн. Для початку роботи необхідно натиснути на «Почати диктувати» й надати дозвіл програмі, щоб перевести голос у текст, використовувати мікрофон. 

Яка вартість. Безплатний онлайн-доступ для транскрибування в реальному часі.  Розшифровка завантажених аудіо та відео коштує $0,083 за одну хвилину. 

Чат-бот «Переписувач»

Лінк тут

Що може. Центр журналістських розслідувань Nikcenter 2023 року розробив чат-бот у Telegram для розшифровки аудіо та відео. Чат-бот працює з усіма форматами файлів, але відеофайли можна надіслати через DropBox. Один користувач може надіслати три запити на день.

Як користуватися. Аудіофайли розміром менше ніж 20 мегабайтів можна надіслати безпосередньо в чат-бот, більші — завантажити в DropBox і скопіювати посилання в чат.

Яка вартість. Чат-бот безплатний. 

GoodTape

Більше тут.

Що може. Сервіс розшифровує файли, дає змогу редагувати розшифровку й переглядати таймкоди, а також завантажити її як документ.

Як користуватися. У безплатній версії обмеження — три розшифровки на місяць до 30 хвилин кожна. У платній версії можна завантажити до 20 годин на місяць.

Яка вартість. 15 євро на місяць


Двічі на тиждень надсилаємо медіамейкерам найефективніші інструменти й поради, а також новини й можливості. Долучайтеся!


журналісти | програми | розшифрування | транскрибатори | ШІ | Штучний інтелект