Скільки разів ви бідкалися, що попереду — кілька годин ручного розшифровування інтерв’ю? На щастя, ми нарешті на тій стадії, де починають з’являтися технологічні рішення, які дають змогу автоматично транскрибувати аудіо в текст. За допомогою штучного інтелекту сервіси роблять достатньо точний текстовий варіант, розрізняють голоси, виокремлюють ключові моменти інтерв’ю, а також там зберігається розшифровка інтерв’ю.
«Медіамейкер» ділиться добіркою транскрибаторів, які можуть допомогти вам із наступним текстом. Якщо спробували ще якісь хороші програми для розшифровки записів та хочете поділитися досвідом — пишіть нам на mail@mediamaker.me.
Otter.ai
Що може. Автоматично транскрибує аудіофайли й аналізує розмови, щоби зробити короткі підсумки, виділити завдання та відповідальних. Приєднується до Zoom, MS Teams і Google Meet, щоб автоматично розшифровувати розмову та ділитися нотатками. Також його можна синхронізувати з Dropbox.
Як користуватися. Доступний через вебсайт і мобільні застосунки. Користувачі можуть завантажувати аудіофайли або підключати сервіс під час конференцій.
Яка вартість. Пропонує безплатний план із обмеженими можливостями — 300 хвилин транскрибування на місяць і 30 хвилин на розмову. Для доступу до розширених функцій доступні платні тарифи, вартість яких залежить від обсягу використання. Режим Pro коштує $10 на місяць (якщо сплачувати за рік) — 1200 хвилин на місяць, 90 хвилин на розмову. Тут також доступні командні опції: словник, теги для спікерів і призначення завдань колегам. Business режим за $20 на місяць (якщо сплачувати за рік) надасть 6000 хвилин, чотири години на розмову, функції адміністратора та приєднання до трьох одночасних віртуальних зустрічей, щоб автоматично писати й ділитися нотатками.
Pinpoint
Що може. Розшифровує аудіозаписи й відео, а також зчитує тексти, написані від руки, й відскановані документи. Можна завантажувати файли будь-якого формату й розміру. Готова розшифровка розбивається на фрази з таймінгом, її можна редагувати на сайті. Також програма не припинить шифрувати, навіть якщо закрити вкладку або вимкнути комп’ютер.
Як користуватися. Отримати доступ до Pinpoint можна за особистим Google-акаунтом. Для початку треба подати заявку на повний доступ, а коли його відкриють, можна буде створювати власні тематичні колекції й додавати туди файли. Щоб завантажити файл для розшифровування, можна натиснути «Додати документи» на сторінці колекції. На сторінці колекції можна скористатися пошуком за ярликами з іменами людей, назвами місць чи організацій.
Яка вартість. Компанія Google не стягує плату за використання Pinpoint.
Transkriptor
Що може. Автоматично транскрибувати аудіо й відео в текст, створювати автоматичні нотатки для нарад за допомогою асистента зі штучним інтелектом. Також боту з ШІ можна поставити питання щодо ваших розмов, відео та голосових записів, й він реагує миттєво. Розпізнає голос одночасно кількох мовців. Має розширені параметри експорту — файли TXT, SRT, Word або звичайний текст.
Як користуватися. Необхідно спочатку авторизуватися через Google або зареєструватися за допомогою електронної пошти. Додайте ваш файл Transkriptor згенерує онлайн-транскрипції усього за кілька хвилин й повідомить вас поштою, коли транскрипція буде готова. Далі документ можна редагувати, завантажувати й ділитися.
Яка вартість. Для тестування безплатно надають 90 хвилин, далі потрібно вибрати свій тариф. «Полегшений» за $59,95 на рік надає п’ять годин розшифровки на місяць, тариф «Преміум» за $149,95 — 40 годин на місяць.
Happyscribe
Що може. Універсальна платформа для розшифровування аудіозаписів та генерування субтитрів. Можна завантажувати файли будь-якого формату, а також перекладати їх на 60 мов. Легко інтегрувати з програмами за допомогою Zapier, а також можна розшифровувати відео з YouTube тощо. Усі файли захищені й залишаються приватними.
Як користуватися. Необхідно авторизуватися на сайті.
Яка вартість. Безплатна версія надає кілька пробних хвилин. Базовий план коштує $17 й надає 120 хвилин на місяць, експорт у TXT, SRT і Word. Версія Pro щомісяця стягує $29 за 300 хвилин транскрипції, експорт у 10 різних форматах і підтримку в чаті. Найдорожча підписка на бізнес-версію коштує $49 за 600 хвилин на місяць.
FreeSubtitles.Ai
Що може. Транскрибує аудіо й відео в текст за допомогою автоматичного перекладу. Можна завантажити як файл із субтитрами чи розшифровку в форматі .txt.
Як користуватися. Необхідно створити обліковий запис на сайті, якщо хочете зберігати історію розшифровок. Якщо ні, то можна завантажувати файли без авторизації.
Яка вартість. Безплатний тариф: максимальний розмір файлу 300 Мб, максимальна тривалість 1 година, транскрипція: середня модель Whisper (висока точність). Транскрибування скасується, якщо ви закриєте вкладку браузера. Платний тариф — $0,99 за одну годину: максимальний розмір файлу 10 Гб, максимальна тривалість 10 годин, транскрипція: Whisper Model Large V2 (найкраща точність). Розшифровування можна запускати без відкритої вкладки браузера.
Fireflies.Ai
Що може. Крім розшифровки аудіо й відео, сервіс може автоматично приєднуватися до дзвінків і робити підсумки зустрічей і розшифровку розмови. Інтегрується з такими програмами, як Google Meet, Zoom, Teams Webex, Ringcentral, Aircall та іншими платформами.
Як користуватися. Потрібно авторизуватися на сайті.
Яка вартість. У безплатній версії можна зберігати до 800 хвилин розшифрованого матеріалу. У платній — за $10 доступні 8000 хвилин для зберігання. Можливість завантажити стенограми та записи, створити розумні пошукові фільтри, відстежувати ключові слова й теми, користувацька лексика, інтеграції CRM, Zapier, Slack. За $19 на місяць доступна необмежена транскрипція та зберігання, захоплення екрана відео, групи користувачів, необмежена кількість інтеграцій.
Textfromtospeech
Що може. Робить транскрипцію аудіо чи відео файлу й може озвучити те, що ви надрукували Збільшувати й зменшувати розмір тексту, зберегти розшифровку в форматах doc та txt. Підтримує різні мови, розрізняє чоловічі й жіночі голоси.
Як користуватися. Сервіс працює онлайн. Для початку роботи необхідно натиснути на «Почати диктувати» й надати дозвіл програмі, щоб перевести голос у текст, використовувати мікрофон.
Яка вартість. Безплатний онлайн-доступ для транскрибування в реальному часі. Розшифровка завантажених аудіо та відео коштує $0,083 за одну хвилину.
Чат-бот «Переписувач»
Що може. Центр журналістських розслідувань Nikcenter 2023 року розробив чат-бот у Telegram для розшифровки аудіо та відео. Чат-бот працює з усіма форматами файлів, але відеофайли можна надіслати через DropBox. Один користувач може надіслати три запити на день.
Як користуватися. Аудіофайли розміром менше ніж 20 мегабайтів можна надіслати безпосередньо в чат-бот, більші — завантажити в DropBox і скопіювати посилання в чат.
Яка вартість. Чат-бот безплатний.
GoodTape
Що може. Сервіс розшифровує файли, дає змогу редагувати розшифровку й переглядати таймкоди, а також завантажити її як документ.
Як користуватися. У безплатній версії обмеження — три розшифровки на місяць до 30 хвилин кожна. У платній версії можна завантажити до 20 годин на місяць.
Яка вартість. 15 євро на місяць
Двічі на тиждень надсилаємо медіамейкерам найефективніші інструменти й поради, а також новини й можливості. Долучайтеся!