З чого формуються архіви в медіа та як їх зберігати

З чого формуються архіви в медіа та як їх зберігати

Понеділок, 22 Липня, 2024

Корисне, Продукт

Кубай Інна

«Робота журналіста є завершеною не тоді коли матеріал вийшов у світ, а тоді коли його відповідним чином заархівували», — з цієї фрази розпочала свою онлайн-лекцію у межах курсу Local media relaunch initiative від Media Development Foundation керівниця проєкту з оцифрування архівних матеріалів «Суспільного мовлення» Таїсія Турчин. 

Також лекторка розповіла про:

Нижче — найважливіші тези з лекції.

Що таке архів та які його види?

Архів — це сукупність писемних, кіно-, фото-, фонодокументів, науково-технічної документації або інших документальних памʼяток, створених установами, обʼєднаннями, медіа чи окремими громадянами.

Є багато видів архівів. Наприклад, усім добре відомі домашні фотоальбоми, які є своєрідним мініархівом сімейних світлин. Більшими є «класичні» архіви різноманітних документів. У них століттями накопичувалися найрізноманітніші матеріали з усіх сфер людського життя: економіки, політики, суспільства тощо. Робота з ними передбачає фізичну присутність дослідника в архіві. Також сьогодні є дата-архіви, з якими може працювати будь-хто й будь-де, оскільки вони є глобальними вебсервісами. Саме дата-архіви — основа зберігання результатів роботи медійників. Вони мають велике значення для медіасфери. 

Переважно data-архіви створюються для внутрішнього чи зовнішнього користування. Перші можуть існувати у вигляді простих тек на жорстких дисках чи хмарних ресурсах із мінімальним описом і систематизацією. Другі потребують системних рішень щодо зберігання матеріалів і спеціальних методик їхнього архівування.

«Три кити» архівування

Таїсія Турчин пояснює: будь-яке архівування тримається на «трьох китах»:

Збір даних

Збір матеріалів для архівування передбачає їхній пошук або створення, опис і систематизацію. 

Робота медіа — це постійне виготовлення нового контенту різноманітної тематики. За своєю формою можуть бути текстові документи, відео-, фоно-, чи фотоматеріали тощо. Для журналіста, відзнятий й виданий в етер матеріал сьогодні — це архівний документ завтра. Далі його треба опрацювати та зберегти для того, щоб повторне використання було взагалі можливим, зручним і швидким. 

Відомо про багато рішень для опису медіаматеріалів. Для цього їх необхідно оснастити відповідними метаданими. 

«Без метаданих будь-який загружений у систему файл є просто цифровим сміттям», — каже Турчин. 

Що таке метадані та яку інформацію вони мають містити? 

Насамперед — це назва матеріалу, жанр, анотація, виробник, рік створення, автор. Для зручності у використанні редактор архіву передивляється матеріал, розписує його за таймкодами. І коли потрібно знайти конкретний фрагмент, то за відповідним запитом у пошуку програма скеровує не до всього документу, а до потрібної частини. Це зручно під час виробництва новин, коли потрібно швидко знайти ілюстративний матеріал (так звана «отражонка»). Метадані поділяються на первинні та вторинні.

Первинні

Первинні метадані створює журналіст. Коли він чи вона передає матеріал в архів, то має супроводити його відповідним описом із метаданими. У ньому зазначається: 

Також потрібно зробити короткий опис матеріалу та вказати назву проєкту, в межах якого зроблений цей матеріал. 

Вторинні

Вторинні метадані створює працівник архіву за умови, що в медіакомпанії є змога найняти таких фахівців. Ці метадані містять: 

Цей перелік метаданих не є вичерпним і може містити десятки інших полів. Усе залежить від специфіки конкретного медіа й мети його створення. Важливо враховувати, що дані для внутрішнього й зовнішнього користування — це різні метадані. І коли медіа створюють певні системи архівування, одразу необхідно враховувати, на кого цей архів розрахований. Якщо хтось через умовно 40 років візьме ці матеріали, то необхідно цій людині дати максимальні підказки про походження й суть цього матеріалу. 

«Однією з таких підказок своїм колегам чи наступним поколінням журналістів є присвоєння матеріалу ID-коду», — наголошує Турчин. 

ID-код це унікальний шифр, який присвоюється кожному матеріалу під час опису. Він може присвоюватися відео-, аудіо-, фотофайлам, іншим цифровим матеріалам, з якими працюють медійники. Коли в описі до матеріалу є лише колонка з ID-кодом, це вже дасть розуміння: 

Цей опис необхідно адаптовувати під потреби журналіста й майбутніх користувачів цього архіву. Навіть у випадку, коли сама система буде пошкоджена або знищена, а файл кудись потрапить лише з  унікальним ID-кодом у назві, то це значно спростить подальшу роботу з ним. Майбутнім дослідникам, що будуть з цими файлами працювати, це дасть змогу ідентифікувати файли без необхідності переглядати кожен окремо. Це допоможе заощадити час на ознайомлення з цими даними.

Як систематизувати їх автор вирішує самостійно. Це може бути окрема тека, хмарне сховище, Google-диск, жорсткий диск або системне рішення у вигляді спеціалізованого софту.

Наприклад, на «Суспільному» архівування, опис і каталогізація готових програм здійснюється за допомогою програми inMediaWeb, а домонтажні матеріали зберігаються в системі inTVNews. Існують спеціальні застосунки для фотобанків, де фотографії зберігаються за певними метаданими, в яких, окрім тегів, є обовʼязкові поля: дата, назва, тема, категорія, жанр, місце, інформація про права тощо.

Збереження даних 

Таїсія Турин наголошує: місце зберігання даних є основою в архівуванні. Потрібно памʼятати, що збереження будь-яких даних завжди вимагає конкретного місця у фізичному чи віртуальному просторі. Тому сучасні медіаархіви вимагають відповідних серверних потужностей. Адже дані мають здатність швидко накопичуватися й займати багато місця, що потребує певних технічних рішень, зручних саме для вас. 

Сервери для зберігання медіаданих є доволі дорогими й не всі медіа можуть собі їх дозволити в достатній кількості. Тому для внутрішнього користування можна архівувати просто на жорстких дисках у вигляді тек із мінімальною систематизацією й описом (рік, місяць, прізвища журналістів). У цьому випадку йдеться лише про збереження файлів. І коли зʼявиться змога це повноцінно систематизувати, матеріали не втратяться назавжди. А у випадку, коли дійде до створення власного архіву, його буде чим наповнювати. Крім того, наявність навіть такого «примітивного» архіву для внутрішнього користування значно спрощує комунікацію із грантодавцями чи іншими донорами. Адже зʼявляється можливість апелювати до накопиченого матеріалу, який можна наочно побачити в архіві. За словами фахівчині, це сильна аргументація, яка допоможе знайти додаткове фінансування. Зокрема, на новий софт чи серверні потужності для подальшого архівування.

Зовнішні архіви — це коли дані зберігаються на сайті (серверах) і до них має доступ читач чи сторонній користувач. Варто памʼятати, що ці дані мають зберігатися в такому вигляді, щоб з їхніми описами міг розібратися й коректно їх інтерпретувати будь-хто. Це не можуть бути просто зашифровані дані без опису.

Важливий етап у процесі збереження даних — створення резервних копій.

Для всіх архівів (внутрішніх і зовнішніх) надзвичайно важливо резервувати дані й мати достатньо серверних потужностей для цього. Навіть якщо є мініархів на жорсткому диску для внутрішнього користування, дуже важливо, щоб існували бекапи в кількох місцях на різних носіях. Це особливо актуально під час війни, коли в будь-який момент ці дані можуть бути знищені. Для цього можна використовувати безплатні хмарні рішення. Турчин наголошує, що архівування — це збереження результатів журналістської діяльності, тому частину workflow треба спрямовувати на архівування.

Читати також: Як Bellingcat збирає та архівує цифрові докази воєнних злочинів в Україні 

Використання даних

Використання даних передбачає створення «сервісу» для внутрішнього й зовнішнього користувача. Для того, щоб архів був доступний для зовнішнього користувача (читача, глядача, слухача тощо), вебсайти, на яких він розміщений, мають бути оснащені відповідними опціями для спрощення пошуку матеріалів. Якщо говорити про архів публікацій, то простим рішенням тут може бути календар. 

«Це можна проілюструвати на прикладі “МикВістів”. На цьому сайті легко зайти в календар, натиснути на дату, після чого зʼявляються всі публікації за нею. Але саме в цьому випадку не вистачає функції “пошук” за словами та тегами», — каже керівниця проєкту з оцифрування архівних матеріалів «Суспільного мовлення».

Значно краще, коли є функція «пошук» за словами й категоріями. Це спрощує пошук необхідних матеріалів. За приклад Таїсія Турчин наводить незалежне громадсько-політичне інтернет-видання BILOZERKA INFO. Опція пошуку спрощує цю процедуру для користувачів за певною тематикою, але пошук за певною датою тут неможливий, оскільки немає фільтру часу. Крім того, відсутній «пошук» усередині категорії. Найкраще поєднати пошук за датою й за категорією.

Є сайти, де можливий пошук за локацією, наприклад, 360 war. Це медіа яке вже є медіаархівом. На сайті публікуються зображення на 360 градусів із руйнуваннями українських територій унаслідок російської агресії. На айті можна шукати різноманітні матеріали за локацією та є доступ до необроблених даних.

Ще один вдалий сервіс пошуку архівних матеріалів на сайті «Суспільне: медіатека». Це платформа, на якій архівні матеріали публікуються як окремі одиниці з відповідними описами й метаданими та зосереджені на певну цільову авдиторію.

Користь архівів

Використовувати архіви медіа можна в найрізноманітніший спосіб: як звіти про зроблену роботу, виконаний грант, як аргументи для донорських організацій. Медіаменеджерам це даватиме відповіді на питання хто, що й де робив, а ще — можливість швидше підраховувати KPI.

Окрім цього, медіаархіви можна поширювати як самостійний продукт. Це може бути дистрибуція архіву, продаж відповідних матеріалів документалістам, режисерам, продюсерам тощо. Саме продаж архівованих медіаматеріалів може створювати додаткові фінансові можливості для розвитку (купівля нових серверів, програмного забезпечення, вдосконалення систем пошуку вебсайтів, наймання відповідних спеціалістів тощо). 

«Наприклад, нам щодня приходить десятки запитів від різноманітних громадських організацій, міжнародних фондів, українських продакшенів, і всі прагнуть отримати архівні матеріали. Вони хочуть включати їх у нові твори й готові за це платити не малі гроші. Тому архіви обʼєктивно стають джерелом певного прибутку. Як приклад я відсилаю до YouTube сторінки «Загін Кіноманів», де блогер Віталій Гордієнко робить різноманітні відеоматеріали на основі медіаархівів. Його відео змонтовані з архівних матеріалів і набирають мільйонні перегляди», — каже Таїсія Турчин. 

Однак, для того, аби щось продати, потрібно його спочатку створити. І тут важливим є саме сервіс для внутрішнього й зовнішнього користувача. Бо якщо матеріалам не присвоїли відповідні метадані, не систематизували й каталогізували, то файли з текстами, фото, відео стають непотрібними. Звісно, є маленька надія на те, що коли файл просто зберегти, то хтось колись його знайде, опрацює та внесе до архівної бази. Але ця надія дуже мала. 

«Тому потрібно робити все одразу за правильним алгоритмом, аби продовжити матеріалу життя. Бо наступного дня буде новий матеріал, а попередній вже практично втрачений».  

Таїсія Турчин

Читати також: Як і навіщо мексиканська журналістка створила архів робіт загиблих репортерів