Як архів може зберегти роботи журналістів

Якщо сайт зникне. Якими способами журналісти намагаються зберегти свої матеріали

П’ятниця, 23 Серпня, 2024

Кейси й рішення

Вероніка Нановська

Коли зникають архіви новинних сайтів, програють не лише читачі. Тому якщо ви стикалися з тим, що сайт, в якому ви працювали, закрили, а матеріали під вашим іменем не збереглися — цей текст для вас.

2021 року автори звіту Інституту журналістики Рейнольдса виявили, що лише 7 із 24 опитаних ними редакцій повністю зберігають свій новинний контент. Тому, щоб упевнено покликатися на свої роботи, їх потрібно архівувати самостійно. І якщо вебсторінки, фотографії та текстові історії легше зберегти, то з аудіо, інтерактивами та іншими видами цифрової журналістики доводиться проявляти творчість.

У NiemanLab поговорили з трьома журналістами про те, як вони зберігають свої роботи.

Чому архівування — це не просто

«Що, якщо ваш сайт атакує вірус? Що, якщо у вашого провайдера вимкнеться електрика? Є багато сценаріїв, в яких вам може знадобитися архів створених вами речей», — зазначає Тейла Купер з Нью-Йоркського університету. Вона каже, коли щось закривають, страчається не лише контент, але і те, що є похідним від нього — ключовий доказовий матеріал, який можна, наприклад, використати для перевірки тверджень, або для просування чиєїсь кар’єри.

Це також проблема для сайтів, чий контент відсканували великі мовні моделі для свого навчання, оскільки це буде неможливо відстежити.

Дізнатися більше: На чому розробники навчають ШІ та що буде, коли дані закінчаться

Великі традиційні медіа часто мають більше можливостей, щоб зберігати свої архіви, ніж локальні та маленькі медіа, які працюють лише в цифровому форматі. Проте ці протоколи потрібно постійно оновлювати та вдосконалювати, аби не відставати від технологій, що змінюються, і форм журналістики, що розвиваються.

Райан Мерфі, який працює в архівному відділі The New York Times і є агентом із продажу передруків, каже, що навіть у такій великій газеті, як The New York Times, речі можуть загубитися.

Коли Мерфі вперше прийшов у газету, сучасні архіви (кольорові та з високою роздільною здатністю) були на компакт-дисках (тобто кожен кольоровий випуск NYT був на окремому компакт-диску).

«Щоразу, коли репортери хотіли отримати оригінальний кольоровий випуск, вони брали його, наче в бібліотеці. Іноді їх не повертали», — розповідає Мерфі. Одного разу він подумав: «Я просто скопіюю кожен диск на свій комп’ютер. Зрештою, ми створили сервер для зберігання всіх старих цифрових файлів [які збереглися, — авт.]». Журналісти можуть мати доступ до інформації, яка була сотні років тому, але іноді втратити те, що зробили нещодавно.

За словами Тейли Купер, якісне цифрове збереження коштує дорого, а менш дорогі методи є трудомісткими.

Через фінансові обмеження редакції можуть покладатися на системи контент-менеджменту як на недосконалий архів замість того, щоб інвестувати в системи управління цифровими активами. Якби Купер була архіваріусом газети, яка закривається, вона звернулася би до професійних команд, які можуть взяти на себе завдання архівування сайту та довгострокове збереження архівів. Подібні служби існують в академічних колах — наприклад, CLOCKSS і Portico, служби цифрового архівування наукових статей і журналів.

Кейс радіорепортерки Андреа Гутьєррес

Коли американська радіостанція KPCC змінила бренд і перемістила весь свій контент на LAist.com, покликання на старий сайт станції перестали працювати. Тому Андреа Гутьєррес, незалежна радіорепортерка із Лос-Анджелеса, відтепер самостійно оновлює архів власних робіт. Вона зберігає детальну таблицю на сервісі для створення і керування баз даних AirTable із датами виходу її статей, шоу чи програм, які вони транслювали, і лінками на Dropbox на аудіофайли.

Деякі фрагменти можуть залишатися онлайн, напівзаблокованими на платформах, на які їх спочатку завантажили. Коли Гутьєррес працювала на TED Radio Hour, вона знімала відео, які поєднували аудіосценарії з шоу з відео ведучих. Вона не зберегла відеофайли для себе. Вони все ще в Instagram, але вона не може отримати їх, не вдаючись до «темних сайтів для завантаження відео».

До роботи в журналістиці Гутьєррес архівувала студентські тези й дисертації. Пізніше вона працювала у феміністичному друкованому журналі під назвою Make / Shift. Коли журнал закрився 2017 року, він передав усі свої напрацювання до архіву в Лос-Анджелесі.

Цей досвід допоміг журналістці усвідомити, що людина, яка остаточно відповідає за збереження її роботи, — це вона.

Кейс репортерки Алекс Аззі

Алекс Аззі, спортивна репортерка LexisNexis, часто шукає в газетних архівах історії про кар’єру спортсменок, зокрема за період, коли ті навчалися в середній і старшій школі. За її словами, в газетних архівах легше знайти історії про жіночий спорт, тому що більшість телеканалів повністю його ігнорують.

З чим стикалася Аззі

Коли Аззі працювала над матеріалом про жіночий хокей, їй потрібно було знайти інформацію про судовий позов. Репортерка Мег Лінеган працювала в жіночому спортивному виданні Excelle Sports і була єдиною, хто детально висвітлював цей судовий процес. 2017 року Excelle Sports закрилося після двох років роботи, а його матеріали більше не з’являлися в інтернеті. І хоча Лінеган поділилася копією чернетки статті в Google Docs, вона вже не пам’ятала, наскільки ця чернетка була близька до публікації.

У листопаді 2022 року Аззі звільнили з NBC Sports, а у червні 2023 року NBC розпочав редизайн свого сайту, що залишило її без активних покликань для CV. 

«Мені постійно доводиться редагувати своє резюме, щоб переконатися, що покликання збігаються із моєю роботою. Зокрема, лінки на NBC Sports змінилися для багатьох моїх матеріалів», — каже Аззі.

Пізніше, в липні 2023 року, Аззі взяли на посаду старшого редактора висвітлення жіночого спорту в The Messenger. У лютому 2024 року, через шість місяців, сайт закрили, а всі роботи зникли. 

Що з цим робила Аззі

У випадку з жіночим хокеєм Аззі виявила, що деякі з найкраще збережених архівів існували на серверах Університету Торонто. З 1990-х років експрофесорка інформатики Університету Торонто та хокеїстка Андрія Хантер архівувала висвітлення канадського жіночого хокею на вебсайті свого університету. Нещодавно вона почала переносити всю цю роботу на особистий вебсайт The Women’s Hockey Web.

Аззі змогла знайти лише деякі лінки на свої історії через інтернет-архів Wayback Machine та Вікіпедію. Також, на щастя, у неї збереглися деякі PDF-файли.

Уже під час роботи в The Messenger Аззі взялася за роботу зі збереження. Вона заархівувала приблизно 30 історій на Wayback Machine, щоб її автори мали записи про свою роботу. Вона також копіювала та вставляла історії фрилансерів у документи Word — нудний процес, який вимагає переформатування тексту, щоб видалити рекламу. Водночас потрібно переконатися, що документи все ще мають візуальні індикатори, які показують, що історії справді опубліковані на професійному сайті новин.

Як дружина Метью Голт допомогла з архівами

За кілька місяців до закриття Vice колеги почали рятувати свій архів роботи. У американського журналіста-фрилансера Метью Голта були матеріали з Vice за 10 років, і ідея вручну «зберігати як PDF» сотні історій була непривабливою.

Його дружина Карен Голт, інженерка-програмістка місцевої енергетичної компанії, налаштувала сценарій на основі Gotham Grabber, відкритого вихідного коду на GitHub для видань Gothamist і DNAinfo, щоби скопіювати історії чоловіка як читабельні PDF. Після цього вони почали допомагати іншим авторам.

Метью зробив чат Signal зі співробітниками Vice, які хотіли зберегти свої роботи. За вихідні Карен і їхній друг Кріс скопіювали з сайту контент із 60 авторських тегів. Далі у папку Google Drive вони завантажили заархівований файл для кожного журналіста. За словами Карен, на пошук одного конкретного автора пішов майже цілий день, тому що багато з 3200 статей репортера містили зображення, на скрапінг яких потрібно більше часу.

І хоча зараз сайт і контент Vice доступні в мережі, ніхто не знає, коли це може змінитися. Метью каже, що досить цинічно ставиться до цього і схильний думати, що все дуже легко зникає.

Раніше ми розповідали про досвід Алехандри Ібарри Чаул, яка створила архів робіт загиблих журналістів у Мексиці, щоб зберегти їхній доробок і пролити світло на причини вбивств репортерів. Також ми переповіли лекцію керівниці проєкту з оцифрування архівних матеріалів «Суспільного мовлення» Таїсії Турчин про значення медіаархівів, як їх створювати, наповнювати та систематизувати.

Vice | архіви | архівування