Помилка 404: за 10 років із мережі зникла майже половина веб-сторінок
Нове дослідження Pew Research Center розкриває масштабну проблему цифрового розпаду в інтернеті. Аналіз показав, що близько 40% вебсторінок, створених у 2013 році, вже недоступні через спотворення, старіння або повне зникнення цифрових даних.
Аналітики використали випадкову вибірку з 1 мільйона вебсторінок з архівів Common Crawl за період з 2013 по 2023 рік. Виявилося, що до кінця 2023 року майже 40% сторінок, актуальних у 2013 році, було втрачено. Навіть серед знімків 2021 року видалено близько 20% контенту.
«Ми звикли вважати інтернет надійним сховищем інформації, але це ілюзія. Вебсторінки схильні до цифрового розпаду», – коментують експерти.
Найбільш вразливим виявився контент соціальних мереж. 18% повідомлень у Твіттері (нині X) зникли через блокування або видалення облікових записів. Часто зникають твіти турецькою (40%) та арабською мовами – вони недоступні вже через 3 місяці після публікації.
Цифровий розпад зачіпає і матеріали Вікіпедії: 11% зовнішніх посилань на її сторінках ведуть у нікуди. Кожна п’ята урядова вебсторінка містить неробочі посилання, найбільше їх на сайтах муніципалітетів. Близько 5% посилань на новинних сайтах не працюють.
Дослідники попереджають, що недовговічність інформації в мережі може позначатися на збереженні історичних даних і вірогідності наукових публікацій. Експерти закликають терміново розв’язувати проблему цифрового розпаду в інтернеті.
Джерело: mediasat.info