Originally posted by
20_00 at Bigdata - Sancta Informatio, ora pro nobis!
http://20-00.livejournal.com/104984.html Последнее время необходимость восстановления удаленной из интернетов информации возникает все чаще. Традиционно используемые для этой цели кэши поисковиков имеют один существенный недостаток - они иногда обновляются до текущей (т.е., удаленной) версии и не предусматривают хранение нескольких копий страницы за разные даты.
Сам я довольно часто использую архивы интернета не только для доступа к удаленной информации, но и для сравнения версий существующей информации, а также в качестве сервиса сохранения информации в публичном доступе, если есть риск её уничтожения в результате вандализма, психопатии или деструктивной активности государственных институтов.
Ниже представлен список общедоступных и достаточно мощных инструментов для решения этих задач. Их не стоит путать с электронными библиотеками, включая оцифрованные бумажные архивы, базами данных и тому подобным. Надеюсь, он окажется вам полезен.
1.
http://archive.org/web/. Архив интернетов. В представлении, кмк, не нуждается. Изнутри чебурашки работает нестабильно. Не обрабатывает страницы, запрещенные к индексации.
2.
http://archive.is/. Самый удобный инструмент для изготовления собственных снапшотов. Кроме прочего, содержит большой архив русскоязычного ЖЖ.
3.
http://www.webcitation.org/. Веб-цитатник. Любим википедистами. В основном архив научных статей и инструмент для создания библиографических ссылок правильного формата.
4.
http://www.webarchive.org.uk/ukwa/. Проект Британской библиотеки в сотрудничестве с рядом британских организаций и университетов. Британский сегмент интернета с тематическим каталогом.
5.
https://swap.stanford.edu/. Коллекция вебсайтов Стэ́нфордского университе́та.
6.
http://www.bibalex.org/isis/frontend/archive/archive_web.aspx. Один из самых старых, наряду с №1, архивов от Новой Александрийской библиотеки (в Египте), но уступающий конечно по количеству контента. Также коллекция медийных материалов.
7.
http://loc.gov/websites/. Архив сайтов от Библиотеки конгресса США. Ничего не могу сказать, не было случая использовать.
8.
https://archive-it.org/. По сути это дочерний проект Архива интернета (№1), в различия не вдавался, но отмечаю, что такой есть.
9.
http://vefsafn.is/index.php?page=english. Исландский веб-архив - исландские сайты с 2004 года! :)
10.
http://veebiarhiiv.digar.ee/. Эстонский архив на эстонском языке. Возможно, пригодится моим лингвистическим френдам :)
11.
http://www.zal-lj.si/. Тоже на словенском! По Словении.
12.
http://www.webharvest.gov/. Архив государственных сайтов США с 2001 года от Национального архивного управления. Специальный архив для профильных специалистов.
13.
http://webarchive.parliament.uk/. Архив от парламента Великобритании для пользования парламентариями. Но общедоступен. Кроме поиска по URL есть поиск по keywords.
14.
http://webarchive.proni.gov.uk/. Раздел этого же архива по Северной Ирландии.
(
Пиратская партия Росcии) (
РосКомСвобода) (
Кампания по реформе авторского права в цифровую эпоху) (
Анонимная файловая почта) (
VPN сервис) (
Анонимная почта Xmail) (
Анонимный почтовый сервис Safe-mail (платный)) (
Шифрование для чайников: Gpg4Usb на основе GnuPG) (
Защищенные анонимные почта, блог- платформа, VPN, мессенджер и веб- хостинг в одном аккаунте) (
Tox - безопасный распределенный P2P мессенджер.) (
Поисковая система для параноиков :) (
PRISM Break)
Пока всё. Если есть дополнительные опции - сообщайте. На практике, для моих нужд, можно обойтись первыми четырьмя сайтами.
.