Архивы интернета для доступа к удаленной информации и сохранения информации в публичном доступе

Dec 05, 2015 01:58

Originally posted by 20_00 at Bigdata - Sancta Informatio, ora pro nobis! http://20-00.livejournal.com/104984.html

Последнее время необходимость восстановления удаленной из интернетов информации возникает все чаще. Традиционно используемые для этой цели кэши поисковиков имеют один существенный недостаток - они иногда обновляются до текущей (т.е., удаленной) версии и не предусматривают хранение нескольких копий страницы за разные даты.

Сам я довольно часто использую архивы интернета не только для доступа к удаленной информации, но и для сравнения версий существующей информации, а также в качестве сервиса сохранения информации в публичном доступе, если есть риск её уничтожения в результате вандализма, психопатии или деструктивной активности государственных институтов.

Ниже представлен список общедоступных и достаточно мощных инструментов для решения этих задач. Их не стоит путать с электронными библиотеками, включая оцифрованные бумажные архивы, базами данных и тому подобным. Надеюсь, он окажется вам полезен.

1. http://archive.org/web/. Архив интернетов. В представлении, кмк, не нуждается. Изнутри чебурашки работает нестабильно. Не обрабатывает страницы, запрещенные к индексации.

2. http://archive.is/. Самый удобный инструмент для изготовления собственных снапшотов. Кроме прочего, содержит большой архив русскоязычного ЖЖ.

3. http://www.webcitation.org/. Веб-цитатник. Любим википедистами. В основном архив научных статей и инструмент для создания библиографических ссылок правильного формата.

4. http://www.webarchive.org.uk/ukwa/
. Проект Британской библиотеки в сотрудничестве с рядом британских организаций и университетов. Британский сегмент интернета с тематическим каталогом.

5. https://swap.stanford.edu/. Коллекция вебсайтов Стэ́нфордского университе́та.

6. http://www.bibalex.org/isis/frontend/archive/archive_web.aspx. Один из самых старых, наряду с №1, архивов от Новой Александрийской библиотеки (в Египте), но уступающий конечно по количеству контента. Также коллекция медийных материалов.

7. http://loc.gov/websites/. Архив сайтов от Библиотеки конгресса США. Ничего не могу сказать, не было случая использовать.


8. https://archive-it.org/. По сути это дочерний проект Архива интернета (№1), в различия не вдавался, но отмечаю, что такой есть.

9. http://vefsafn.is/index.php?page=english. Исландский веб-архив - исландские сайты с 2004 года! :)

10. http://veebiarhiiv.digar.ee/. Эстонский архив на эстонском языке. Возможно, пригодится моим лингвистическим френдам :)

11. http://www.zal-lj.si/. Тоже на словенском! По Словении.

12. http://www.webharvest.gov/. Архив государственных сайтов США с 2001 года от Национального архивного управления. Специальный архив для профильных специалистов.

13. http://webarchive.parliament.uk/. Архив от парламента Великобритании для пользования парламентариями. Но общедоступен. Кроме поиска по URL есть поиск по keywords.

14. http://webarchive.proni.gov.uk/. Раздел этого же архива по Северной Ирландии.

(Пиратская партия Росcии) (РосКомСвобода) (Кампания по реформе авторского права в цифровую эпоху) (Анонимная файловая почта) (VPN сервис) (Анонимная почта Xmail) (Анонимный почтовый сервис Safe-mail (платный)) (Шифрование для чайников: Gpg4Usb на основе GnuPG) (Защищенные анонимные почта, блог- платформа, VPN, мессенджер и веб- хостинг в одном аккаунте) (Tox - безопасный распределенный P2P мессенджер.) (Поисковая система для параноиков :) (PRISM Break)

Пока всё. Если есть дополнительные опции - сообщайте. На практике, для моих нужд, можно обойтись первыми четырьмя сайтами.
.

Полезности

Previous post Next post
Up