Оригинал взят у
philologist в
Архив газеты "The New York Times" выложен в открытый доступОткрытый цифровой архив известнейшей американской газеты с огромным количеством материалов и удобным поиском.
Любая газета - это ценный исторический документ, который многое может рассказать о своей эпохе. В этом легче всего убедиться, если приложить это утверждение к такому культовому изданию, как The NY Times. Благодаря проекту
TimesMachine, на котором выложено более 13 миллионов статей, опубликованных с 1851 года по настоящее время, каждый может осуществить небольшое путешествие во времени. Масштабная работа по оцифровке архивов газеты началась ещё в 2001 году. Постепенно материалы выкладывались в сеть, но были доступны только в виде PDF-документов. В 2014 году наконец удалось запустить сайт с удобной навигацией и поиском по тексту или изображению. В 2016 году архив газеты пополнился на более чем 8 тыс. номеров (или 1,4 млн статей), опубликованных с 1980 года по настоящее время. К сожалению, далеко не ко всем номерам, опубликованным между 1923 и 1980 годом, можно получить доступ без подписки. Но остальные материалы можно просматривать совершенно свободно.
На основе TimesMachine в 2014 году был запущен краудсорсинговый проект
Madison, который предлагает читателям просматривать номера газеты и указывать, какой из участков полосы является рекламой, а также расшифровать увиденный текст. По такому же принципу работает технология reCaptcha, с которой сегодня наверняка сталкивался каждый. Она берёт куски текста из оцифрованных книг и других печатных изданий, с расшифровкой которых компьютер не справился. Вбивая капчу, пользователь не только проходит тест Тьюринга, но и помогает работе цифровых архивов.
Отсюда Вы также можете подписаться на мои страницы:
- в фейсбуке:
https://www.facebook.com/podosokorskiy- в твиттере:
https://twitter.com/podosokorsky- в контакте:
http://vk.com/podosokorskiy