День назад средства массовой информации вновь начали упоминать российскую поисковую систему "
Яндекс" в своих статьях: в поисковой выдаче "Яндекса" вновь появились конфиденциальные данные посетителей сайтов.
К слову сказать, хоть российские средства массовой информации и пишут о "Яндексе", проблема имеется не только с ним. К числу поисковиков, которые проиндексировали личные данные посетителей сайтов, относятся также Google и, как сообщается в некоторых блогах, Bing. Все эти поисковые системы проиндексировали содержимое страниц интернет-магазинов и компаний, осуществляющих продажу билетов, на которых посетители могли узнавать о статусе своего заказа.
Проиндексированные страницы сайтов, на которых можно было заказать тот или иной товар, содержали наименование товара, фамилию, имя и отчество заказчика, его физический адрес, IP-адрес, с которого был произведён заказ, а также другие данные. В некоторых случаях показывались паспортные данные заказчика (их заказчик вписывал при покупке билетов).
В список "пострадавших" сайтов попали интернет-магазины абсолютно разных направлений: сайты, торгующие авиа-билетами и билетами на железнодорожные поезда, здесь интернет-магазины интим-товаров, здесь интернет-магазины ножей и многие другие. Поскольку количество людей, пользующихся on-line-сервисами, очень велико, ситуация ещё более плачевна, чем ситуация с
SMS, отправленными с сайта "МегаФона".
Администраторы некоторых сайтов поспешили прекратить работу сайтов, закрыв их на реконструкцию и объявив о технических неполадках, некоторые администраторы уже устранили проблемы, а некоторые сайты переставали работать.
На данных момент ситуация медленно, но нормализуется. Возможно, тому поспособствовали администраторы и программисты поисковых систем, а возможно и то, что это лишь следствие быстрой переиндексации поисковыми роботами. В Google, например, осталось всего лишь два результата по популярному в последние дни запросу:
При этом российский поисковый гигант содержит немного больше ответов - 177 тысяч.
При этом даже не все администраторы сайтов предпочли поставить на страницу статуса заказа сообщение об ошибке. Вот, например, страничка одного из интернет-магазинов, осуществляющего продажу автомобильных запчастей и до сих пор присутствующего в результатах поиска:
В этот раз, как, впрочем, и в прошлый, проблема возникла из-за неверно составленного или вовсе отсутствующего файла robots.txt, который предназначен для запрета индексации определённых страниц сайта роботами поисковых систем. Об этом рассказали представители "Яндекса" и это можно заметить самому. Например, вот так выглядит файл robots.txt рассмотренного выше интернет-магазина автомобильных запчастей:
Ведь легко можно запретить к индексации адреса страниц, которые содержат конструкцию "/new/shop/index.php?ukey=order_status", но почему-то владелец сайта над этим не задумывался. Не известно, сколько времени информация по подобным адресам была доступна в поисковых системах до того момента, как её обнаружили. Не известно также и то, какую ещё информацию с русскоязычных веб-сайтов проиндексируют и покажут в результатах поиска поисковые системы...
Дополнение. Кстати, а вот такую защиту придумали администраторы интернет-магазина ножей:
Действительно делал заказ - можешь подтвердить это, вписав фамилию; попал на страницу случайно - попробуй угадай. Зато и поисковые системы, и мимолётные посетители не подберутся к информации, а возможность посмотреть данные о заказе по-прежнему имеется.