Хорошо известно, что в Китае заблокированы (в хронологическом порядке блокировки): YouTube, Google, Gmail, Twitter, Flickr, Hotmail, Facebook, Pinterest, WhatsApp, Snapchat, Instagram - и много-много других сервисов. Причина всего одна, но очень серьезная - все они не подчиняются государственным органам КНР. В наличии лишь явное отсутствие желания западных интернетчиков и веб-сервисов исполнять региональное законодательство и, соответственно, уважать закон суверенного государства а не «раскачивать лодку». Опять мировой заговор)
Китай, как в древние времена, и в интернете закрылся стеной и провдит внутренние чистки. И это происходит с завидным масштабом. С нежелательным контентом в интернете и социалках борется целая армия цензоров. Их количество можно оценить в десятки тысяч человек, в том числе официальные блогеры и интернет-полиция.
Журналист из Forbes Никита Цаплин считает, что при такой большой армии «интернет-цензоров», КНР одновременно очень старается, чтобы факт присутствия цензурной системы, контроль и слежка для простых пользователей не ощущалась. Попытки открыто обсудить именно эту проблему, указать на факт цензуры наказываются иногда даже более резко, чем прямая критика руководителей и политика КПК.
Но прямая цензура - это далеко не все. Есть в интернете Китая сила и посерьёзней
Чем занимаются 30 000 сотрудников в действующем проекте с ориентировочной стоимостью только на момент запуска (15 лет назад) составляла более $800 млн.
Китайская система «Золотой щит» (один из двенадцати проектов в сфере электронного обеспечения государства) имеет и свое неофициальное имя «Великого китайского файервола» Он представляет из себя топографию серверов-шлюзов между внутригосударственными провайдерами и внешними международными сетями. В каждом таком сервере размещены интернет-снифферы (перехватчики-считыватели проходящих через них потоков информации) и прокси-сервера (упрощенно - анонимизаторы), копирующие пакеты данных, классифицирующие их по технологиям DPI (технологии проверок и фильтраций по содержимому и с помощью статистических критериев). Идет постоянная проверка по заданным ключевым словам и особенностям трафика с помощью алгоритма автоматического обучения системы для кластеризации трафика (SVM), после этого системы (не человек!) принимают решения о возможных ограничениях доступа к конкретным ресурсам.
При чем с точки зрения рядового пользователя задержек не заметно. Это потому, что использованы гигантские электронные мощности, - некоторые дата-центры занимают территорию с маленький городок, да и применяется принцип «роевого интеллекта» (Swarm Intelligence) для балансирования и обработки данных однотипных субблоков.
С помощью технологий DPI, connection probe (анализ интенсивности трафика) и SVM в итоге были перекрыты так называемые «фань цян» (перебираться через стену»), долгое время используемые китайскими пользователями способы получения доступов к нелегальным, но таким желанным запрещенным западным мессенджерам и социалкам.
Кстати именно DPI во всем мире очень активно используется провайдерами/маркетологами при анализах активности пользователей через браузеры, чтобы делать таргетированную рекламу, которая согласуется с вашими поисковыми запросами, сообщенным в социальные сети личных данных и интересов.
Connection probe - отличные технологии для борьбы, например, VPN-сервисами, они инициируют подключение по целевому адресу, заданному пользователем, не от его IP, а от сервера. Автоматически происходит идентификация типа запрошенного сервиса. Для примера, программа анонимизации ресурсов под именем i2p, децентрализованная и динамическая «сеть внутри сетей», сейчас заблокирована этими средствами в самой КНР и за тем использована в Иране, потом блокировке подвергся общеизвестный Tor.
Методика опорного вектора (SVM) - хороший алгоритм для автоматического самообучения, который совместно с анализаторами DPI машинным образом классифицирует большие пакеты несходных данных. Выявляются неочевидные закономерности в трафике, через анализ частоты заданных символов, длин отправляемых массивов и т.п.
Для примера, в КНР запрещена тема Тяньаньмэнь 4 июня 1989 года. DPI сканируя трафик, заблокировал веб-адреса с упоминанием этой даты. Но китайцы, естественно, стали хитрить, писать это число как 35 мая (и много других способов) и тогда и были использованы алгоритмы SVM, которые достаточно легко находили замаскированный объект цензуры.
Однако Великий Китайсий Фаерволл обычно действует не «в лоб». Пользователи нежелательного контента или сервиса вдруг замечают заметное торможение работы нежелательного ПО. В итоге юзеры предпочитают китайский аналог - поисковиком выбран Baidu, мессенджером weChat, твиттером - Weibo, ютюбом - Youku, интернет-энциклопедией Sogou Baike. Есть даже официальные VPN для корпораций, но их, естественно, могут прочитать органы.