Котики и паучки

Jun 05, 2013 19:54

Современные поисковые системы стараются понимать естественный язык вопрошающего. В идеале поисковик должен найти адекватный результат даже в том случае, если ни одно слово из поискового запроса не встречается в найденной странице, но их смысл соответствует.

Именно такая задача стоит перед DLP-системой: найти то, не знаю что документ с конфиденциальной информацией, изложенной любыми словами или даже без слов. Семантические, лингвистические и всякие онтологические методы анализа тут расцветают.

Неудивительно, что в составе DLP-систем современного поколения появляется краулер, он же паук-сборщик, он же поисковый робот - в точности как у "больших" поисковиков. Он ходит по всем закоулкам корпоративной сети с пропуском-"вездеходом", понимает все языки, протоколы и форматы и ищет, где чего плохо лежит. Но, разумеется, не тащит всё найденное в собственную базу, как это делают жадный Гугл и любопытный Яндекс, иначе он сам мог бы стать источником утечек.



Смотреть ещё!

Краулер появился в последней версии нашего продукта - InfoWatch Traffic Monitor Enterprise 4.0. Чем ответят конкуренты?

DLP-система

Previous post Next post
Up