Компании, которые имеют
терабайты персональной информации в базах данных, где кол-во клиентов или операции насчитывает десятки, сотни или миллионы, встает необходимость, что-то с этим делом делать.
Какие «скрытые знания» мы можем получить?
Что означает «скрытые знания»? Это должны быть обязательно знания:
- ранее не известные - то есть такие знания, которые должны быть новыми (а не подтверждающими какие-то ранее полученные сведения);
- нетривиальные - то есть такие, которые нельзя просто так увидеть (при непосредственном визуальном анализе данных или при вычислении простых статистических характеристик);
- практически полезные - то есть такие знания, которые представляют ценность для исследователя или потребителя;
- доступные для интерпретации - то есть такие знания, которые легко представить в наглядной для пользователя форме и легко объяснить в терминах предметной области.
Как находить такую информацию?
Такую информацию можно находить с помощью технологии Data mining.