Иногда я провожу обзор научной литературы по применению продвинутых "алгоритмов" анализа данных. Термин "knowledge discovery from data" мне нравится больше чем "data mining", т.к. KDD явно описывает цель работы, тогда как DM предлагает название процессу; существуют и альтернативы, иногда специфичные для знаниевого домена. Для полноценного обзора литературы приходиться использовать все синонимы, например недавний запрос для scholar.google.com [
allintitle: manufacturing "data mining" OR "machine learning" OR "data science" OR "knowledge discovery from data" OR "natural language processing" OR "signal processing" OR "business analytics" OR econometrics OR "statistical process control" OR "deep learning"]
В этой записи я предлагаю составить как можно более полный список понятий, в той или иной степени связанных с KDD. В запросе выше видно, что в ссылке не присутствует последний термин, "deep learning", скорее всего из-за ограничения на длину запроса. Ниже приведена таблица понятий, я предлагаю увеличить как число строк, так и число столбцов.
Термин
Домен
Комментарий
data mining
универсальный
некоторый фокус на получение результата
machine learning
универсальный
некоторый фокус на алгоритмы, с помощью которых получают результат
data science
универсальный
?
knowledge discovery from data
универсальный
малораспространен
knowledge discovery in databases
универсальный
ограничен на обработку данных из баз данных
natural language processing
текст
ограничен на обработку текста
signal processing
универсальный
обработка потоковых данных
business analytics
business
фокус на дэшбоарды за которыми скрывается простенькая аналитка, большей частью даже аггрегация данных
econometrics
экономика
макроэкономика, параметры и модели
statistical process control
производство
автоматизация управления производственными процессами
deep learning
универсальный
?