Мaximal information coefficient in Science

Dec 22, 2011 00:23

А что уважаемые френды думают по поводу последней статистической/data mining статьи в Науке?

http://www.sciencemag.org/content/334/6062/1518.abstract

Это действительно такой прорыв в статистике?

Leave a comment

Comments 6

plakhov December 22 2011, 07:28:42 UTC
В принципе выглядит интересно, но пока не попробуешь - не узнаешь. Чтобы это работало, нужно очень много данных. Боюсь большого количества false positives. На Fig.2A хорошо бы увидеть размеры dataset'а, при котором они для random'а получили 0.18, и как это число зависит от размеров dataset'а.

Куда бы это, например, у нас можно было применить, я так что-то сходу не соображу, это вам не ЦПТ и не machine learning. Обычно в жизни функциональные зависимости более-менее монотонные, их обычный коэффициент корреляции ловит неплохо.

Такие вот нехитрые мысли.

Reply

tea_with_milk December 23 2011, 07:46:51 UTC
Я вот тоже пока не понял, насколько широко приложим метод. Ведь он предложен только для двух переменных Хотя появилось пару идей как использовать его для feature-selection.

Reply


esya December 22 2011, 16:35:34 UTC
хочешь сказать, что теперь при постановке эксперимента можно не думать и просто много мерить? а комп сам найдет что-нибудь полезное? ;)

Reply

tea_with_milk December 23 2011, 07:32:14 UTC
Не поверишь, только сегодня с коллегой на тему семантического Веба для life science общались. Но далеко это все до реалий. Тут, насколько я понял, основная фишка в том что данная мера позволяет определить зависимы ли две переменные, причем эта зависимость может быть какой угодно. Меня вот лично смущает слово "каой угодно", надо лезть в Supplementary разбираться в методе.

Reply


bakhtin December 22 2011, 17:42:55 UTC
Мало ли чего можно придумать такого. Наверное, есть задачи, где это полезно. Стандартную корреляцию вычислить легко, а эту не очень. Всегда есть вопрос интерпретации, что привносит элемент научной фантастики. А так-то что --- в общем, хорошо, что люди над этим думают. Преувеличивать значение только не надо.

Reply

tea_with_milk December 23 2011, 07:26:53 UTC
Юр, да вот я тоже задумался над преувеличением значения, особенно когда подкаст Науки послушал с участием первого автора. Как то нет ощущения прорыва, что обычно характерно для full paper в Науке. Не понял, короче.

Reply


Leave a comment

Up