Попытка проанализировать причинно-следственные связи свободно доступного набора данных.

Mar 20, 2015 15:33

Крайне часто мы слышим "корреляция это ещё не причинно-следственная связь", однако в своих аргументах в споре приводим её именно в данном качестве ( Read more... )

Leave a comment

dborisog March 20 2015, 15:30:04 UTC
Да, statistical inference -- очень интересная дисциплина, которую хочу освоить практически полностью. К сожалению, пока понял, что обладаю недостаточными теоретическими знаниями. Но через некоторое время смог бы поучаствовать или откомментировать ход дискуссии )))

Reply

p2004r March 22 2015, 08:57:41 UTC
Как видно темп дискуссии временами напоминает "переписку Грозного с беглым Курбским"ТМ, так что ждём подключения. А то мы с автором журнала уже "исчерпали пространство состояний" :)

Reply

dborisog March 22 2015, 09:56:12 UTC
Пока у меня создалось впечатление, что statistical inference можно разделить на три области: проверка гипотез, предсказание (большей частью с помощью линейной регрессии) и построение моделей (взаимосвязь переменных). В данный момент я изучаю проверку гипотез (hypothesis testing), ваша дискуссия скорее связана с третьей категорией. Смею предположить, что в рамках существующего датасета можно отследить ненаправленные связи между значениями, но для построения направленных связей придётся выходить за пределы датасета, как за дополнительными концепциями, так и статистикой и допущениями.

Reply

p2004r March 22 2015, 10:42:02 UTC
Всё нормально с направлением связи, строится наилучшая модель с учетом направленности связи. (Во всяком случае человек действует куда более нелогично.)

http://secondary-tea.livejournal.com/18888.html?thread=44232#t44232

?choose.direction

Check both possible directed arcs for existence, and choose the one with the lowest p-value, the highest score or the highest bootstrap probability.

Castelo R, Siebes A (2000). "Priors on Network Structures. Biasing ( ... )

Reply

dborisog March 24 2015, 09:25:04 UTC
> Всё нормально с направлением связи, строится наилучшая модель с учетом направленности связи. (Во всяком случае человек действует куда более нелогично.)

Предыдущий комментарий я писал думая о книжном примере про статистическую связь между показаниями барометра и дождя.

Если же говорить про направленность, то по названиям статей видно, что они основываются на теореме Байеса, что логично, но вникание в байесианство я оставил на потом. Учитывая текущую скорость освоения теоретического фундамента statistical inference, -- в значительной степени на потом.

Reply


Leave a comment

Up