Сложный дисперсионный анализ (данные rempel). Часть 1

Nov 09, 2007 19:10


Разобрался. В посте на http://community.livejournal.com/ru_spss/71646.html  я ошибся - вложил не то и не туда. Чтобы больше не ошибаться и вообще на благо сообщества подробно объясню как делать такие анализы. Б/м грамотно планировать эксперименты могут почти все - помогает интуиция, но для правильного анализа не хватает как программ с интуитивно понятным интерфейсом, так и знаний. Т.к. не нашел как вставлять таблицы в комментарии - пишу здесь. По порядку.

1. СХЕМА ЭКСПЕРИМЕНТА. Чтобы потом не путаться нужно составить схему эксперимента. Насколько я понял, в этом эксперименте схема такая:

Время
Изоляция 1
Изоляция 2
Стресс 1 (N)
Стресс 2 (T)
Стресс 3 (D)
Стресс 1 (N)
Стресс 2 (T)
Стресс 3 (D)
М1
М2
М3
М4
М1
М2
М3
М4
М1
М2
М3
М4
М1
М2
М3
М4
М1
М2
М3
М4
М1
М2
М3
М4
1 (e0907)
1,98



12 (e1004)

9,53

Самое важное в ней правильно обозначить соподчиненность и связи факторов. Для мыши М1 в первой колонке стресса есть только измерения в разные временные точки (для первой точки - 1,98). Во второй колонке стресса М1 - уже другая мышь и т.д. В таком сложном экспериментальном плане (experimental design) можно выделить несколько простых:
 (а) Перекрестная Двухфакторная схема с факторами Изоляция и Стресс (если брать только одну временную точку исключив остальные),
(б) Иерархическая схема «Мыши внутри вариантов стресса» (если брать только 1 любую изоляцию и 1 временную точку),
(в) Схема Повторных измерений для зависимости оклика мыши от времени (если брать любой вариант стресса внутри любой изоляции; в качестве реплик выступают 4 мыши).
Т.о. здесь есть и перекрестная схема и 2 варианта иерархической (повторные измерения - тоже иерархия) и все вместе это - сложная перекрестно-иерархическая схема (cross-nested design = factorial mixed design), часто используемая экспериментальной науке. Поскольку это классика - не нужно ничего ни объединять, ни ограничиваться случаем равных отрезков времени, во всяком случае на этой стадии анализа данных.
ОТРИЦАТЕЛЬНЫЙ момент планирования: из схемы видно, что эксперимент спланирован не полностью законченным - в любой ячейке комплекса находится только одно наблюдение. В ходе анализа это приведет к невозможности оценить статистическую значимость некоторых эффектов. С точки зрения планирования следовало в каждой временной точке измерять каждую мышь хотя бы дважды - для нахождения ошибки эксперимента. Но не знаю насколько это возможно технически: в идеале нужно чтобы время между двумя повторными измерениями одной мыши было пренебрежимо малым по сравнению с отрезком времени между временными точками.
ПОЛОЖИТЕЛЬНЫЙ момент планирования: одинаковое число градаций на уровнях комплекса. Это обеспечивает ортогональность комплекса - его можно обсчитать классическим дисперсионным анализом (АNalysis Of VAriance = ANOVA), даже не прибегая к общим линейным моделям (General Linear Models = GLM). Было бы хуже, но не критично для GLM, если бы число мышей внутри стрессов было разным. Совсем плохо когда есть пропуски. Вот тогда и может потребоваться объединение ячеек комплекса, но и объединение не всегда возможно. Сталкивался с таким в данных врачей: при одном заболевании (сравни Изоляция) используются варианты лечения (сравни Стресс) 1, 2 и 3, а при другом заболевании - 2 и 4. Интересуют все сравнения. Вот и думай как тут выкручивать - в данных есть только схемы, реально применяемые на практике!

2. ПОДГОТОВКА ФАЙЛА ДАННЫХ

В первую колонку, назовем ее Data, нужно вбить все значения отклика. Во вторую (Isol) - соответствующие им метки для градаций изоляции (1 или 2). В третью (Time) - метки временной точки (1-12), в 4-ю (Stress) - метки для стресса (1, 2 или 3), в 5-ю (Mouse) - метки для мышей внутри варианта изоляции и стресса (1, 2, 3 или 4). По описанным ниже причинам я сохранил такой итоговый файл в корне диска С:\

Next post
Up