ДНК-генеалогия под микроскопом

Nov 06, 2024 13:05



[...] Скорости мутирования
Сама по себе скорость мутаций - это частота с которой будут встречаться мутации в поколениях потомков по сравнению с поколением родителей. А для определения скорости мутирования любых участков генома возможны два подхода:

- прямой подсчет
- калибровка

Прямой подсчет заключается в том, что сравнивается генотип родителей и потомков. Мутации сами по себе случаются нечасто, но при больших объемах данных обнаруживается достаточное их количество для дальнейшего исследования. С годами башковитые учёные смогли накопить внушительное количество генотипов отцов и сыновей. Данные получают, когда необходимо установить, например, отцовство, к тому же в последние десятилетия вообще наблюдается рост желающих сдать ДНК-анализ по совершенно разным поводам. Все полученные результаты аккуратно сохраняются и вносятся в специальные базы.
Средняя скорость мутирования, таким образом, может быть рассчитана из полученных и уже изученных STR-маркеров, которые хранятся в базах данных. И эту скорость, понятное дело, не преминули рассчитать. Так, для среднестатистического STR-маркера вероятность мутировать при передаче от отца к сыну составляет 0,0021, то есть примерно двадцать один шанс из десяти тысяч. Этот результат был получен с помощью прямого подсчета мутаций и скорость получила название "генеалогической". Так как данные брали из известных родословных.
Калибровка состоит в определении разнообразия гаплотипов, накопленного популяцией за время ее существования - от "начала", когда носителей гапотипов относительно немного, до сегодняшнего дня, когда количество носителей существенно больше.
Для применения этого метода требуется, чтобы было известно время "основания" популяции. Кроме того необходимо установить максимально возможное число сегодняшних "потомков", то есть носителей гаплотипов, произошедших "от предка". Такие наборы гаплотипов, идущие от "предкового" гаплотипа называют кластеры. Собственно метод калибровки, наряду с установлением времени появления популяции, подразумевает и количественный подсчёт таких кластеров, которые появились в популяции за время её существования.
Очевидно, что калибровка намного сложнее, и при использовании этого метода может возникнуть немало погрешностей, которые необходимо предусмотреть и учесть. Сам по себе метод калибровки является общепринятым в науке в силу своей универсальности, однако исследований скорости мутирования в Y-хромосоме пока произведено немного (маори и цыгане). А имеющиеся результаты оценки методом калибровки показывают, что вероятность возникновения мутации составляет 0,0007 - примерно семь шансов из десяти тысяч. Эта скорость получила название "эволюционной", поскольку определена для эволюционирующей популяции.
Таким образом, очевидно, что со скоростями мутаций до недавнего времени дела обстоли мягко говоря хреново. Лишь в 2013 году, когда начали массово внедрять полное секвенирование Y-хромосомы, ситуация начала меняться в лучшую сторону. Но до тех пор ученые имели на вооружении лишь две скорости: "эволюционная" и "генеалогическая".
И скорости эти различались между собой в три раза. Поэтому-то и наблюдаются сложности с определением возрастов гаплогрупп. Вопрос этот как видим практически нерешаем и будет оставаться дискуссионным до тех пор, пока не накопится достаточная статистическая масса данных по результатам полного секвенирования Y-хромосомы.
Анатолий же Алексеевич, по ему одному известной причине (которую он впрочем постарался обосновать в нерецензируемом журнале Advances in Anthropology), заявил, что вот именно ему удалось таки рассчитать (откалибровать) ту саму константу (постоянное значение) скоростей мутирования.
ВАЖНОЕ ЗАМЕЧАНИЕ - гаплотипы в разных исследованиях различаются количеством маркеров. Вдаваться в подробности я здесь уже не стану, просто примите это к сведению. Так например скорость мутирования для 22-маркерного гаплотипа Клёсов определяет как 0.00027 мутаций, то есть чуть более двух с половиной шансов на десять тысяч. А для 67 маркерного гаплотипа константа Клёсова составляет уже 0.00179 мутаций, то есть чуть менее восемнадцати шансов на десять тысяч...
Собственно, нетрудно догадаться, что излишне заниженная скорость мутаций приводит к увеличению возраста гаплотипов, а увеличение этой скорости неизбежно приведёт к "омоложению" популяции. Какую же из рассчитанных для разномаркерных гаплотипов констант Клёсов использует в своих исторических изысканиях? Правильно, ту которую нужно для удовлетворения текущих потребностей благодарной публики.
На специализированном ресурсе, где другие, глубоко погруженные в тему граждане, разбирают проблему калибровки скоростей мутаций, а попутно обсуждают и метод Клёсова, вы можете зачерпнуть полный тазик оливье соответствующих знаний. Для формата Дзена дальнейшие подробности будут уже излишни. К тому же мы с вами должны рассмотреть еще один аспект, который имеет прямое отношение к текущему вопросу.
... возникают очень непростые вопросы - какую же именно скорость мутирования применить, какова будет длина поколения и как количественно выразить все имеющееся разнообразие? Длину поколения можно на худой конец взять из демографических исследований (они колеблются от 25 до 33 лет), а затык со скоростями мутаций мы уже описали выше. Так что расчет возраста гаплотипов - дело ой какое непростое, при кажущейся примитивности формулы. Сегодня для датировки гаплотипов наука наиболее широко применяет два метода:

Метод по показателям ρ
Методо ASD
Датировка с помощью показателя ρ.

Этот метод считается классическим. Он основан на подсчете среднего числа мутаций, накопившихся в пределах кластера (собственно это число и обозначается знаком ρ).
Для этого метода необходимо иметь филогенетическое дерево, показывающее происхождение всех гаплотипов кластера друг от друга. К тому же для применения этого метода необходимо знать - какой из гаплотипов является исходным.
Расчет состоит в том, чтобы поочередно рассматриватья каждый гаплотип, идущий от общего "предка" и определять число мутационных шагов, на которые отступил каждый гаплотип от исходного гаплотипа-основателя.
По сути подсчитывается число мутационных "шагов". В простых случаях такие вычисления можно сделать вручную, но существуют и специальные программы, в которых предусмотрена возможность статистических ошибок и т.п.
Датировка с помощью показателя ASD. А для этого метода знать гаплотип-основатель даже не требуется, поскольку здесь правят бал Их Величества Математика и Статистика.
Метод состоит в определении средних квадратичных различий между гаплотипами. А вместо "предка" используется средневзвешенное значение STR-маркера во всех изученных образцах. Накопленное же разнообразие оценивается по дисперсии значений в разных образцах вокруг этого среднего. Проводится расчет отдельно для каждого STR-маркера, а затем результаты по всем маркерам усредняются. Этот расчет несложно провести вручную для подкованного математически человека, а для остальных сгодится обычный Excel.
НО ЕСТЬ И ТРЕТИЙ МЕТОД! Который называется "метод расчета по доле исходного гаплотипа". Этот метод требует только знание исходного гаплотипа. И всё. Данные для этого метода легко берутся из внешних источников.
Определяется частота исходного гаплотипа в исследуемой выборке (то есть считаем - как часто встречается исходный гаплотип), после чего рассчитывается возраст кластера.
Чем больше прошло времени, тем частота будет меньше, поскольку исходный гаплотип постепенно мутирует в производные. Убывание доли исходного гаплотипа описывается логарифмической формулой, которую, кстати, используют во многих других областях науки.
Эта формула широко используется, например в химической кинетике для описания химических реакций или в ядерной физике для описания радиоактивного распада. Используется она и в лингвистике для описания замены слов. Сама формула без труда выводится из распределения Пуассона и описывает логарифмический закон убывания исходного варианта при постоянной скорости его превращения в производные варианты. Каждый из представленных выше методов расчетов обладает своими особенностями.

1. Наиболее точным является показатель ρ. Но у этого метода есть один существенный недостаток - для его использования необходимо иметь дерево родства гаплотипов. А оно не всегда известно.

2. Метод ASD крут тем, что для него не требуется построения филогенетического дерева, однако он сильно упрощает модель. Ведь гипотетичский "среднестатистический" гаплотип может быть далеко не предковым. К тому же усреднение значений по всем локусам игнорирует тот факт, что в реальности каждый из них существует лишь в полном сцеплении друг с другом. Одним словом - статистика!

3. Среди достоинств метода расчета по доле исходного гаплотипа можно отметить лишь то, что он тоже не треубет знать дерево гаплотипов, хотя этим же достоинством обладает и метод ASD.

А вот недостаком метода является то, что он применим только для самых простых случаев. То есть для самых начальных этапов истории новой гаплогруппы. И как только доля исходного гаплотипа станет мала по сравнению с суммарным числом производных, то при использовании данного метода точность и надежность результатов начинает стремительно падать.
Этот метод, кстати, в исследованиях практически не используется. Просто потому, что его недостаточность видна изначально, а результаты, полученные с помощью этого метода будут верны лишь в ограниченном количестве случаев. Так зачем же применять молоток для вкручивания шурупов?
В признанной научной литературе публикаций, посвященных этому методу нет. Тем не менее его иногда используют энтузиасты из "гражданской науки", да и то в качестве "тренировки на кошках" при отработке навыков построения генеалогий на простых схемах.
Резюмируем. Если дерево родства гаплотипов реконструировано надежно, то наиболее оптимальным будет метод ρ, в противном случае целесообразно применить ASD. А вот расчет по доле исходного гаплотипа не оптимален вообще. А сейчас угадайте, какой метод взял на вооружение наш многофункциональный Анатоль? Так точно, тот самый, который имеет меньше всего возможностей и наименее оптимален. То есть Клёсов применяет метод расчета по доле исходного гаплотипа. Неужели в этом и заключается столь часто упоминаемый подклёсовиками "научный прорыв"? Так и есть, хотя ничего действительно поразительного здесь даже близко не наблюдается.©

Наука и ЖестЪ

Previous post Next post
Up