Введение
Специфичная для мужчин область Y-хромосомы (MSY) широко использовалась в исследованиях эволюции человека и истории популяций (
Jobling and Tyler-Smith 2003), но страдала от смещения в определении в изученных вариантах последовательности. Кроме того, хотя филогении, построенные на основе таких вариантов за последние два десятилетия (
Hammer 1995;
Underhill et al. 2000;
Y-Chromosome Consortium 2002;
Karafet et al. 2008), были полезны для определения гаплогрупп, распределение которых можно исследовать в разных популяциях, узлы не могли быть датированы непосредственно по вариации последовательности. Следовательно, датирование обычно основывалось на использовании другого класса маркеров, Y-специфичных коротких тандемных повторов (STR). Несмотря на то, что они сравнительно свободны от смещения при определении, поскольку они варьируются во всех популяциях, на эти маркеры влияет неопределенность в отношении правильного выбора частоты мутаций (
Животовский и др., 2004). Также возможны проблемы из-за насыщения мутациями в течение длительного времени (
Басби и др., 2012; Вэй, Аюб, Сюэ и др., 2013), а также из-за различий между STR в повторяющемся мотиве и длине массива, а также неоднородности массива (
Ballantyne et al., 2010).
Применение секвенирования следующего поколения (NGS) к большим сегментам MSY может обеспечить беспристрастное определение однонуклеотидных полиморфизмов (SNP) и позволяет создавать подробные филогении, в которых длины ветвей пропорциональны времени, что позволяет напрямую оценивать время от самого последнего общего предка (TMRCA) узлов. Недавно были описаны пять деревьев на основе NGS (
Консорциум проекта 1000 Genomes и др. 2010;
Francalacci и др. 2013;
Poznik и др. 2013;
Вэй, Аюб, Чен и др. 2013; Скоццари
и др. 2014). (
таблица 1), дающая представление о событиях в эволюции человека и взаимоотношениях популяций с точки зрения патрилинейности. Тем не менее, эти деревья сильно различаются по размеру выборки (от 36 до 1208 Y-хромосом), количеству популяционных выборок (от 1 до 9) и представленности известных линий. Методологии секвенирования также были неоднородными, с последующим изменением количества секвенированной ДНК (от 1,5 до ≈ 10 Мб) и среднего охвата (от 2 × до 50 ×). В подходах с низким охватом использовались методы вменения для определения аллельных состояний отсутствующих генотипов на основе самой филогении, а синглтоны (варианты, присутствующие только один раз в наборе данных), которые определяют длины терминальных ветвей, были плохо установлены, с последующей вероятной недооценкой длин ветвей (
Francalacci et al. 2013).
До сих пор ни в одном исследовании не было объединено секвенирование с высоким охватом мультимегабазных сегментов MSY в широком диапазоне образцов, охватывающих большинство известных кладов филогении. Здесь мы добиваемся этого, объединяя филогению 334 Y-хромосом (представлено Batini et al.) на основе 17 популяций Европы и Ближнего Востока, которые мы используем в других местах в качестве инструмента для изучения демографической истории европейских популяций, с дополнительными 114 последовательностями MSY, которые вместе гарантируют, что основные клады и глубокие- Представлены корневые узлы.
далее читать здесь:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4327154/