The Y-Chromosome Tree Bursts into Leaf: 13,000 High-Confidence SNPs Covering the Majority of Known C

Aug 10, 2022 07:35

Введение

Специфичная для мужчин область Y-хромосомы (MSY) широко использовалась в исследованиях эволюции человека и истории популяций (Jobling and Tyler-Smith 2003), но страдала от смещения в определении в изученных вариантах последовательности. Кроме того, хотя филогении, построенные на основе таких вариантов за последние два десятилетия (Hammer 1995; Underhill et al. 2000; Y-Chromosome Consortium 2002; Karafet et al. 2008), были полезны для определения гаплогрупп, распределение которых можно исследовать в разных популяциях, узлы не могли быть датированы непосредственно по вариации последовательности. Следовательно, датирование обычно основывалось на использовании другого класса маркеров, Y-специфичных коротких тандемных повторов (STR). Несмотря на то, что они сравнительно свободны от смещения при определении, поскольку они варьируются во всех популяциях, на эти маркеры влияет неопределенность в отношении правильного выбора частоты мутаций (Животовский и др., 2004). Также возможны проблемы из-за насыщения мутациями в течение длительного времени (Басби и др., 2012; Вэй, Аюб, Сюэ и др., 2013), а также из-за различий между STR в повторяющемся мотиве и длине массива, а также неоднородности массива (Ballantyne et al., 2010).

Применение секвенирования следующего поколения (NGS) к большим сегментам MSY может обеспечить беспристрастное определение однонуклеотидных полиморфизмов (SNP) и позволяет создавать подробные филогении, в которых длины ветвей пропорциональны времени, что позволяет напрямую оценивать время от самого последнего общего предка (TMRCA) узлов. Недавно были описаны пять деревьев на основе NGS (Консорциум проекта 1000 Genomes и др. 2010; Francalacci и др. 2013; Poznik и др. 2013; Вэй, Аюб, Чен и др. 2013; Скоццари и др. 2014). (таблица 1), дающая представление о событиях в эволюции человека и взаимоотношениях популяций с точки зрения патрилинейности. Тем не менее, эти деревья сильно различаются по размеру выборки (от 36 до 1208 Y-хромосом), количеству популяционных выборок (от 1 до 9) и представленности известных линий. Методологии секвенирования также были неоднородными, с последующим изменением количества секвенированной ДНК (от 1,5 до ≈ 10 Мб) и среднего охвата (от 2 × до 50 ×). В подходах с низким охватом использовались методы вменения для определения аллельных состояний отсутствующих генотипов на основе самой филогении, а синглтоны (варианты, присутствующие только один раз в наборе данных), которые определяют длины терминальных ветвей, были плохо установлены, с последующей вероятной недооценкой длин ветвей (Francalacci et al. 2013).

До сих пор ни в одном исследовании не было объединено секвенирование с высоким охватом мультимегабазных сегментов MSY в широком диапазоне образцов, охватывающих большинство известных кладов филогении. Здесь мы добиваемся этого, объединяя филогению 334 Y-хромосом (представлено Batini et al.) на основе 17 популяций Европы и Ближнего Востока, которые мы используем в других местах в качестве инструмента для изучения демографической истории европейских популяций, с дополнительными 114 последовательностями MSY, которые вместе гарантируют, что основные клады и глубокие- Представлены корневые узлы.

далее читать здесь: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4327154/

генетика

Previous post Next post
Up