Всё о генетическом тестирование: генеалогия (Часть 1)

Oct 24, 2019 09:34

В России наконец-то подешевели днк тесты (в Генотеке 10к теперь стоит) и я решил тоже разворошить свой код и своё прошлое :)) Да-да, я знаю, тут очень много спекуляций, но меня интересовал один конкретный генеалогический вопрос - происхождение по прямой материнской линии. И ответ меня полностью удовлетворил. К тому же, за такие деньги это просто рай для таких любопытных субъектов, как я. В самом деле, ты заглядываешь в свой собственный «исходный код», как тут без трепета и мурашек?

Цель генетического теста может быть либо генеалогическая (узнать происхождение своего рода, найти родственников), либо медицинская (узнать что-то про себя, про риски или бенефиты своего организма, про предрасположенности к чему-то и т.д.). Сегодня генеалогия, а в следующем посте - медицина.

Что позволяет днк-генеалогия? Например, она позволяет оценить из какого региона происходили твои предки по прямой мужской линии (ты, твой отец, дед по отцу и т. д.) за промежуток в 138 000...150 лет назад (!!!). Круто, да? Правда, 150 лет, это всё же если повезет и вы попали в хорошо проработанную популярную ветку, чаще утыкаются в 500 лет назад. Например, вот филогенетическое дерево самой популярной в России гаплогруппы R1a. Сдав анализ, можно определить в какой именно ветке ваши предки и, соответственно, чем примерно занимались и где жили. Интересно же? А ещё можно найти своих дальних родственников, тех, с кем у вас общий предок.




Но что такое гаплогруппа и откуда берется вся инфа?

Всё просто, наш геном состоит из 23 пар хромосом (22 аутосомы и две половых: XX у девочек, XY у мальчиков), находящихся в ядре, а также митохондриальной ДНК (мтДНК). Как мы помним, Y-хромосома достаётся только от отца к сыну, бывает только у мальчиков. И по мутациям именно в этой хромосоме можно и проследить происхождение по прямой мужской линии вплоть до самого общего предка. Грубо говоря, собирали ДНК древних умерших людей, помечая где был найден скелет и чем примерно занимались. Потом строили базу (филогенетическое дерево, как выше) для всего человечества. И строят до сих пор и будут строить. Это только начало. Но уже сейчас ты можешь сдать свою Y-хромосому на тест и по совпадениям в мутациях с другими принудительно сдавшими определить своё место в этом дереве, узнать о своих предках то, что о о них узнали генеалоги. Со временем информация пополняется.

Тоже самое и по материнской линии. Дело в том, что мтДНК достаётся хоть и всем детям (и сыновьям, и дочерям), но только от матери. Поэтому и можно определить происхождение по прямой женской линии (ты, твоя мать, бабушка по матери и т. д.).


Так определили общих предков человечества: Y-хромосомного Адама и митохондриальную Еву. Жили они в разное время (почему так -написано в вики): Адам примерно 138к лет назад, а Ева 180к лет назад, но это не точно :). От Y-хромосомного Адама отходит несколько мутационных кластеров (18, кажется) - их называют гаплогруппами. R - одна из них, а R1a - это подгруппа гаплогруппы R. R1a, в свою очередь, разделяется ещё на несколько субкладов (подгрупп) и так до конечного звена (до тебя и твоих братьев по субкладу).

Вот вершина филогенетического митохондриального дерева, основные мт-гаплогруппы. MRCA - митохондриальная Ева, общая прародительница для всех ныне живущих.



Соответственно, мужчины сдавая генетический тест, могут определить происхождение как по материнской прямой линии, так и по отцовской. Девушки же только по материнской (т.к. Y-хромосомы, увы, у них нет). Вот оно, неравенство. А ещё стоит добавить, что Y-гаплогруппы куда лучше проработаны (в том числе по тому, что мутации в мито-днк более медленные), и неравенство усиливается :)

Да, ещё это позволяет найти родственников, например, если у вас одинаковый конечный y-субклад - то у вас общий предок как минимум в 10-м поколении. Для подтверждение более близкого родства существует анализ аутосомной (дословно «неполовой») ДНК.

Более подробно тут и тут. А вот тут очень много информации для интересующихся (разбор конкретных случаев, история разных народов и т.д.).

Это же круто?

По-моему, да. Так как объединяет не только людей одной эпохи (ведь у всех у нас общий предок и много уже перемешанных, например, что у нас, что у украинцев, что у поляков абсолютно одинаковый набор гаплогрупп), но и поколения. В России вообще всегда было не до генеалогии, то одно потрясение, то другое, не до составления фамильных деревьев было, а в Европе и США это очень популярное хобби. Анализ ДНК позволяет восстанавливать свою личную историю и общими усилиями построить родословную всего человечества.

А как в школах изменятся уроки истории? Можно сдать тест и изучать историю на примере своего рода, слушать про историю своего друга-однокашки. При этом не будет никаких стран и наций, а будет совершенно другой подход и образ мыслей. Мне кажется, это сильно поменяет человечество.

В смысле безопасности уже меняет. Полиция загружает в базу ДНК преступников и находит их родственников, а потом уже обычное детективное расследование через эту зацепку. Если 2% населения сдают своё ДНК, то почти 99% находят своего родственника не дальше троюродного брата\сестры.

Есть и обратная сторона, это генетическая дискриминация, генетический нацизм. Типа я такой-то гаплогруппы, а ты такой-то, ты чужой :)) Но тут уже все зависит от человека, что он больше выберет - объединяться или делиться на свой\чужой, уже имеем опыт неверного выбора. Нацизм, это, конечно, от эгоизма.

Где сдавать и что? Сколько стоит?

По генеалогии самая крутая контора - это FamilyTreeDNA (в США, но работает с Россией), у них есть три теста:

1) Family Finder (79$) - тест только аутосомной ДНК, позволяет оценить из какого региона (этноса) происходили твои предки по всем линия за последние 200 лет и найти близких и дальних родственников по всем линиям. Анализирует SNP-ы (в след. посте про них).

2) Y-DNA (от 169$) - тест Y-хромосомы, позволяет оценить из какого региона (этноса) происходили твои предки по мужской линии за промежуток в 138 000...150 лет назад и кто твои прямые родственники по мужской линии. Анализирует STR-ы (тандемные повторы). Там есть Y-37,Y-67,Y-111,Y-7000. Число - это количество анализируемых тандемных повторов, условно, количество анализируемого материала. Чем больше STR-ов, тем дороже, но и тем более глубокое, близкое к сегодняшнему дню определение происхождения. Рекомендуют брать Y-67 (268$), и если что доуточнять снипами или Y-111.

3) mtDNA (от 89$) - тест мт-ДНК, позволяет оценить из какого региона (этноса) происходили твои предки по женской линии за промежуток в 180 000...500 лет назад и кто твои прямые родственники по женской линии. Рекомендуют сразу брать MtFullSequence (199$), чтобы не вставать дважды.

На самом деле, все эти тесты для реальных гиков. Есть и другая альтернатива - американский 23andme (99$) или российский Генотек (165$). Дело в том, что в одном днк-тесте они анализируют и аутосомный кластер и часть Y-хромосомы и митохондриальной ДНК (см. таблицу ниже), поэтому на выходе дают не только диаграмму происхождения (этот пирог, а ля на 5% итальянец, на 40% неандерталец) и поиск родственников, но и данные по гаплогруппам, + медицинская информация, которой у FTDNA сильно меньше. Т.е. это как все три теста от FTDNA, только за 100-150$.

Да, по Y-хромосоме происхождение можно узнать в итоге в промежутке 138 000...7 500 лет назад, по МТ - 80 000...10 000 лет назад. Тут глубина не такая, как у Y-DNA и mtDNA тестов от FTDNA. Но возможно дальше углубляться и не потребуется. Например, у меня по женской линии, даже если бы я сдал (MtFullSequence), я бы не получил ничего нового (только поиск по прямым родственникам), так как филогенетическое дерево не проработано. А по мужской линии у меня хоть и было проработанное дерево, мне вполне хватило данных до 7500 лет назад, дальше я проанализировал совпаденцев в FTDNA, их гаплогруппу и смог сделать сильное предсказание вплоть до 2000 лет назад. А вот пример интерпретации гаплогруппы и анализа гаплотипа (что такое гаплотип, читаем тут).

В таблице ниже, сравнение по количеству исследуемых участков ДНК в разных компаниях. [1,2]

23andMe
FamilytreeDNA Family Finder
Ancestry DNA test
Генотек
MyHeritage

Number of autosomal SNPs tested
630,132
612,272
637,639
610,874
702,442

Number of Y chromosome SNPS
3733
0
1691
4209
482

Number of X chromosome SNPS
16,530
16,271
28,892
27,556
17,889

Number of mitochondrial DNA SNPS
4318
194
195
1016
0

Как видно, только Генотек и 23andMe могут дать данные и медицинские, и генеалогию по всем трём направлениям (хоть и не такую глубокую).

Почему я выбрал Генотек? Как мне? И какие подводные камни?

Да в Генотек чуть меньше исследуемых участков (на практике я этого не почувствовал), но 23andMe не работает напрямую с Россией, там полный геморой c доставкой: надо заказывать на подставные адреса и т.д. Да и с доставка как минимум будет уже 120$, что на 45$ дешевле Генотека. Но эти 45$ стоят той скорости и сервиса, которые есть у Генотек. Курьер на следующий день после оплаты приехал, вручил пробирку, на следующий день забрал - всё очень быстро. Заявленные сроки анализа 1,5-2 месяца, но выполняют гораздо быстрее. А честно скажу, и хотелось быстрее, любопытство разбирало :)) Плюс, конечно же, поддержка отечественной компаний, и не только рублём, но и данным. Ведь в Европе и США очень большие уже базы людей, что толку туда добавляться, если там мало из России и СНГ, необходимо развивать локальную базу, генетические тесты будут становиться все популярнее и популярнее.

Днк-чипы в Генотек такие же, как в 23andme, последнего поколения (Illumina GSA v.2). Можете выбрать любой ДНК-тест (демо), например, генеалогию - это позволит добавиться в базу, остальную медицинскую информацию из других тестов можно будет узнать и на бесплатных ресурсах. В общем, неважно какой тест за 10к вы закажете, расшифруют они все равно весь необходимые генетический материал (все 600к участков), а потом предоставят вам исходник в формате vcf. Ещё 1к нужно будет заплатить за конвертацию данных в формат 23andMe\FTDNA\Ancestry. Это, на самом деле, скрытая стоимость теста (поэтому я и указал 175$, а не 150$), и, конечно, очень раздражает, что надо платить за каждый из форматов отдельно по косарю, а не единовременно за все форматы. Я конвертировал в 23andMeV5 и только для одного сайта понадобилось конвертировать ещё и в Ancestry (но сайт фуфло оказался, так что фактически 23andMeV5 хватило).

Да, GENOTEK5 - промокод, даёт 5% скидку.

Если сдал тест, где читать про свою гаплогруппу?

В Генотеке дают не так много информации, самое ценное - это, конечно, название этих гаплогрупп, а потом можно будет идти по ссылкам ниже.

Y-гаплогруппы: предиктор субклада, основные евразийские рода, форум, проекты, дерево, описания, энциклопедия [2]
Mt-гаплогруппы: предиктор субкалада, основные евразийские рода, форум, проекты, дерево [2], описания, энциклопедия [2]

Во-первых, можно закачать свои данные (в формате 23andMeV5, например) в предиктор, и возможно определить субклад глубже, нежели это сделал Генотек\23andMe. У меня так было. Во-вторых, почитать общую информацию про свою гаплогруппу по ссылкам «основные евразийские роды», зайти на википедию, почитать там, походить по ссылкам на энциклопедии и описания (ссылки выше). В-третьих, зайти на русский форум (ссылка выше) или присоединиться к проектам FTDNA и почитать темы внутри своей гаплогруппы, там обычно делятся интересным. И, конечно, ещё я дал ссылки на полные филогенетические деревья всего рода человеческого, где можно будет найти и себя :)

Генотек, кстати, здорово рисуют маршрут гаплогруппы, вот мой.



Куда ещё можно загрузить свои данные бесплатно?

Конечно, во все крупные базы для генеалогии: FTDNA, MyHeritage, Geni.com, Gedmatch.com ( как пользоваться, ещё) [мануал по всем этим сайтам]

FTDNA (FamilyTreeDNA) имеет самую большую базу, добавляет очень быстро, там больше всего качественных совпаденцев, можно смотреть гаплогруппы, фильтровать по ним. Класс!
MyHeritage - тоже обладает большой базой, добавляет дольше всех, там у меня было низкое качество совпаденцев, но есть хороший функционал.
Geni.com - база таже, что у FTDNA, но свой алгоритм ранжирования, хороший ресурс.
Gedmatch.com - гиковский ресурс, до которого мало кто добирается. Там не такая большая база, но есть интересные калькуляторы происхождения\национального состава, есть калькулятор на еврейство и т.д. См. мануал и ссылки, там написано как пользоваться сайтом. В более приятном интерфейсе эти калькуляторы оформлены на yourDNAportal, но тыкать по ним не так интересно :))

Хороший калькулятор происхождения ещё у DNA.Land, мне показался наиболее понятным. Там есть ещё отчёт по чертам личности\внешности на основе ДНК (в следующем посте про это), но по большей части спекулятивный.

Что даёт поиск родственников и как определять родство?

На самом деле, он позволяет смотреть откуда ваши ближайшие дальние родственники, где они живут, куда их забросило, можно связаться с кем-то по желанию. Такая популярность генетических тестов на генеалогию говорит лишь о том, что в развитом мире людям одиноко, они хотят дружить и искать «своих». Ещё можно посмотреть какие у них гаплогруппы, и если они делали глубокий анализ своей гаплогруппы - сэкономить на тесте, просто ориентироваться на них.

Что касается степени родства, оно определяет по проценту общей ДНК в Сантиморганах. 100-300 cM - такой совпаденец стоит того, чтобы с ним связаться. У меня в FTDNA максимальный был 97 cM. Знающие люди говорят, что 30 cM вычитаются, как возможная этническая похожесть (из одного этноса), а родственная связь вычисляется по схемам ниже после вычитания. Не знаю, вычитают ли сайты автоматически, но они проставляют степень родства автоматически.







Почему так отличаются данные в разных калькуляторах происхождения?

Смысл в том, что компании просто аккумулируют ДНК современных людей с какой-то территории и сравнивают с вашей, если есть похожесть с некой обобщенной днк какой-то местности, то делается вывод, что скорей всего у вас корни с этой территории. Базы у всех разные, европейские очень глубокие по Европе, российские по России и т.д. И, конечно, тут есть эффект как с машинным обучением, если компьютер обучался только на грузовых тачках, то вашу новенькую шикарную шевроле камаро он может определить как убитый камаз)))

Поэтому повторюсь, основная ценность в ДНК тесте - это определение гаплогруппы. По этому пирогу (5% еврей, 5% итальянец...) ничего нового вы не увидите, а эти 5% по факту ничего не значат. Следующий пост про медицину.

P.S. И да, через 3000 лет уже кто-то из нас может стать общим предком для какого-то большого субклада :)

dna, лонгрид

Previous post Next post
Up