Личный опыт этнопопуляционного ДНК-тестирования: andvari5

andvari5

Личный опыт этнопопуляционного ДНК-тестирования

May 26, 2022 20:00

В этом посте не будет чего-то интересного по археологии, истории или палеогенетике. Просто хочу сохранить кое-какие свои материалы, личный опыт ДНК-тестирования и использования этнокалькуляторов.

Генетика меня заинтересовала давно, лет двенадцать назад, когда мне было еще лет двадцать. Интерес этот возник на общей волне тяги к истории, антропологии и этнографии. Правда в те времена популяционная генетика ограничивалась, в основном, исследованием гаплогрупп. Однако я избежал того периода, когда мало знаешь о предмете и очень легко повестись на какие-нибудь сомнительные теории. Короче, какой-нибудь клёсовщиной я не увлекался и довольно быстро нашёл ресурсы, где общались профессиональные генетики и очень увлечённые любители. С той поры генетика шагнула далеко вперёд, особенно палеогенетика, исследование древних образцов. Очень "урожайным" был 2015 год, когда началось массовое тестирование древних образцов. Всё это, естественно, подстёгивало мой интерес. Ещё довольно интересны были результаты частных тестирований. Бывало, что люди обнаруживали вполне заурядные результаты, типичные для их группы, а бывало, что находилось что-то необычное. Например, люди обнаруживали какой-нибудь необычный след, что говорило о непростой родословной, зачастую весьма интересной.

Четыре-пять лет назад я сделал себе ДНК-тест. Точнее, два теста - один для определения Y-гаплогруппы, второй - исследование аутсомной ДНК. Последний, как мне кажется, оказался мне более полезен, потому что дал возможность напрямую сравнить себя как с древними, так и с современными людьми. Интересно было что-то узнать о каких-то более далеких временах, от которых не осталось архивов. Спроецировать себя на генетико-историческую карту. Хотя интересно было и насколько я типичен для моей местности. Сегодня хотел бы сохранить здесь кое-какие итоги, чтобы не лазить бесконечно по документам, папкам и диалогам. В основном, это будут итоги по аутосомному тесту и сравнению с современными группами. Обычно такие штуки называют этнопопуляционными тестами. Но стоит оговориться, что такие тесты подразумевают близость к той или иной популяции

Чем интересен аутосомный тест? Попробую объяснить как-нибудь попроще. Допустим, сравнив с гаплогруппой. Такие однородительские маркеры, как гаплогруппы Y-хромосомы и митохондриальной ДНК передаются по прямой линии. Например, от отца к сыну. Т.е. выстраивается цепочка сын-отец-дед-прадед-прапрадед и так далее. Причем доходить эти цепочки могут до палеолита, когда появляются основные современные гаплогруппы. Вероятно, вы заметили, что остальные ваши предки при этом остаются в тени. А ведь они с каждым поколением растут в прогрессии. На уровне родителей их два, на уровне бабушек и дедушек уже четыре, на уровне прадедов - восемь. Но гаплогруппа даёт информацию (довольно небольшую) только об одном предке в поколение.

Аутосомный тест работает иначе. Он имеет небольшую глубину- поколений восемь, но учитывает всех предков. Представьте, ваш геном состоит на примерно 50% из папиного генома, на 50% из маминого. Папин геном состоит из примерно по 50% геномов бабушки и дедушки. Мамин тоже. И так далее. Один отдельный человек уже сам по себе несёт массу информации о своих предках и о своей популяции. Правда, со временем, доля все более дальнего предка неизбежно падает, поэтому в вас может и вовсе ничего не быть от предка, который жил тысячу лет назад. Наглядно это можно посмотреть на картинке из книжки Дэвида Райха.

Что мне было известно до того, как я сделал тест? Был кое-какой опыт работы с архивом, благодаря чему удалось углубиться в родословную до 1860-х, но неравномерно с материнской и отцовской сторон. Насколько известно, все документально засветившиеся в моем поле зрения предки были русскими. По отцовской линии - однодворцы, по материнской - крепостные, получившие волю и ставшие государственными крестьянами задолго до реформы, в начале 19 века. Все они происходили из сёл Воронежской области.

Когда я сделал тест, то получил сырые результаты. Каждая компания исходит из собственной базы и своих математических методов, зачастую выделяя какие-то свои компоненты. Пожалуй, новичка это может привести в уныние. Обнаружив вдруг у себя какой-нибудь 1% Южной Америки мало кто задумается, что это информационный шум и начнёт искать варианты, как его далёкий предок попал с Анд в Архангельск. К тому же, названия компонентов вообще зачастую неудачны, основаны на современных странах или народах. Вот, например, как выглядел раздел My Origins (Мое происхождение) в личном кабинете компании FTDNA, где я делал тест.

Казалось бы, стоит искать откуда взялись эти 9% скандинавов или 22% балтов? Или искать каких-нибудь поляков в родословной? Нет, конечно.

Я к моменту теста уже не был новичком и знал, что самое главное заключается в заветном файлике с информацией о своем геноме, который можно скачать и прогнать через специальные этнокалькуляторы (бесплатные) с загруженными академическими выборками. Таких калькуляторов много и они часто заточены на каких-то определенных регионах, дают больше информации. Как правило, они показывают вашу дистанцию до тех или иных групп. Кто ближе, а кто дальше. Либо разделяют ваш геном на несколько компонентов. По соотношению этих компонентов можно сравнить его с теми или иными группами или потенциально вычленить те или иные влияния.

Такие калькуляторы очень полезны, но не все из них удобны. Вот, например, стандартный калькулятор К-13 с гедматча показал такую картину.

Хороших территориальных выборок по русским тут нет, вот меня и размазало между украинцами из Белгородской области и юго-западными русскими. Последние - тот ещё конструкт. Видимо, туда объединили весь юг и запад России, кроме Смоленска. Но эти группы не одинаковы.

Лучше всего те калькуляторы, которые содержат как можно большее количество групп интересуемой территории. Наиболее полезен оказался G25. Он довольно популярен, и его часто используют для анализа древних образцов. Я его тоже часто использовал, например, в постах про генетику викингов или с равнивая современные популяции Восточной Европы. Или когда вычленял предковые компоненты у европейцев. Очень удобная и полезная штука, доступная каждому. Наверное, лучшее, что может использовать непрофессионал.

Этот калькулятор также полезен тем, что содержит довольно большое количество региональных русских выборок. И вот, что у меня в итоге вышло, когда я забил свои данные.

Чем меньше цифра и выше сама группа, тем она ко мне ближе. Значения меньше 0,025 показывают значимую близость. Я буду очень похож на представителей таких групп. Судя по значениям, я нахожусь где-то между рязанцами, тверичами, курянами, орловчанами и украинцами из Днепра. Примерно вот так.

Меня сначала удивило - почему же я не ближе всего к воронежской выборке? Ведь стоило бы ожидать обратного. Но уточнив информацию по ней, я понял в чем дело. Материал для нее собирался в экспедиции Балановских в селе Репьевка Воронежской области. Село это заселялось изначально украинцами, теперь уже обрусевшими. Я потом смотрел индивидуальные данные этой выборки, там у людей реально по дистанциям вылазят украинские группы. У меня же все известные мне предки происходили из сел, связанных с русской колонизацией, поэтому и результат у меня что-то между южными и центральными русскими.

В общем, таком был итог моей самостоятельной работы по исследованию своего генома и сравнению его с современными популяциями.

Где-то с полгода назад ещё польстился скидкой и акцией на интерпретацию генома от российской компании Генотек. Там действительно какая-то совершенно смешная цена была, меньше ста рублей. Залил файлик и получил результат, что на 100% ко мне близки русские и украинцы. Там ещё был занятный график, но какого-то серьезного уточнения это лично мне не дало.

Пожалуй, полезным было узнать, что унаследовал 1251 мутацию от неандертальцев, это немного больше, чем у остальных протестировавшихся в Генотеке. Среднее значение 1225.

В общем, примерно я понимал, какое место занимаю на генетической карте современных групп. Я иногда захожу на форум Молген (молекулярная генеалогия), где собираются русскоязычные любители и профессионалы генетики, обсуждают древние и современные образцы, тестирования. Оттуда узнал о российской ExpertDNA, о которой были весьма восторженные отзывы. Компания эта не делает тесты, но занимается их интерпретацией. И судя по отзывам, делает это весьма недурно. Цена невелика - полторы тысячи деревянных. Еще подкупило, что там в команде некоторые знакомые по Молгену люди, например, Сергей Козлов, написавший на генофонд.рф статью о средневековом владимирце и некоторые другие. Эти люди занимаются интерпретацией аутосомных тестов с 2012 года. Тем более, база у них существенная, судя по отчётам, набранная и из академических образцов, и из частных тестирований.

И вот чего-то захотелось мне сравнить результаты своих наработок с профессиональной интерпретацией. Деньги небольшие. Особых неожиданностей не ждал. Больше хотелось сравнить то, что наработал сам с тем, что скажут профессионалы. Узнать, не ошибся ли я? Отчёт получил довольно быстро. И вот, что получилось:

"Положение исследованного генома показано красным ромбом. Его окружают два чёрных овала; ими выделена зона, где в случае несмешанного происхождения с наибольшей вероятностью находится его предковая группа.

С вероятностью 50% она должна оказаться внутри меньшего овала, а с вероятностью 40% - в пространстве между меньшим и большим овалами. В сумме выходит 90% вероятности, а оставшиеся 10% приходятся на случаи чуть более заметных отклонений от среднего результата.
Такая неопределённость вызвана тем, что люди отличаются между собой по ДНК, и даже представители одной группы на схеме не оказываются строго в одной точке, а формируют небольшое "облачко" вокруг самого типичного положения.
Положение близких к исследованному геному групп показано на схеме числами. Если какие-то группы располагаются на ней так близко друг к другу, что их значки могут пересекаться, они показываются одним общим значком и перечисляются в расшифровке к нему:

С вероятностью в 50% мои предки происходили из этих групп:

1) русские: Московская обл, окрестности Мурома, Рязанская обл, Саратовская обл, Тульская обл, Ульяновская обл.

С вероятностью в 40% из этих:
2) русские: Дон, Тамбовская обл.
3) русские: Воронежская обл, Кубань, Липецкая обл, Орловская обл; украинцы: Слобожанщина (Белгород, Сумы, Харьков).
4) русские: рязанская мещёра, Тверская обл.

С вероятностью в 10% из этих:

5) белорусы: юго-восток Беларуси; русские: Белгородская обл, Брянская обл, Курская обл, Смоленская обл.
6) украинцы: Винницкая обл, Волынь, Галиция, Житомирская обл, Полтавская обл, юг Украины.
7) белорусы: полещуки, юго-запад Беларуси; поляки: Польша; украинцы: Черниговская обл.
8 ) русские: Ивановская обл, Татарстан - Арский р-н, Ярославская обл.
9) мокша; эрзя.
10) белорусы: северо-восток Беларуси.
11) русские: Новгородская обл.
12) русские: район рек Ветлуга и Унжа.

Вот полная карта, если кому интересно.

Для выявления народностей, схожих с образцом ДНК, можно применить еще один подход, разместив геном в реальном пространстве географии. Этот метод отличается более сложным алгоритмом: если при размещении маркера в пространстве генофондов мы учитывали сходство в двух главных измерениях (условные «восток-запад» и «север-юг»), то на картах показывается сходство и различие, вычисленное по большому числу параметров. Группы, оказавшиеся достаточно близко друг к другу на предыдущей схеме, на карте могут отдалиться, что укажет на более тонкие различия в их ДНК.
Области расселения народов показаны по их состоянию несколько столетий назад, до массовых миграций XX века.
Группы из базы данных, имеющие высокое или среднее сходство с исследованным геномом:

Очень высокое - русские: Белгородская обл, Брянская обл, Воронежская обл, Дон, Кубань, Курская обл, Липецкая обл, окрестности Мурома, Орловская обл, Рязанская обл, Саратовская обл, Тамбовская обл, Тульская обл, Ульяновская обл; украинцы: Полтавская обл, Слобожанщина (Белгород, Сумы, Харьков).

Высокое - белорусы: полещуки, юго-запад Беларуси, юго-восток Беларуси; поляки: Польша; русские: Ивановская обл, Московская обл, рязанская мещёра, Татарстан - Арский р-н, Тверская обл, Ярославская обл; украинцы: Винницкая обл, Волынь, Галиция, Житомирская обл, Черниговская обл, юг Украины.

Среднее - белорусы: северо-восток Беларуси; мокша; немцы: восток Германии; русские: Вологодская обл, восток Ленинградской обл, Вятка, Новгородская обл, Псковская обл, район рек Ветлуга и Унжа, Смоленская обл, старожилы Западной Сибири, старожилы Урала (без старожилов Пермского края), тобольские старообрядцы, юго-восток Архангельской обл, юго-запад Архангельской обл; словаки; украинцы: карпатские русины; чехи.

Среднее, переходное к умеренному - литовцы; русские: низовья Северной Двины, старожилы Прибайкалья; финны: юго-запад Финляндии; эрзя; эстонцы: основная выборка, юго-восток Эстонии.

Чем краснее, тем ближе ко мне.

Базовые предковые компоненты ДНК
Генофонды современных народов формировались длительное время в процессе миграций и смешений. В современной Евразии почти не найти людей, которые будут идеально похожи по своей ДНК на какое-нибудь из племён каменного века. Однако существуют алгоритмы, позволяющие вычислить древние предковые источники ДНК для любого современного генома. Хотя математическая модель содержит долю условности, сравнение с настоящими древними геномами подтверждает её работоспособность. Определив базовые компоненты, можно выявить более общие и масштабные источники формирования генофондов, чем при сравнении с современными популяциями. В нашем отчёте для этого используется алгоритм Admixture (D.H. Alexander, J. Novembre, and K. Lange. Fast model-based estimation of ancestry in unrelated individuals). Показательна модель, где геном раскладывается на девять компонентов: семь из них наиболее характерны для народов Евразии, один для американских индейцев, и один - для африканцев.

Для исследованного генома получены следующие результаты:

Наиболее значимые предковые компоненты:

Европейский: 63,5%. Этот компонент восходит к племенам охотников-собирателей, населявших Европу в конце каменного века. За прошедшие с той эпохи тысячелетия произошло несколько масштабных миграций в Европу носителей средиземноморского, кавказского или западносибирского компонентов, а также множество менее крупных событий, менявших генетический ландшафт. Однако в части регионов древнеевропейскому генофонду удалось более-менее сохраниться, в части - отвоевать свои позиции позже, и в наши дни он преобладает в ДНК многих европейских народов. Некоторая доля компонента обычно обнаруживается и в популяциях соседних с Европой регионов.

Дополнительные компоненты - менее значимые, но тоже оказавшие заметное влияние:

Средиземноморский: 16,7%. Когда-то, ещё в каменном веке, древние жители Ближнего Востока произвели революцию, первыми в мире перейдя от охоты и собирательства к выращиванию растений и разведению домашнего скота. Это позволило их потомкам вырасти в численности и начать распространяться в соседние регионы. Отправившись на запад, земледельцы заселили южную и западную Европу, вытесняя местных охотников-собирателей, а частично и смешиваясь с ними. Позднее произошёл ряд миграций, способствовавших взаимному перемешиванию носителей европейского и средиземноморского компонентов. Одним из примеров может служить распространение славянских племён в первом тысячелетии нашей эры. У современных славян доля средиземноморского компонента выше, чем в балтийских и финно-угорских популяциях, хотя и составляет явное меньшинство. Среди восточноевропейцев особенно много средиземноморского компонента у евреев-ашкенази, как у потомков выходцев с Ближнего Востока. Очень широко он распространён и на Кавказе.

Кавказско-пакистанский: 12,1%. Это родственный средиземноморскому компонент, восходящий к более восточным и северным группам близкого по ДНК древнего населения. Двинувшись на восток, часть из них проникла в Среднюю Азию и Индию. Другие перевалили Кавказский хребет и вышли в степь. Там они смешались с местным населением, носителями европейского компонента. С наступлением бронзового века потомки таких метисных групп из степи начали взрывное распространение в разные стороны. Предполагается, что именно с этим процессом связана экспансия индоевропейских языков. Придя в лесную зону Европы, они принесли с собой в том числе и "кавказский" компонент. Хотя у современных восточноевропейцев его доля в несколько раз ниже, что говорит о минорности вклада степняков бронзового века в их ДНК.

Минорные компоненты, доля которых совсем невелика. Могут являться просто "информационным шумом", особенно, если значение составляет менее 1%:

Американских индейцев: 1,6%. Кроме коренных американцев, этого компонента довольно много у народов Чукотки и Камчатки. Дело в том, что предки индейцев около четырнадцати-пятнадцати тысяч лет назад пришли в Америку из Евразии через перешеек, существовавший тогда на месте нынешнего Берингова пролива. Этот народ сформировался при смешении выходцев из юго-восточной Азии и близкого европейцам древнего населения Сибири. Через ДНК "древних сибиряков" компонент американских индейцев находится в отдалённом родстве с европейским и западносибирским, поэтому в небольшом количестве может проявляться у европейцев.

Восточносибирский: 1,6%. На протяжении многих тысячелетий в Сибирь происходил приток нового населения с юга, из восточной Азии. Эти люди смешивались с древним населением Сибири каменного века, постепенно замещая его. В её восточной части замещение произошло почти полностью, в западной же сформировалась новая, смешанная популяция - носители западносибирского компонента. С миграциями древних уральцев восточносибирский компонент распространился в качестве дополнительного по европейскому северу и в Поволжье, а с миграциями тюрков - вдоль степной полосы.

Западносибирский: 1,5%. В основном, этот компонент сформировался при смешении пришельцев восточноазиатского происхождения с древним населением Сибири, которое было близким по своей ДНК к европейским охотникам-собирателям. В Европе этого компонента особенно много у выходцев из финно-угорских народов. В небольшом же количестве, до 3-4 процентов, у европейцев он обычно не связан с финно-угорским происхождением, лишь маркируя отдалённую родственность давнишних предков с "древними сибиряками".

Индийский: 1,4%. Компонент населения Индии. Частично родственен кавказско-пакистанскому, и за счёт этого может проявляться у восточноевропейцев в количестве до 2-3%, а на Кавказе и в Средней Азии даже больше. На таком уровне может считаться "информационным шумом". В более значительном количестве он обнаруживается у цыган, как след их индийского происхождения.

Юго-восточной Азии: 1,2%. В основном преобладает у народов, традиционно выращивающих рис. Переход к сельскому хозяйству позволил им распространиться довольно далеко на север от древних мест проживания, достигнув Кореи и Японии. Часть носителей компонента двинулась из Китая на северо-запад, внеся свой вклад в генофонды жителей великой степи и сибирской тайги. В Европе компонент чаще всего связан своим происхождением с представителями тюркских народов, кочевавшими вдоль соединяющей восток и запад полосы степей Евразии. Также может в небольшом количестве сопутствовать восточносибирскому и западносибирскому, частично подменяя их.

Африканский: 0,4%. Компонент коренного населения Африки южнее Сахары. Не характерен для жителей севера Евразии и при значениях до 1-2% может считаться "информационным шумом".
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

В общем, вот такие выводы. Что я могу сказать по итогу? Пожалуй, вопрос с современными группами можно закрыть. Теперь мне понятно своё положение. Я рад, что смог уточнить его благодаря последнему отчету. Наиболее полезна оказалась первая карта, из которой понятно, что я нахожусь между этими четырьмя группами с большим тяготением к первой. Вероятно, она может отражать гипотетическое происхождение моих предков, когда-то переселившихся в Воронежскую область при её колонизации.

1) русские: Московская обл, окрестности Мурома, Рязанская обл, Саратовская обл, Тульская обл, Ульяновская обл.
2) русские: Дон, Тамбовская обл.
3) русские: Воронежская обл, Кубань, Липецкая обл, Орловская обл; украинцы: Слобожанщина (Белгород, Сумы, Харьков)
4) русские: рязанская мещёра, Тверская обл.
Большего я вряд ли получу, разве, что какие-то не сильно влияющие на общую картину уточнения. Или если начнется массовое тестирование по всей России, что маловероятно. Но тут больше будут уже реальные совпаденцы-индивиды, а не совпадения с группами. Так, что если вы счастливый обладатель результаты аутосомного теста, имеет смысл заказать отчет на ExpertDNA.

Теперь в личном геноме у меня остался интерес только к палеогенетике, т.е. понимание, как сформировался мой геном в историческом масштабе. Общее понимание этого есть, остается уточнить лишь детали. Еще занятно, что сейчас можно найти близкие древние генетические образцы. Например, на том же G25. Вот, как это выглядит для меня.

Образцы с цифрой менее 0.025 можно считать очень близкими. Но таких у меня нет. Самый близкий мне на данный момент - образец латенского времени из Венгрии. Он аутлаер , т.е. непохожий на другие образцы из той выборки, нетипичный. Похоже какой-то человек из Восточной Европы. То же касается и второго образца - из Чехии поздней бронзы. На третьем месте - средневековый человек из Сунгиря, древний владимирец древнерусского времени. Остальные, в основном, славяноподобные образцы из работы по викингам.
Тут только ждать, пока появятся близкие мне образцы по нужным мне территориям. Поэтому и я жду с нетерпением работу про древние образцы с Суздальщины.
Из генетики остается еще гаплогруппа. Но тут мне больше понятно. У меня вполне обычная R1a, с типичным балтославянским субкладом CTS1211. Его общая история мне более или менее понятна. Тут опять же - только ждать древние образцы в массовом количестве. Возможно, тогде и будет стимул копнуть какие-то более глубокие снипы.

Воронеж, генетика