Недавно мы с коллегой Александром Тышковским опубликовали критику гипотезы Росанны Сегрето и Юрия Дейгина о лабораторном происхождении коронавируса SARS-CoV-2. Критика прошла рецензирование в научном журнале Bioessays [1]. Доступно и ее популярное изложение [2]. Сначала Сегрето грозилась в Твиттере, что добьется ретракции нашей критики (что?), потом говорила о том, что ответ направлен в Bioessays, но в итоге ответ появился лишь на нерецензируемом сайте препринтов [3] о чем Юрий написал в своем Facebook комментарий: «в пух и прах». Как говорится, сам себя не похвалишь...
Тем не менее, мы решили, что стоит ответить на своеобразную критику критики.
Пункт первый
В нашей критике мы пояснили, почему SARS-CoV-2 не мог быть «создан» из коронавирусов RaTG13 летучих мышей и коронавируса панголина MP789. Возражение авторов на наши выкладки было в том, что их гипотеза предполагает создание SARS-CoV-2 не из RaTG13 и MP789, а из неких RaTG13-подобного и MP790-подобного вирусов.
Проблема в том, что авторы нигде не упомянули и не определили, что такое «подобный» вирус. Упоминались некие RaTG13-like и MP789-like вирусы без уточнения, насколько близкими генетическими должны быть эти «like» [4]. В конце концов, сам SARS-CoV-2 можно расценивать как «RaTG13-like» (они похожи на 96%), и в этом случае гипотеза сводится к тривиальной: SARS-CoV-2 создали из SARS-CoV-2.
В связи с этим мы рассмотрели разные подвиды этой гипотезы: 1) вирус был создан из вирусов, генетически очень близких RaTG13 и MP789 (сходство выше 99%); 2) вирус был создан из двух других неопубликованных вирусов, не являющихся прямыми родственниками RaTG13 и MP789. Первая гипотеза опровергается в начале нашей критической статьи, правдоподобие второй ставится под сомнение в конце.
Стоит также отметить, что в своих не рецензируемых публикациях, адресованных широкой аудитории, Юрий Дейгин использовал именно такую «хайповую» формулировку:
«А CoV2 - это очевидная химера, основанная на летучемышином штамме RaTG13, у которого в шиповидном белке место связывания с рецептором (RBM) заменено с летучемышиного на панголиний, и вдобавок врезан особый участок из 4-х аминокислот, создавший furin cleavage site, который, как ранее выяснили вирусологи, значительно расширяет «репертуар» вируса в плане того, в чьи клетки он может проникать» [5].
Мы рады, если автор от нее отказался. Ждем обновления статьи на Хабре.
И все же рассуждения Сегрето и Дейгина о том, как именно генные инженеры «создавали» SARS-CoV-2, основываются на сходстве и различиях между геномами SARS-CoV-2, RaTG13 и MP789. Например, кто сказал, что у гипотетических RaTG13-like или MP789-like вирусов не было фуринового сайта? Мог и быть.
Пункт второй
В своей критике критики авторы настаивают, что «рецептор-связывающей домен [SARS-CoV-2] характеризуется очень сильным связыванием с человеческим рецептором ACE2, что делает маловероятным предположение авторов о происхождении SARS-CoV-2 в летучих мышах».
Однако рецептор-связывающей домен SARS-CoV-2 связывает ACE2 рецепторы десятка видов летучих мышей [6] (у некоторых так же эффективно, как и человеческий рецептор), включая летучую мышь Rhinolophus affinis [7]. Вывод о том, что SARS-CoV-2 плохо связывает ACE2 летучих мышей был основан на теоретических биоинформатических расчетах [8], которые в итоге вошли в противоречие с экспериментальными данными. Заражение еще одного вида летучих мышей вирусом SARS-CoV-2 было продемонстрировано экспериментально в статье в журнале The Lancet Microbe еще в 2020 году [9].
Пункт третий
В своей критике мы объяснили, почему в 12 нуклеотидах фуринового сайта SARS-CoV-2 неизбежно (с вероятность более 99%) нашелся бы какой-нибудь рестрикционный сайт (участок, который могли бы использовать генные инженеры, чтобы разрезать генетическую последовательность). В критике критики авторы заявляют, что наш анализ не верен так как:
1.) Сайты рестрикции кластеризуются, распределены по последовательности неравномерно.
2.) Мы рассматривали в том числе 4-буквенные сайты, а FauI, который они нашли, распознает 5 нуклеотидов.
3.) Этот сайт важный, так как позволяет делать скринирование на вставку фуринового сайта.
4.) В сайте встречается две CGG кодона, кодирующие аргинины, которые свойственны людям, но не SARS-like коронавирусам.
Наши ответы на эти возражения:
1. Гипотеза о равномерности распределения сайтов была проверена, статистически значимого отклонения обнаружено не было (p-value = 0.92), см. рисунок 1.
2. Даже если рассмотреть только сайты с количеством нуклеотидов больше или равным 5, вероятность появления такого сайта в 12-нуклеотидной вставке равна 53.6%. На порядок больше, чем требуется для отклонения нулевой гипотезы о том, что эта находка случайна (самый мягкий порог в статистике - 5%). Странно, что авторы, критикуя наши расчеты, не переделали их с учетом собственных замечаний и не убедились, что это не влияет на выводы.
3. Публикаций, свидетельствующих о том, что рестрикционные сайты когда-либо использовались для скрининга генетических вставок в коронавирусы, авторы не приводят.
4. CGG-CGG сайты, кодирующие два аргинина, действительно редки у коронавирусов. Но все же они встречаются у других коронавирусов, природность происхождения которых не ставилась под сомнение. Например, в геноме коронавируса кролика HKU14 есть CGG-CGG кодоны, кодирующие аргинины [10].
Впрочем, появление вставки не требует, чтобы источником CGG-CGG последовательности в ней была последовательность, кодирующая аргинины. Так, в коронавирусе летучих мышей HKU9 присутствует 10 из 12 нуклеотидов «фуриновой вставки SARS-CoV-2»: CCTCGGCGGGC, пусть и не в рамке [11]. А в S-белках некоторых коронавирусов кошек (в частности Feline coronavirus strain FIPV15A) встречается фуриновый сайт, как у коронавируса SARS-CoV-2: PRRAR [12]. CGG-CGG пары там нет, но есть CGG-CGA, отличающаяся всего на одну букву (и встречающуюся у коронавирусов не чаще). Напомним, что кошки тоже заражаются коронавирусом SARS-CoV-2.
К этим возражениям на возражения добавим еще три новых пункта.
5. Есть более канонические [13] фуриновые сайты, которые ученые использовали в прошлом (в т.ч. в Ухане) - RX[RK]R [14,15,16]. Фуриновый сайт SARS-CoV-2 (RRAR) не соответствует каноническому, используемому в предыдущих работах, а значит вероятность направленной генетической модификации не высока. Примеры использованных сайтов: RRKR, RSRR, RTKR (взяты из работ, которые искал не я, а сам Дейгин).
6. В недавней работе [17] было показано, что фуриновые сайты на эволюционном дереве коронавирусов (и не только коронавирусов [18,19]) возникали независимо много раз. Например, у бета-коронавирусов, к которым принадлежит SARS-CoV-2, он возникал как минимум 6 раз, без всякой помощи генных инженеров. Все-таки, фуриновый сайт довольно короткий. Поэтому в его появлении ничего вызывающего подозрения нет.
7. На сегодняшний день известно более 140 инсерций в геноме SARS-CoV-2, появившихся в процессе его эволюции в человеке. В свежей работе про инсерции Гарушянц, Рогозин и Кунин показывают, что [20]:
«Примечательно, что вставка PRRA, добавляющая фуриновый сайт и являющаяся одной из характерных особенностей SARS-CoV-2, напоминает описанные здесь длинные инсерции. Хотя у этой вставки высокое содержание GC, по сравнению со среднем для генома SARS-CoV-2, он укладывается в диапазон содержания GC для длинных инсерций. Более того, инсерция находится в двадцати нуклеотидах от горячей точки смены матрицы, расположенной в позиции 22,582. Хотя мы не смогли найти статистически достоверное совпадение, которое позволило бы определить источник вставки в геноме SARS-CoV-2, вероятно, что и эта инсерция появилась в результате смены матрицы, за которой последовали замены, стершие сходство с исходной последовательностью».
Пункт четвертый
В своей критике мы сослались на статью, в которой показан возможный механизм появления вставок в 12 нуклеотидов [21]. В ответе на критику авторы пишут, что статья, на которую мы ссылаемся, описывает дупликации, которые никогда не приводят к разделению кодона (как в случае обсуждаемой вставки у SARS-CoV-2) и что в этой статье говорится, что только инсерции с размером, кратным 3, генетически стабильны.
На это мы отвечаем, что в обсуждаемой статье показаны конкретные примеры, где вставка приводила к разделению кодона (Таблица 2). Такое вполне возможно, так как дупликации и инсерции происходят не в процессе трансляции (синтеза белков), поэтому информация о кодонах в ходе этих процессов большого значения не имеет. Вставка в фуриновом сайте SARS-CoV-2 имеет длину 12. 12, как раз, кратно 3 (Моро М.И. et al., 2019. «Математика. 3 класс»).
Пункт пятый (вывод в ответе на критику)
В ответе на критику авторы пишут: «особенно забавной является попытка Тышковского и Панчина применить принцип максимальной экономии, отвечая на вопрос, является ли природное происхождение вируса более вероятным, чем утечка, особенно учитывая, что авторы во введении пишут, что лабораторную утечку можно определить лишь изучая лабораторию, а не анализируя генетические или фенотипические свойства вируса. Это не только противоречит названию их комментария, но и существенно умаляет главный посыл их работы».
Нам не очень понятно, что именно авторы находят забавным. Возможно, они не понимают разницу между лабораторной утечкой природного вируса и созданием вируса в лаборатории путем внедрения фуринового сайта и других генетических манипуляций. Впрочем, ни тому, ни другому на сегодняшний день свидетельств не обнаруживается.
В сухом остатке:
- Вирус не был создан из RaTG13 и панголиньевого MP789. С этим авторы, судя по их ответу, согласны.
- Сайт рестрикции так и остается случайным. Авторы не привели статистический анализ, но это сделали мы.
- Вставка длиной в 12 нуклеотидов все еще нестранная и вполне согласуется с природным происхождением.
- Рецептор-связывающей домен SARS-CoV-2 узнает рецепторы летучих мышей, а значит, его недалекий предок мог жить в них. А мог жить в других животных - промежуточных хозяевах. В любом случае, природной гипотезе особенности вирусов, родственных SARS-CoV-2, никак не противоречат.
- По итогу, никаких аргументов в пользу искусственного происхождения и никаких аргументов, которые бы не согласовывались с природным, у Сегрето и Дейгина нет. Учитывая, что нам известно меньше 0.1% природных вирусов [22,23], и насколько часто происходит рекомбинация между коронавирусами в природе [24], гораздо выше вероятность химеризации 2 вирусов в природе, чем на лабораторном столе. Этот, пожалуй, основной аргумент авторами никак опровергнут, не был.
Список литературы
1. Tyshkovskiy A, Panchin AY (2021) There is no evidence of SARS-CoV-2 laboratory origin: Response to Segreto and Deigin (DOI: 10.1002/bies.202000240). Bioessays 43: e2000325.
2.
https://habr.com/ru/post/546408/.
3.
https://arxiv.org/pdf/2106.02020.pdf.
4. Segreto R, Deigin Y (2021) The genetic structure of SARS-CoV-2 does not rule out a laboratory origin: SARS-COV-2 chimeric structure and furin cleavage site might be the result of genetic manipulation. Bioessays 43: e2000240.
5.
https://habr.com/ru/post/497956/.
6. Yan H, Jiao H, Liu Q, Zhang Z, Xiong Q, et al. (2021) ACE2 receptor usage reveals variation in susceptibility to SARS-CoV and SARS-CoV-2 infection among bat species. Nat Ecol Evol 5: 600-608.
7. Li P, Guo R, Liu Y, Zhang Y, Hu J, et al. (2021) The Rhinolophus affinis bat ACE2 and multiple animal orthologs are functional receptors for bat coronavirus RaTG13 and SARS-CoV-2. Sci Bull (Beijing) 66: 1215-1227.
8. Damas J, Hughes GM, Keough KC, Painter CA, Persky NS, et al. (2020) Broad host range of SARS-CoV-2 predicted by comparative and structural analysis of ACE2 in vertebrates. Proc Natl Acad Sci U S A 117: 22311-22322.
9. Schlottau K, Rissmann M, Graaf A, Schon J, Sehl J, et al. (2020) SARS-CoV-2 in fruit bats, ferrets, pigs, and chickens: an experimental transmission study. Lancet Microbe 1: e218-e225.
10.
https://www.ncbi.nlm.nih.gov/nuccore/NC_017083.1.
11.
https://virological.org/t/tackling-rumors-of-a-suspicious-origin-of-ncov2019/384/3.
12.
https://www.ncbi.nlm.nih.gov/nuccore/KJ665877.
13. Zimmer G, Conzelmann KK, Herrler G (2002) Cleavage at the furin consensus sequence RAR/KR(109) and presence of the intervening peptide of the respiratory syncytial virus fusion protein are dispensable for virus replication in cell culture. J Virol 76: 9218-9224.
14. Belouzard S, Chu VC, Whittaker GR (2009) Activation of the SARS coronavirus spike protein via sequential proteolytic cleavage at two distinct sites. Proc Natl Acad Sci U S A 106: 5871-5876.
15. Cheng J, Zhao Y, Xu G, Zhang K, Jia W, et al. (2019) The S2 Subunit of QX-type Infectious Bronchitis Coronavirus Spike Protein Is an Essential Determinant of Neurotropism. Viruses 11.
16. Watanabe R, Matsuyama S, Shirato K, Maejima M, Fukushi S, et al. (2008) Entry from the cell surface of severe acute respiratory syndrome coronavirus with cleaved S protein as revealed by pseudotype virus bearing cleaved S protein. J Virol 82: 11985-11991.
17. Wu Y, Zhao S (2020) Furin cleavage sites naturally occur in coronaviruses. Stem Cell Res 50: 102115.
18. Tse LV, Hamilton AM, Friling T, Whittaker GR (2014) A novel activation mechanism of avian influenza virus H9N2 by furin. J Virol 88: 1673-1683.
19. Bottcher-Friebertshauser E, Klenk HD, Garten W (2013) Activation of influenza viruses by proteases from host cells and bacteria in the human airway epithelium. Pathog Dis 69: 87-100.
20. Garushyants SK, Rogozin IB, Koonin EV (2021) Insertions in SARS-CoV-2 genome caused by template switch and duplications give rise to new variants of potential concern. bioRxiv.
21. Perdue ML, Garcia M, Senne D, Fraire M (1997) Virulence-associated sequence duplication at the hemagglutinin cleavage site of avian influenza viruses. Virus Res 49: 173-186.
22. Carroll D, Daszak P, Wolfe ND, Gao GF, Morel CM, et al. (2018) The Global Virome Project. Science 359: 872-874.
23. Anthony SJ, Epstein JH, Murray KA, Navarrete-Macias I, Zambrana-Torrelio CM, et al. (2013) A strategy to estimate unknown viral diversity in mammals. mBio 4: e00598-00513.
24. Hu B, Zeng LP, Yang XL, Ge XY, Zhang W, et al. (2017) Discovery of a rich gene pool of bat SARS-related coronaviruses provides new insights into the origin of SARS coronavirus. PLoS Pathog 13: e1006698.