Я достаточно давно утверждаю, что единой 30 КБ РНК коронавирусов не существует в природе - все секвенсы коронавирусов в генбанке представляют собой сборки из коротких фрагментов. При этом перекрытие фрагментов - что могло бы свидетельствовать, что они принадлежат единой РНК - не доказано, а иногда выглядит как явный подгон.
Смотрите посты
этот, и
этот, и комменты там.
Довелось мне пообщаться со специалистом по вопросам секвенирования и сказано мне было, что да - старые секвенсы, это скорее всего сборки из фрагментов той или степени достоверности. Но вот относительно недавно появилось секвенирование на нанопорах, и оно типа подтверждает, что у коронавирусов 30 Кб геном.
Идея в том, что нанопоры позволяют прочитать фрагмент РНК в десятки тысяч нуклеотидов длиной за один проход. И даже без конвертирования в кДНК, что исключает артефакты обратной транскрипции. И типа в ридах такого секвенатора найдутся полноразмерные геномы коронавирусов. Я попросил привести пример такого секвенирования и мне прислали
это.
В статье была такая таблица:
В ней написано, что получены риды размером в 26 210 нуклеотидов, сошедшиеся к геному одной из разновидностей коронавируса. Я решил, что похоже надо прикрывать ЖЖ, извиняться перед народом за дезу и расходиться.
Однако, пошел смотреть распределение сошедшихся к геному коронавируса ридов по длинам.
Выглядело оно так:
В общем из 224724 ридов WT длиннее 20 000 нуклеотидов было 2 (!) рида. То есть, 0,0008% всех ридов. Длиннее 15 000 нуклеотидов было 6 ридов.
0,0008% нельзя классифицировать иначе, как приборную погрешность - считается, что в нанопорном секвенировании уровень ошибок до 14%. Кроме того, данное распределение ридов никак не может быть «вирусной инфекцией» - инфекция из 2-х вирионов, которые при этом породили кучу субгеномной РНК, так что ли?
В общем, после предъявления распределения и краткой дискуссии оппонент сказал, что, вероятно, даже секвенсы из нанопор - сборки из коротких фрагментов.