В геноме человека всего около 20 000 генов. В геноме круглого червя Caenorhabditis elegans - столько же.
*** Введение
Упрощённо, в школьном изложении ген - это структурная часть ДНК, несущая информацию об одном белке; последовательность (троек) нуклеотидов в гене соответствует последовательности аминокислот в составе белка. Из белков, как из деталей, и состоит организм.
Белок получается в результате процесса, известного как экспрессия гена:
1. информация от одного гена ДНК переносится на синтезируемую РНК (этот шаг экспрессии называется транскрипцией);
2. в свою очередь, получившаяся матричная РНК - полная информационная копия одного гена - синтезирует соответствующий её структуре белок (этот шаг экспрессии называется трансляцией).
Можно сказать, что ДНК - это технологический план завода, ген - один из чертежей в этом плане, конкретная РНК - сконструированный по чертежу станок, а белок - получающаяся на станке деталь. Из совокупности таких белков-деталей и будет состоять организм.
Таким образом, наследственная информация - это, по большому счёту, информация о составе белков организма: по наследству, в косвенной форме чертежей, передаётся опись деталей: "Короб, шестерёнка, болт, провод, поршень, тяж, гайка..."
И в общем-то всё.
Однако такой подход не помогает понять, почему у человека, устроенного гораздо сложнее червя, генов столько же - ведь в более сложном организме разнообразие белков должно быть выше, чем в простом.
*** Сплайсинг
Если немного углубиться в теорию, то окажется, что последовательность триплет нуклеотидов не находится в прямом соответствии с аминокислотным составом кодируемого белка. Дело в том, что в генах высших организмов между кодирующими белок участками (экзонами) вставлены некодирующие последовательности - интроны. В ходе транскрипции гена, из синтезированной мРНК все интроны вырезаются, а экзоны склеиваются друг с другом. Только после этого, на основе "зрелой" мРНК, и происходит собственно синтез белка.
Процесс вырезания интронов называется сплайсингом.
Конечно, как и положено, всё гораздо сложнее, чем кажется. Обычно существует несколько альтернативных вариантов сплайсинга для одной и той же мРНК. Дело в том, что часть экзонов может быть вырезана вместе с прилегающими к ним интронами. В результате из одной и той же «незрелой» мРНК, содержащей, например, 7 экзонов (1,2,3,4,5,6,7) могут получиться разные «зрелые» мРНК: 12357, 12467, 2345 и т. д. Разные мРНК станут затем матрицами для синтеза разных белков.
Таким образом, благодаря механизму альтернативного сплайсинга один и тот же ген может кодировать несколько (вплоть до десятков тысяч) разных белков.
*** Человек, червь и альтернативный сплайсинг
Почти все человеческие гены кодируют более одного белка - альтернативному сплайсингу у человека подвергается 94% генов. А вот у того самого червя C. elegans - лишь 15%. Теперь понятно, что разнообразие белков у млекопитающих повысилось не за счет роста числа генов, а за счет развития альтернативного сплайсинга и соответствующего роста числа изоформ белка.
Продолжая технические аналогии, гены высших организмов - это чертежи универсальных, избыточных механизмов, с приложенными указаниями по тому, как путём изъятия некоторых узлов получить уже специальные станки: по дереву, металлу; фреза, сверло...
Для полноты картины остается добавить, что практически все человеческие гены, которые не подвергаются альтернативному сплайсингу (как мы помним, таковых оказалось 6%) - это гены, которые вообще никакому сплайсингу не подвергаются, потому что в них нет интронов.
*** Бонус - в разных тканях производятся разные наборы изоформ
У большинства генов альтернативный сплайсинг тканеспецифичен: в одних тканях чаще синтезируются одни изоформы, в других - другие. Интересно, что среди генов, сплайсинг которых отличается наиболее строгой тканеспецифичностью (в одних тканях всегда или почти всегда синтезируется только одна изоформа, в других - другая), повышена доля генов - регуляторов индивидуального развития, обмена веществ, межклеточных взаимодействий и передачи сигналов. Это именно те функции, от которых зависят структурные и функциональные различия между тканями.