1500 лабораторий мира скачали алгоритм поиска генов в ДНК, созданный в МФТИ

Jan 13, 2016 23:12



Группа ученых из Германии, Америки и России, при участии заведующего кафедрой Московского физико-технического института (МФТИ) Марка Бородовского, предложила алгоритм, который автоматизирует и делает более эффективным поиск генов. Разработка соединяет в себе преимущества наиболее продвинутых инструментов для работы с геномными данными. Предложенный метод позволит точнее и быстрее анализировать новые последовательности ДНК и находить полный набор генов в геноме.

Статья, описывающая алгоритм, была недавно опубликована на страницах журнала Bioinformatics издаваемого Oxford Journals. При этом саму компьютерную программу уже скачали более 1500 различных центров и лабораторий по всему миру. Тестирование алгоритма показывает его существенно более высокую точность по сравнению с другими программами.

Одной из важных задач смежных с современной биологией наук является аннотация генома - определение того, с каких именно участков молекулы ДНК - генов - синтезируются РНК и белки. Выявление генных участков происходит на основе поиска сходства фрагментов последовательности с уже известными генами или путем обнаружения характерных для генов закономерностей чередования нуклеотидов. Этот процесс осуществляется с помощью предсказательных алгоритмов.



Найти генныe участки - нетривиальная задача, особенно в эукариотических организмах, к которым относятся практически все широко известные виды, кроме бактерий. Это происходит из-за того, что у таких клеток передача наследственной информация усложнена наличием «разрывов» в кодирующих областях (интронов) и отсутствием однозначных признаков для определения того, является  ли область кодирующей или нет.

Алгоритм, предложенный учеными, определяет, какие области в ДНК являются генами, а какие - нет. Для этого можно использовать марковскую цепь (последовательность случайных событий, будущее которых зависимо от прошлого), обучаемую на уже известных генах. Состояниями цепи в данном случае являются либо нуклеотиды, либо нуклеотидные «слова». Алгоритм, названный учеными BRAKER1, определяет наиболее вероятное разбиение генома на кодирующие и некодирующие области. Тестирование алгоритма показывает его существенно более высокую точность по сравнению с другими алгоритмами, сообщает пресс-служба МФТИ.

Подобные инструменты помогают решать множество различных задач, говорится в сообщении. Например, уже опубликованы первые результаты глобального проекта «1000 человеческих геномов», запущенного в 2008 году при содействии 75 лабораторий и компаний. В результате было обнаружено последовательностей редких генных вариантов - замен в генах, некоторые из которых приводят к болезням. В проекте расшифровываются геномы различных людей, особенно кодирующие их части и выявляются редкие замены нуклеотидов. В будущем это поможет медикам диагностировать такие сложные заболевания, как болезни сердца, диабет и рак.

http://www.strf.ru/material.aspx?CatalogId=222&d_no=112951#.VpZws16E4c0

МФТИ, международное сотрудничество, информационные технологии, генетика, Москва, наука

Previous post Next post
Up