Как проект Human Proteome Folding продолжает вносить свой вклад в науку: thundersnatch

thundersnatch

Как проект Human Proteome Folding продолжает вносить свой вклад в науку

Jul 30, 2016 18:16

29 июля 2016

Кратко
Рич Бонно, технический руководитель проекта Human Proteome Folding, недавно говорил с нами о том, как проект способствовал прогрессу в его работе, а также достижения в понимании структуры и функции белков. Эта новость включает в себя презентацию слайдов и аудиозапись нашего интервью, а также выписки из него.

Проект Human Proteome Folding project (HPF) был первым исследованием, работающим на World Community Grid. Д-р Рич Бонно, руководивший обеими фазами проекта, недавно дал нам обновленную информацию о том, как данные и код из этого проекта по-прежнему способствуют продвижению знаний в области системной биологии, а также о его участии в проектах, связанных со здравоохранением.

Вы можете просматривать слайды вместе с полной записью интервью ниже. Вы также можете прочитать об истории проекта и выписки из интервью, начинающиеся ниже слайдов.

Click to view

Справочные сведения

Все что происходит в клетках и в организме находится под контролем формы белков, которые позволяют или не позволяют белкам смыкаться с другими белками. Белки могут выполнять позитивные функции, такие как помощь поддержки здоровья клеток. В некоторых случаях заболевания могут препятствовать белкам выполнять свои функции, необходимые для поддержания здоровых клеток.

Знание формы белков помогает ученым понять, как белки выполняют свои желательные функции. Например, белки вируса или бактерии могут иметь определенные формы, которые позволяют им прорваться через клеточную мембрану, что позволяет им инфицировать клетки.

Для получения дополнительных сведений о функциях белка, вы можете просмотреть это подробное описание от Scitable by Nature Education.

Проект Human Proteome Folding project (HPF) запускался в два этапа; цель первого этапа заключалась в определении структуры белка для того, чтобы предсказать их функции, а цель второго этапа было увеличить разрешение и точность предсказаний для выбора подмножества белков человека.

Д-р Рич Бонно (крайний справа, верхний ряд) и члены его лаборатории

Выписки из интервью

Вопрос 1: Можете ли вы дать нам представление о том, как данные или инструменты, которые были разработаны в ходе или в результате реализации проекта оказали влияние на вашу работу позже?

[Проект] дал нам возможность думать о каждом белке в протеоме. Это привело нас к большому количеству неожиданных направлений. Одним из них является то, что нам нужно иметь набор белков, которые, по нашему мнению, не имеют функции. Есть много тысяч [известных] белковых функций, таких как ферменты, которые осуществляют определенную реакцию. Но если мы не имеем отрицательных примеров - если мы не имеем примеры того, что что-то не есть - тогда труднее классифицировать то что-то, что есть. Этот всеобъемлющий ресурс дал нам инструменты для использования структуры, чтобы определить надежные случаи, когда белки, которые не имеют функции могли бы служить в качестве отрицательных примеров обучения. Если вы можете оценить негативные примеры, то это ставит вас в лучшее положение, чтобы сделать тонко-взыскательные классификаторы для белков.

Другое дело в том, что проект Human Proteome Folding вдохновил нас думать только о том, что мы могли бы сделать, если бы мы имели высококачественные структуры для многих, многих белков. Это привело нас к новейшему проекту, использующему код из проекта HPF, а также некоторые из данных, где мы пытаемся интерпретировать генетические вариации человека. Мы берем генетические мутации, наблюдающиеся в клиниках или от людей, которые были секвенированы в рамках других исследований и мы делаем структурные модели того, на что эти мутации похожи.

Идея, что мы могли бы надежно производить модели для 70-ти процентов белков, имеющих клинические мутации, считалась бы невозможной десять лет назад. Но теперь ... мы недавно опубликовали статью в журнале Nucleic Acids Research, описывающую инструмент под названием VIPUR (вариант толкования и прогнозирования с помощью Rosetta), который берет мутации и структуры и выводит будут или нет эти мутации разрушительными.

Оказывается, что большинство мутаций в большинстве белков в геноме имеют мало или вообще никакого эффекта, но некоторые [мутации] ломают критические белки. Мы хотим найти эти критические мутации и дать их врачам и биологам, чтобы они могли отсортировать повреждающие мутации от безвредных. Это один из тех редких случаев, когда, как только вы решаете эту базовую научную проблему, это мгновенно становится полезным, потому что, с мутациями, они часто непосредственно клинически значимы, так как они часто являются непосредственной причиной заболевания.

Вопрос 2: Каким образом данные из проекта были совместно использованы и используются другими исследователями?

Мы одна из многих, многих групп, которые работают на такого рода вещи. На самом деле, мы совместно спонсируем конференцию в ближайшее время, которая посвящена осмыслению мутаций в белках. Там будет много людей, занимающихся различными подходами и это будет свободный обмен идеями. Наш подход, который использует предсказание структуры, является одним из пяти или шести подходов. Наша надежда состоит в том, что мы можем составить все эти разные подходы вместе.

Более масштабным приближением является то, как мы часто знаем, болезни имеют наследственность, но мы не знаем какие именно гены вовлечены. Мы считаем, что автоматически добавляя структурные подходы к существующим исследованиям мы можем выделить мутации, которые разворачивают белки. Сортируя эти мутации, мы можем внести свой вклад в декодирование в существующих крупномасштабных исследованиях. Например, мы совместно работаем над проектом, чтобы понять мутации у людей с аутизмом и без.

Данные HPF были совместно использованы с помощью нескольких различных веб-сайтов с самого начала проекта. Одним из ключевых моментов в проекте было то, что прежде чем он закончился, мы получали обратную связь, что было полезным для других ученых. У нас было много цитат от людей, использующих наши функциональные предсказания. Коллективно, я думаю, множество статей [о данных HPF] имеют около 40 или 50 упоминаний.

То, что мы сделали с VIPUR код, который отличается в том, что мы нацелили его на клинические метки белков - нулевые, нейтральные, патогенные, доброкачественные и так далее. Эта работа настолько новая, что мы еще не знаем ее влияние. У нас было много людей, заинтересованных в коде, мы помогли многим людям настроить код и мы также распространяем мутационные предсказания на основе нашей работы другим.

Вопрос 3: У вас есть дополнительное место в настоящее время. Можете ли вы рассказать нам немного об этом?

Когда я впервые начал работать с IBM [над проектом HPF] я был профессором Нью-Йоркского университета (NYU). С тех пор я стал руководителем группы в Центре Фонда Simons для вычислительной биологии. Этот новый, не-для-прибыли научно-исследовательский институт финансируется Фондом Simons. К счастью для меня, это в Нью-Йорке, так что я был в состоянии сохранить свою принадлежность к Нью-Йоркскому университету. Так что мое время делится несколько поровну между этими двумя местами.

Это новое учреждение прекрасно междисциплинировано. Здесь есть люди, изучающие такие поля, как прикладную математику, информатику, молекулярную биологию и вычислительную неврологию. Институт появился всего лишь полтора года назад, так что это очень интересная начальная фаза.

Вопрос 4: Какие области в вашем поле могли бы извлечь выгоду из использования вычислительной мощности World Community Grid?

[Протеиновая] структура будет оставаться непростой проблемой, которая может использовать мощь World Community Grid. Там было много достижений в области физики приборов, которые дают нам лучшие структурные данные биологии. Суть заключается в том, что существует намного больше информации от новых экспериментальных и расчетных методов, чем мы могли бы использовать для разработки экспериментов.

Новые технологии в лаборатории рождают потребность в новых вычислениях, которые дают вам ответы, которые только открывают новые вопросы и пробуждают еще более удивительные технологии. Прямо сейчас, в структурной биологии, я думаю, есть превосходные расчеты, которые были бы актуальны для World Community Grid в области геномики.

Когда вы кладете все эти новые геномные технологий вместе, необходимость собирания [данных] вместе в модель начинает получать немного сверх того, что маленький компьютер может сделать. Я думаю, что потребность в World Community Grid останется на месте еще на какое-то время.

новость на англ.

boinc