(Untitled)

May 03, 2010 23:23

Сейчас в интернете можно найти массу научных статей, в которых описываются процессы, происходящие в организме на разных уровнях (тканевый, клеточный, молекулярный и т.д.). Сначала я пытался все это рисовать на бумаге, чтобы было потом удобнее анализировать, но со временем объем материала растет, и анализировать его вручную слишком долго. Поэтому ( Read more... )

Leave a comment

objmihail May 4 2010, 05:08:33 UTC
А данные у вас будут я так понимаю в свободном доступе? )
У меня довольно похожая система, где-то около 1000 узлов, могу вам залить в Excel. Никаких других таких баз не встречал, только схемы разные (которые я и скопипастил в основном).
А вот насчет словаря я не понял: зачем он нужен?

Reply

crocodile2010 May 4 2010, 09:52:00 UTC
Пока это все только в начале пути.
Думаю, как только появится результат, который нестыдно показать, хочу оформить на каком-нибудь сайте, только придется еще некоторое время потратить на web-интерфейс
Словать нужен
1) для хранения дополнительной информации об используемых терминах
2) для хранения слов-синонимов
3) для исключения дублирования
Предполагая, что заливать в Excel смогут разные люди, каждый это будет делать немного по-своему, а система должна уметь все приводить к одному формату
Чуть попозже пришлю образец, что хочется увидеть

Reply

objmihail May 4 2010, 10:27:23 UTC
Ясно, удачи ) Присылайте.

Reply

crocodile2010 May 4 2010, 20:09:38 UTC
Образец с описанием выложил тут
http://narod.ru/disk/20407425000/obrazec.xls.html

Reply

objmihail May 4 2010, 23:58:50 UTC
Почитал, есть некоторые вопросы.
Вот я не пользуюсь составлением абстрактных имен для переменных (для снятия синонимии есть списки синонимов у каждой переменной), а они у меня в полнотекстовом виде всегда представлены, например "Повреждения аппарата сегрегации
генетического материала", могу я их прямо в таком виде размещать в таблице "Реакции"?

Теги Article, HyperLink придётся перед каждой новой строчкой вставлять, не проще ли сделать соответствующую колонку для них и вообще для всех тегов? Так было бы и стандартнее, понятнее.

Reply

crocodile2010 May 5 2010, 14:03:54 UTC
"Повреждения аппарата сегрегации генетического материала" - да, можно, на это тоже был расчет. Со временем, если появятся более подробные данные этого механизма, можно будет разнести этот узел на несколько и перестроить связи.
Проблемы с длинными именами возможны:
- при последующем его упоминании требуется написать его ровно так же, без ошибок;
- во избежание ошибок в софте, придется резать его примерно до 240 символов

Насчет тегов Article и Hyperlink - я так полагал, что обычно человек читает статью, и по ходу дела заносит в базу то, что он прочитал. При этом не надо заботиться о том, есть ли уже такая связь в базе или нет, или есть противоположная
Для моделирования как такового можно вообще теги не писать, это на случай затыка с идентификацией термина чтобы была возможность обратиться к первоисточнику

Reply

objmihail May 6 2010, 04:42:42 UTC
Понятно, ну я как экспортирую так отпишусь, причесать ещё данные не помешает.

Reply

crocodile2010 May 22 2010, 18:21:39 UTC
Как дела с экспортом?
Получается, или есть сложности?
Я на данный момент реализовал расчет вперед (по заданному "воздействию" на группу узлов определить, в какую сторону отклонятся значения остальных, почти все виды взаимодействий, кроме комплексов). Сейчас осваиваю клиент-серверную технологию, в частности, динамическую генерацию html-файлов.

Reply

objmihail May 22 2010, 19:03:59 UTC
Пока не могу сказать, решил БД поменять и вот сейчас много чего переделал, как закончу отладку, займусь экспортом. Думаю никаких сложностей не будет. По крайней мере у меня :) Достаточно много будет не совсем правильных с точки зрения вашего высокого уровня формализации узлов и связей. Но наверное база знаний должна уметь разбираться с плохо организованными знаниями или даже ошибочными?

Reply

crocodile2010 May 22 2010, 20:06:32 UTC
С ошибочными есть идеи как разобраться автоматически (на выходе будет больше разброс значений), но в конечном итоге эксперт должен иметь возможность видеть связи конкретного узла (надо будет и такой сервис предусмотреть) и исправить. А насчет плохой организации надо бы посмотреть для начала конкретные примеры, в чем "плохость".

Reply

objmihail May 22 2010, 23:36:12 UTC
Вот к примеру что будет, если вместо

C->(A->B)
Где А: Инсульт
B: Апоптоз
C: Ингибирование холинергических мускариновых рецепторов

будет добавлено в базу

A->B
B->C
Где А: Инсульт
B: Увеличение вероятности апоптоза при инсульте
C: Апоптоз

Такие случаи довольно часто встречаются, не уверен, что я их все замечу :(

Reply

crocodile2010 May 23 2010, 06:47:46 UTC
Можно. Результатом будет более упрощенная модель, в которой не учтена связь между холинергическими мускариновыми рецепторами. Кто-нибудь другой учтет, и все встанет на свои места.
А насчет 1-го варианта, более строго запись будет выглядеть так:
D-|C
C-|(A->B)
Где А: Инсульт
B: Апоптоз
C: Холинергический мускариновый рецептор
D: то, что его ингибирует
Но поскольку D в данном случае неизвестно, оставляем как есть до лучших времен

Reply

objmihail June 16 2010, 21:09:06 UTC
Сделал экспорт: http://gerontology-explorer.ru/export/Excel.xlsx
Градации реакций на биологические виды у меня, к сожалению, пока нет, хотя вещь конечно полезная и потом скорее всего буду делать (если потребуется). Но вообще в большинстве источников (разные схемы) о биологических видах ничего не говорилось.
Скажите, если что надо поправить.
Надеюсь на подобный файл вашей базы когда-нибудь :)

Reply

crocodile2010 June 17 2010, 18:45:28 UTC
Отлично!
Править пока ничего не надо.
Я сам слегка отрихтую и верну обратно.
По формальной части (чтобы закачалось) пришлось поправить колонку с указанием типа воздействия (заменил > на ^ и -| на T, поскольку > у меня используется для слова Нормализует) и некоторые длинные названия сократил, потому что они не помещаются в индексы, и еще я не использую точку с запятой в названиях, она идет как разделитель названий.
По неформальной части пока основательно не копал.
Моя база пока подросла всего в 2 раза (~550 связей). Руки до всего сразу не доходят. Могу выложить текущий вариант как есть.

Reply

objmihail June 18 2010, 13:34:50 UTC
Конечно, выкладывайте как есть :) Если что потом перезалью.
Насчет точки с запятой в названиях, действительно, могли такие быть. А названий превысивших 230 символов не нашлось.

Reply

crocodile2010 June 18 2010, 17:09:50 UTC
Выложил архив http://narod.ru/disk/22010624000/BASE.ZIP.html... )

Reply


Leave a comment

Up