Hypertag

Jul 22, 2011 11:22


Идея следующая. Контент снабжается тегами. Но теги не простые, а иерархические, т.е. являются частью классификационных деревьев. При этом один тег может быть частью нескольких деревьев.

Например, у нас есть тег "транспорт". Если мы ищем контент по этому тегу - нам выдаст система всё, помеченное такими тегами как "наземный транспорт", ..., "авиалайнеры", ..., "Титаник" - то есть всё, что помечено тегами, имеющими в предках "транспорт", т.к. титаник это океанский лайнер, океанский лайнер - это водный транспорт, а водный транспорт - это транспорт вообще.

С другой стороны (по другой классификации) Титаник - это художественный фильм, и система нам его выдаст если мы попросим её выдать контент с гипертегом "искусство", или "кинематограф", или "леонардо дикаприо" (через цепочку "киноактеры" - "леонардо дикаприо" - "фильмы с леонардо дикаприо").

Думаю, идея понятна. Использование гипертегов позволит делать уточняющую выборку, например Титаник мы можем найти в выборке по двум тегам "транспорт" и "кинематограф", или более, если мы знаем достаточно о том, что мы ищем.

Такая система имела бы преимущество над обычной текстовой поисковой системой в том смысле что по запросу в гугле к примеру "фильм про пароход" мы получим 100 ссылок на "вдовий пароход" и 50 на "белый пароход", а ссылок на "титаник" там может и не оказаться.

Недостаток заключается в том что нет готового решения позволяющего наполнять базу тегов и метить контент. В принципе, это могут делать сами пользователи при создании контента, если хотят чтобы его находила система. Или энтузиасты (те же люди, которые пишут статьи в википедию) могли бы помечать материал, в том числе для того, чтобы была возможность легко найти его позже. При этом кстати естественным образом будет отсеиваться всякий шлак, т.к. у людей не возникнет желания его метить. Можно также ввести систему оценки контента, степени его соответствия тегу и т.п.

PS: это не семантическая сеть. Задачи выражать связи (их характер) между объектами не ставится. Скорее это гипер-каталог.

интернет, программирование

Previous post Next post
Up