Гипериндексные структуры

Jul 16, 2013 14:18

Мне неожиданно прислали приглашение на конференцию по философии математики, участие в чем, в силу ряда требований к научной квалификации участников для меня просто исключено. Но приглашение помогло появиться мысли, с чем бы я мог выступить на подобной конференции, включившись в работу секции «использование математики». Предваряя последующие ( Read more... )

Leave a comment

Comments 40

sspr July 16 2013, 15:14:07 UTC
Крутой ты! :)

Reply


xyznaetkto July 16 2013, 16:06:44 UTC
Насчёт "гипериндексов" - или я что-то у вас не понял, или эта задача давно уже решена в рамках SQL. С помощью банальных инструкций SELECT FROM <> WHERE <> можно докопаться до любого слона через любовницу мужа уборщицы, чистящей у этого слона клетку.

По поводу динамической структуры системы - всё упирается в проблему десериализации "старых" данных. Хотя и это кое-как реализовано, с существенной оговоркой. Если вы идёте строго по пути расширения описательных структур - это ещё со скрипом работает: новые объеты будут использовать всю новую структуру, старые - лишь релятивную им часть. Но стоит вам поменять хотя бы один байт в исходной части описательной структуры - все ваши "дореволюционные" данные накроются медным тазом. На этом принципе аккуратного расширения по мере необходимости работают межпрограммные интерфейсы COM - технология старая и по причине геморройности отмирающая.

Reply

alisarin July 16 2013, 17:37:49 UTC
== С помощью банальных инструкций SELECT FROM <> WHERE <> можно докопаться до любого слона через любовницу мужа уборщицы, чистящей у этого слона клетку ( ... )

Reply

viktor_trusov July 16 2013, 18:46:19 UTC
alisarin, я когда то давно, году в 1995 создал с помощью то ли Access 2, то ли Access 7, базу своей библиотеки в которой начал заносить все свои книги. В ней (в этой базе) на каждой страничке книги было окно с указанием всех произведений входящих в эту книгу. Например, хрестоматия "Психология индивидуальных различий". 35 отрывков из произведений 35 авторов. Нажимая на кнопочку любого из этих произведений, я попадал в окно, в котором было в двух словах написано (я конечно это писал) о чём там пишется и понравившиеся мне цитаты. И я так понял, что я могу это продолжать до… некоторой… ну вообщем я не знаю сколько раз. Мне просто дальше не нужно было. А дальше, если мне нужно было найтив базе всё что есть, например о сознании, я просто набирал слово "сознание" в поле поиска и мне моя база выдавала все места, где это слово упоминалось ( ... )

Reply

alisarin July 16 2013, 19:37:15 UTC
Если взять ваш пример с каталогизирующей книги базой, то она линейная, а не перекрестная. Перекрестной она была бы в том случае, если книги объединялись бы и по авторам, и по систематическому признаку. Т.е. найдя произведение, можно было нажать "подбор книг той же тематики", и база бы отсылала к такой подборке. Просто контекстный поиск - это не совсем то, могу иллюстрировать это собственным случаем поиска через гугл тех же "гипериндексных структур", - в некоторых предложениях подобные словосочетания встречаются, но анализа собственно предмета "гипериндексных структур" в находимых поиском материалах нет ( ... )

Reply


michaellogin July 16 2013, 16:16:25 UTC
Реализуема, но, однако, не реализована - поскольку не существует даже, о чем мы сказали выше, даже понятия гипериндексных систем или перекрестных индексов. Я вообще не в теме, но, может быть Resource Description Framework (RDF, «среда описания ресурса») это нечто похожее?

Reply

alisarin July 16 2013, 17:54:47 UTC
Спасибо за наводку! Но вижу такие недостатки:

1) RDF предоставляет средства для построения информационных моделей, но не касается семантики описываемого. Взятый в отдельности граф RDF можно понимать только как граф.

2)Онтология использует предопределённый зарезервированный словарь терминов для определения концепций и отношений между ними для конкретной предметной области.

- -

А мне хотелось бы иметь возможность менять понятия, связи и их статусы и, соответственно, использовать для этого аппарат базы данных и создавать посредством подобных программных средств любые коллекции данных и практически любым образом построенные, а не только так, как описывают некие "модели представления данных". То есть наличие "модели представления данных" я предполагаю, но она должна иметь вид своего рода "незаполненной"; или - пожелай богослов использовать предлагаемую гипериндексную структуру для ведения с ее помощью его коллекции данных, и он будет иметь такую возможность.

Reply

boldachev July 17 2013, 11:59:04 UTC
RDF + OWL и язык запросов SPARQL и вперед - уже есть реализованные базы знаний: http://dbpedia.org/About, http://www.freebase.com/, http://www.cyc.com/platform/opencyc

Reply

alisarin July 17 2013, 14:46:48 UTC
Так, поторкался, могу сказать, что очень близко тому, о чем я именно. Но язык SPARQL ... - вещь, требующая освоения, и, что любопытно, в родных пенатах ничего нет. Но за ссылки - огромное спасибо!

Reply


alisarin July 18 2013, 12:25:07 UTC
Удалось выяснить, что подобный метод баз данных существует и где-то как-то применяется, но вроде как бы не очень широко. Он носит название "доменно-ключевая нормальная форма", и излагается в следующем на мой взгляд, не вполне ясном, но широко распространенном в интернете сочинении:«В [5] указано, что под сущностью (объектом, фактом и т.п.) в ПрО [произвольная предметная область] понимается расширяемая совокупность атрибутов, объединенных единым уникальным в рамках этой ПрО многоместным предикатом. А под атрибутом сущности-объекта понимается некое абстрактное множество, объединенное одноместной частью этого уникального для ПрО многоместного предиката. Там же описано одно из принципиальных свойств каркасной модели - фиксированная структура единого для каждого атрибута ключа, являющегося следствием многоместного предиката. Такой подход к декомпозиции ПрО дает возможность каждый атрибут ПрО рассматривать как отдельный класс сущностей-объектов со своим фиксированным классом ID, каждый экземпляр которого, во-первых, имеет строго ( ... )

Reply


alexander_xom July 20 2013, 17:52:44 UTC
Google давно этим занимается, только в направлении поиска таких "гипериндексных" сущностей. И поэтому они купили упомянутый тут freebase. Сделали из него пока правда только вот это год назад (поищите "Google запускает семантический поиск"). При поиске выдается не только то, что вы ищите, но и связанные семантически данные, почти как в вашем каталоге. Только в каталоге своем вы не определили заранее, кто создает "запрос" на следующий шаг по другой оси. Там ведь может быть куча ветвлений. Отсутствие предзаданности видимо вас и манит, но это не относится к самой структуре базы, это относится к тому, кто делает запрос (субъекту). И предзаданность тут вполне присутствует - вы знаете в момент ветвления поиска, что вы хотите - это определяется общей задачей и предшествующим результатом поиска. И вы предполагаете, что эта гипотетическая система будет "догадаться", что вы хотите получить на следующем шаге или выдавать все возможные варианты ( ... )

Reply

alisarin July 20 2013, 18:55:10 UTC
Меня, конечно, интересует онтология, и дело в следующем. (А сугубо математические и построительные аспекты - это всего лишь фон, хотя я не отрицаю и она заслуживает внимание, но это... не моя тема). А дело в том, что философы, когда они конструируют онтологию, они идут не от умозрительного начала, а не от практики коллекционирования или сбора фактов ( ... )

Reply

alexander_xom July 21 2013, 07:03:03 UTC
Частный тип строится как набор признаков, которые общие для других частных типов? Тогда очень многое зависит от заданных в начале признаков, они и задают "онтологию". Если внесение новых признаков будет возможно, то как они будут определяться? "Круглый" - это признак или формальная категория? Онтология - это не иерархия, а прежде всего наследование свойств, чтобы их не перечислять. "Частный тип" наследует все вышестоящие. В этом смысле у вас получится в итоге тоже самое - рельсовый и безрельсовый. Это не похоже на механизм поиска в мозге. Этот механизм как вы отметили динамический, процесс, а не статика. В том, что вы предлагаете ее опять же не видно. И потом, как вы раскладываете на признаки омонимы? Они в разных контекстах имеют по сути разные признаки. То есть они не постоянны для одного "частного типа" (постоянны только в одной предметной области ( ... )

Reply

alisarin July 22 2013, 09:05:22 UTC
== Частный тип строится как набор признаков, которые общие для других частных типов? Тогда очень многое зависит от заданных в начале признаков ( ... )

Reply


Leave a comment

Up