Метаинформация и теги

May 10, 2010 13:20

2010-04-27 00:15

Мысль, возникшая после чтения хабровских топиков: надо говорить не о тегах, а о метаинформации, как о более общем понятии семантической сети.

Это проясняет сразу несколько вещей

читать дальше в wordpress'e


  1. Метаинформация (МИ) - это не сам объект. Это - "досье" на него.
  2. Каждый тип объектов (музыка, видео, текст, картинки) требует своей системы системы организации МИ - своих тегов, имен, программ, заточенных на работу именно с этим типом объектов.

  3. Первичное деление файлов на видео-аудио-графику-текст - это не просто "еще один тег" - это принципиально разная информация, требующая принципиально разного подхода к работе. То есть вместо универсальной Системы Тегов Для Всего каждый из перечисленных типов данных требует своего приложения-комбайна, работающего именно на упорядочивание нужной информации. Пусть музыку упорядочивает плейер, фильмы - проигрыватель, графику - просмотрщик, текст - полнотекстовый поисковик в связке с редактором.

    Понимание этого должно в разы сократить количество метаинформации и упростить работу с ней, в то время, как система тегов, распространенная на абсолютно все рискует разбухнуть до размеров орфографического словаря (а если учесть ошибки в написании - то до словаря в квадрате) и требовать адового количества работы по обслуживанию и поиску нужной информации.

    В теории можно завести универсальный справочник на все виды оружия с общим шаблоном сразу. Но никто так не делает. Зато есть справочники по танкам, самолетам, кораблям и стрелковому оружию. Вполне компактные и удобные. А графа "Водоизмещение" будет глупо смотреться в УниверсальномСправочникеВсегоОружия по отношению к АК47 или М16. Как и "Калибр" и "Емкость магазина" по отношению к авианосцу "Дж.Буш".

  4. Для аудио и видео такие системы уже есть - freedb и imdb. Что уже снижает объем работы в разы. Софт уже давно сведен в репозитории и ставится-обновляется-настраивается (хвала apt и dpkg) автоматом. Самый близкий пример - это ритмбокс, который сам подхватывает музыкальные файлы и раскладывает их по альбомам-рейтингу-рейтингу-пользователя и всему такому прочему по ходу дела расставляя пропущенные теги. Лично для меня такая система избыточна, но это детали :)


  5. Для фото услиями гугла (пикаса) и софта типа F-Spot такие системы уже создаются ("что-где-когда-кто").

    Тексты лучше всего сортировать полнотекстовым поиском (см Раскина).

    Для видео пока такая система избыточна. Однако, наверняка есть видеокомбайны со своими библиотеками, позволяющими разложить фильм по нужным параметрам.

    Что остается для организации?

    Мелочи. В моей системе - это карты, манга, диктофонные записи и сканированные книги. Тема на подумать.

  6. К вышеописанному нужна взможность создавать тематические выборки по своему усмотрению. А вот тут хорошо работают симлинки - они позволяют собирать все необходимые файлы в папки-проекты, сочетая в одной сборке все виды информации. Это должно быть что-то похожее на виртуальные папки-запросы в Thunderbird. То есть чтобы по теме "Т-34" можно было получить сразу нужные тексты, список аудиолекций, видео с этим танком и подборку фотографий.

научная организация труда, софт, метаинформация, идеи, нот, инфотех

Previous post Next post
Up