Folksonomy to Taxonomy

Jul 27, 2017 11:10

Помощи пост, а то моё google-fu оказалось слабо. Сейчас тема data science очень модная, может кто встречал алгоритмы/фреймворки позволяющие преобразовать плоские списки пользовательских тегов в иерархические таксономии? Конкретно: есть 8000+ книг с тегами, хочется задать им иерархическую классификацию ( Read more... )

data science, natural language processing

Leave a comment

Comments 4

thesz July 27 2017, 06:37:21 UTC
Сие задача кластеризации - для каждого "тэга" можно выбрать кластер документов, отсортировать метки по количеству документов в кластере и выбрать M покрывающих все документы. Это метки верхнего уровня. Далее внутри каждой метки выполнить схожую процедуру.

Reply

shadow_ru July 27 2017, 06:45:13 UTC
Спасибо за наводку.

Reply


sharpc November 7 2017, 19:00:45 UTC
Получилось ли у вас? Я собирался использовать ББК и аналоги из либгена и semi-supervised NLP разбросать остальное.

Reply

shadow_ru November 10 2017, 17:01:09 UTC
Прошу прощения за задержку с ответом. Увы, с наскока не получилось, и я сливал книжки в calibre без тегов, а потом и со сливом притормозил, так как работы много было.

У меня в планах значится поближе с data science познакомиться, но когда до этого руки дойдут.

Если у Вас получится, был бы признателен за ссылку или комментарий.

Reply


Leave a comment

Up