Jun 17, 2008 17:07
Что-то я запутался. Как сжимать document-term матрицы с бинарными значениями (i,j=1 если термин i присутствует в документе j; i,j=0 иначе) знаю, а как сжимают такие матрицы, если в них хранятся tf-idf значения? Также, т.е. tf-idf значение просто считается бинарной строкой? Или есть какие-то особенности? Если есть, то подскажите пожалуйста пару-другую статей об этом.