Dec 05, 2014 09:44
Если спарсифицировать векторные представления слов от w2v, то простое сложение векторов слов должно работать как мягкий хэш-код.
Вопрос в том, как получить sparse вектора вместо текущих dense.
Первый путь - ввести в нейросеть v2w регуляризацию, поощряющую sparse активность компонентов вектора.
Второй путь - выполнить спарсификацию готовых dense векторов, не трогая w2v.
семантика,
word2vec,
word embedding