Итак, на "прямоточной" feedforward сетке с 4 слоями корпус оценок начал обрабатываться с точностью до 91% (тут
http://kelijah.livejournal.com/199059.html). При этом на входе были word2vec векторы слов без лемматизации. В принципе, уже неплохо. Но!
Оказалось, что если взять
сверточную сетку, подать ей лемматизированные предложения с cutoff по частоте дабы уменьшить размерность, то точность модели достигает почти 96%!
Сам корпус оценок - это что-то типа:
Теперь остается сделать модель для определения ТЕМЫ предложения, чтобы суперпозиция двух моделей позволяла определять оценку питания, размещения и так далее - по отдельным аспектам.