В исходной постановке моей задачи оценки сентимента есть такой момент.
Для каждого предложения, в которой есть оценка какого-то аспекта, необходимо получить еще и непосредственное оценивающее словосочетание, например:
Исходное предложение: суп был очень вкусный
Оценивающее словосочетание: очень вкусный суп
Особых проблем не возникает, когда оценка выражается парой прилагательное+существительное с опциональным наречием-модификатором, как в вышеприведенном примере. Изначально я пошел именно по этому пути, но он быстро уперся в общие ограничения rule-based подхода. В частности, он не позволяет без больших костылей получать словосочетания для таких случаев:
нам очень отель понравился → очень хороший отель
в отеле было комфортно → комфортный отель
не понравилась духота в отеле → душный отель
в номере царит неприятный сумрак → плохо освещенный отель
Предварительный анализ этой задачи показывает, что она является NLP-вариантом горячей темы "
Image Captioning" или "реферирование документа". Что означает, что тут можно применить готовый подход на сетках.