Jan 20, 2011 09:12
Не вдаваясь в подробности:
1. Будут отрезаны индексаторы, то есть останется только поиск по 'живым документам'.
2. Будет сделан упор на разнообразную обработку документов, в дополнение к поиску в них паттернов. В частности, обработка документов будет включать частотный анализ текста (база N-грамм) и определение тематики.
Старая версия движка останется в faind.win32.dll, сборка с новой архитектурой будет в каком-то новом dll/so.
поисковый движок