(no subject)

Dec 15, 2005 12:16

Господа!
Объясните кто-нибудь на пальцах как делается поиск, когда индекс распределен по серверам.
Допустим (для простоты), на одном сервере лежат (или можно получить каким-то образом) ID документов, содержащих слово "мама", на другом ID документов, содержащих слово "мыла", на третьем - "раму". Так как же выяснить, какие документы содержат все три слова сразу, если документов немеряное количество (в гугле это сотни миллионов документов на каждое слово)
Если эти данные сливать в одно место, а потом анализировать, это же очень долго будет.
Наверно я чего-то не понимаю.
Previous post Next post
Up