20 строк кода и 120 тыщ человек

May 15, 2007 19:03

Давно было интересно посмотреть на социализацию ЖЖ, насколько переплетены тут френдсвязи.
Помните фразу о том, что все на Земле родственники не далее чем в N поколении? Тут похожая картинка.

Интерес вылился в 20 строк кода:

Шаг 0 Задаю свой ник и скачиваю своих френдов (Первый круг). (Взаимные + зафрендил я + зафрендили меня). 130 человек + собственно я.

Шаг 1 Скачиваю френдов тех 130 френдов (Второй круг). Через пару минут получаю 16010 френдов френдов.

Шаг 2 Запускаю скачку френдов френдов френдов (Третий круг). Через полчаса или больше скачалось только 6% (1016/16010). И уже в третьем круге 103935 человек.

Считаются, напомню, все френд-отношения, не включая комьюнити, без повторов.
Если докачать 3ий круг, думаю это будет большой процент русской блогосферы. Пока же случайно заданые ники вполне находятся в БД.
Чем дальше - тем меньше загружается френдов, все и так уже есть в БД. Какой-то парень зафрендил 20000 чел. Добавилось только 2000, остальные 18000 уже были в базе.

В этои виде докачивать не буду, вначале напишу более подробный экстактор, чтоб и френдсвязи были видны, ещё может что-то. А потом построить какую-нить картинку на базе этого.

PS файл-лист. Сказал бы "ищите там своих френдов", да наверняка вас уже заграбил, надо искать каких-нить френдов френдов.

кодинг, исследования, livejournal, php, наблюдения, by_non

Previous post Next post
Up