Что-то я не очень соображаю... В мерах расстояний есть куча всяких разных мер сходства (PROXIMITIES) между бинарными переменными, основанных на четырёх возможных ситуациях:
А как построить матрицу расстояний, в которой было бы только количество "a", без всяких формул? Ближе всего к тому, что мне надо, видимо, формула "Рассел и Рао".
Поясняю. Речь идёт о появлении определённых пользователей ЖЖ в комментариях к одним и тем же записям. Строчки исходной таблицы - пользователи. Столбики - около 1000 записей. Я предполагаю, что количество потенциальных актов внимания (если человек появляется в посте, где уже оставил коммент кто-то другой) может влиять на некоторые вещи в их дальнейшем взаимодействии. Можно ли просто количество пересечений подсчитать, без формул близости?