Еще одна ложка джема: karmike

karmike

Еще одна ложка джема

Oct 31, 2014 10:14

Еще два параграфа из статьи Helander, M., Lawrence, R., Liu, Y., Perlich, C., Reddy, C., Rosset, S. Looking for Great Ideas: Analyzing the Innovation Jam:

Источники данных:

1. Тексты самих нитей. Из анализа текста мы можем найти сходство между нитями, понять, насколько плотным было обсуждение в каждой нити, определить ключевые слова, различающиеся между потоками.
2. Структура социальной сети нитей и всего Джэма. В каждом потоке, мы можем проанализировать структуру обсуждения, а также собирать статистику например, сколько "листьев" (постингов без ответа) было, насколько глубоко типичное обсуждение в теме, и т.д. Так как у нас есть уникальные идентификаторы для всех участников, мы также можем проанализировать связь между нитями через общих вкладчиков, разнообразие вкладчиков в каждой нити (например, сообщения в плакате).
3. Организационные отношения между участниками. Поскольку подавляющее большинство вкладчиков были сотрудники IBM, мы можем воспользоваться всемирным онлайн-каталогом сотрудников IBM (известным как Голубые Страницы), чтобы извлечь организационные и иерархические отношения между участниками в каждой нити, в каждой Большой Идее, и т.д. В силу распространенной гипотезы о том, что основным преимуществом Джэма является то, что он собирает вместе людей из различных частей корпорации IBM, а также из различных географических точек, которые иначе вряд ли смогли взаимодействовать - и что такие взаимодействия между различными группами, вероятно, приведут к новым идеям и инновациям - эти данные представляет особый интерес для нашего анализа.
Мы исследовали взаимосвязь между нашими 18 признаками и переменной отклика - была или не была выбрана каждая "большая идея" как финалист для финансирования. Мы применил параметрический Т-тест, и два непараметрических теста (Колмогорова-Смирнова и Манна-Уитни, [5]), чтобы проверить гипотезу о разности в распределениях Р (признак | выбран) и P (признак | не выбран) для каждого из 18 признаков. Результаты (таблица 3) продемонстрировали, что нет никаких доказательств того, что какой-либо из признаков несет значимую информацию о процессе выбора. Последний признак, минимальное попарное расстояние между участниками, приводит к р-значение, которое меньше, чем 0,05 за пару тестов, но, учитывая количество кратных сравнений, которые мы делаем, это никак нельзя считать доказательством реального объединения. Таким образом, мы можем заключить, что наши 18 признаков не в состоянии захватить "сущность" Джэма, как она относится к решениям финансирования финалистов. Выявление и формализация эту «сущности» остается темой для будущей работы.

******************

Плюс контент-анализ онлайн, который нам будет показывать, где обсуждение роится вокруг интересующих на тем.

В общем и целом, эта система позволяет отслеживать возникновение и развитие новых тем (дискурсов) в реальном масштабе времени и в обсуждениях, где принимают участие десятки и сотни тысяч человек.

Находить и извлекать полезное. Направлять в растущие темы модераторов и фацилитаторов высшего уровня.
Ну, и так далее.
Элементы мегамашины конструируются у нас на глазах.

мегамашина, экспертная сеть