Jul 18, 2014 10:47
Начала слушать интересные лекции курса «Introduction to Data Science» на Курсере.
Совсем недавно говорили о том, что сейчас самый модный тренд - это Big Data, «большие данные», объемы которых увеличиваются каждую минуту, но их нужно как-то анализировать.
Данный курс - как раз некоторое введение в эту тему.
Не уверена, что буду выполнять все задания - там и Питон,
и R, и SQL, но пока первая лекция заинтересовала.
Началась она с примеров - как можно было предсказать победу Обамы на выборах, как выглядить самый простой алгоритм ранжирования веб-страниц (просто сортировка по количеству ссылок на данную страницу).
Или, вот, например, - что полезного можно сделать с тегами пользователей на Last.fm? Построить графики популярности музыкальных жанров по годам.
Еще приводился пример с анализом всех бумажных книг и измерением настроения по этим текстам за XX век. На графике был хорошо виден резкий спад веселья с 1939 года и до 1945 года - во время Второй мировой войны.
А, кстати, начиная с конца 80-х годов, стал расти уровень страха. Интерпретацию придумайте сами :-)
онлайн-обучение