Завтра у меня очередная встреча, посвященная BigData для аналитиков. К нам на занятие придут специалисты из IBM. Программа заявлена интересная.
Коллеги из IBM обещают рассказать про продукт Modeler, который позволяет пользоваться инструментами машинного обучения без знания языков программирования. Также расскажут про Analytical Server, который позволяет конвертировать модели, сделанные с помощью Modeler в задания MapReduce и вычислять их на Hadoop.
Кроме того, представят кластер Big Insight, сделанный в IBM поверх Hadoop с дополнительными усовершенствованиями, по сравнению с обычным Hadoop, по части стабильности, производительности и безопасности. Обещают рассказать про инструменты работы с данными поверх этого кластера, такими как BigSQL (аналог Hive), Big R (реализация языка R) и BigSheets (аналитический инструмент поверх Hadoop с интерфейсом от Excel).
Это будет в понедельник. Также в понедельник 4 апреля
начинаются занятия у третьего курса Школы данных Билайн.
+ +Что еще я писал о занятиях.
Data-MBA для менеджеров
-
Анонс: Data MBA для менеджеров и бизнесменов-
Что было на втором занятии (Машинное обучение, методы, метрики, инструменты анализа "малых данных", инструменты анализа Big Data, бизнес-процесс работы с Big Data, подготовка специалистов в области Big Data, кейс Титаник, обработка текстов).
-
Третье занятие "Анализ текста", Петр Ермаков, краткий конспект
- Четвертое занятие "Рекомендательные системы", Александр Крот, фрагмент полного конспекта (см. выше).
Школа данных Билайн. Машинное обучение и Big Data
-
Завтра у меня первое занятие в Школе данных Билайн (анонс)-
Анонс Школы данных Билайн на хабре-
Как прошло мое первое занятие-
Как прошло мое третье занятие-
Краткий конспект по теме Patter Mining. Частые множества и ассоциативные правила
полезная ссылка на практику:
16 ядер и 30 ГБ под капотом вашего Jupyter за $0.25 в час, Юрий Кашницкий
+ +