Маленький код для больших данных или Spark за 3 дня

Nov 25, 2016 00:07


Пусть Жираф был не прав,
Но виновен не Жираф,
А тот, кто крикнул из ветвей:
«Жираф большой - ему видней!» (с)
Потребовалось оперативно разобраться с технологией Spark заточенную для использования Big Data. В процессе выяснения активно использовал habrahabr, так что попробую вернуть информационный должок, поделившись приобретенным опытом ( Read more... )

big data, spark

Leave a comment

Comments 16

ext_2462147 November 29 2016, 21:08:01 UTC
Дорогой Автор, а про нефть планируете что-нибудь новенькое и когда?

Reply

pustota_2009 December 3 2016, 05:21:08 UTC
Пока особо интересного ничего нет) Вот если ОПЕК начнут соблюдать согласованные квоты возникнет весьма интересный кейс для анализа того, что управляет ценами, баланс спроса и предложения или там фьючерсы-опционы, как многие думают)

Reply


slikx December 9 2016, 13:10:20 UTC
Очень интересная статья. Хотя мне Джава до конца еще непонятна.
Можно ли это применить к ценам на нефть для прогнозирования?
Анализировать ес-но фьючерсы. Как Джим О'Нил рекомендовал. :)

Reply

pustota_2009 December 11 2016, 08:31:47 UTC
Да, я уверен, что если собрать максимально возможное количество общедоступной информации (5% работы) и грамотно ее структурировать (85% работы), то после настройки модели (оставшиеся 10%) можно получить отличный результат. Другое дело, что это требует нехилых инвестиций как в плане оборудования, так и времени.

Reply


moshushi December 12 2016, 14:30:21 UTC
Спасибо. Очень интересно.

Reply


Leave a comment

Up