Источники:
http://aws.amazon.com/elasticmapreduce/ http://habrahabr.ru/post/56254/ Elastic MapReduce - вебсервис, который позволят с легкостью обрабатывать огромные количества разнообразных данных. Сервис основан на совместном использовании EC2 и S3, а также фреймворка Hadoop.
По заверениям Amazon, используя Elastic MapReduce вы с легкостью сможете:
- разрабатывать приложения для обработки большого массива данных на любом удобном для вас языке: Java, Ruby, Perl, Python, PHP, R, or C++.
- Загружать данные и приложения по их обработке в Amazon S3. Надежность, масштабируемость, легкость в использовании - это все он, Amazon S3.
- Стартовать через AWS Management Console так называемый MapReduce «job flow». Вы просто напросто выбираете нужный инстанс Amazon EC2, далее выбираете путь к данным и приложению по их обработке, которые находятся на Amazon S3, нажимаете кнопку «Создать Job Flow» и MapReduce начнет свою работу.
- Мониторить статус job flow посредством AWS Management Console, коммандной строки или же специального API. После окончания работы результат помещается в Amazon S3.
080812