Oct 22, 2014 17:28
Вдогонку к предыдущему посту.
Я сам написал систему автоматического выбора данных из предварительно загруженных коллекций файлов с данными. Опыт показывает, что пакеты, рассчитанные на автоматическую загрузку данных из сети, часто не работают, потому что администраторы хранилищ меняют положение ссылок, меняют форматы данных и так далее. Правильно организованная онлайн система требует постоянного мониторинга таких изменений, в то время как оффлайн система работает совершенно стабильно в пределах загруженных данных.
Пример - народ написал R пакет {RNCEP} для автоматической загрузки климатологических данных с сайтов хранилищ такой информации.
Kemp, M. U., van Loon, E. E., Shamoun-Baranes, J., and Bouten, W. 2011. RNCEP:global weather and climate data at your fingertips. - Methods in Ecology and Evolution. DOI:10.1111/j.2041-210X.2011.00138.x.
В принципе хорошая идея, но пакет сейчас не работает, потому что ссылки на эти базы данных поменялись, поменялся формат хранение данных, а пакет остался без изменений, потому что нет структуры, которая следила бы за такими апдэйтами и приводила программы в соответствие с текущими форматами.
Посмотрим, насколько Movebank будет мониторить качество своих приложений и пакетов.
программирование,
r_maps,
программы,
работа,
r,
базы данных