Любая задача машинного обучения - это задача оптимизации, а задачи оптимизации удобнее всего решать градиентными методами (если это возможно, конечно). Поэтому важно уметь находить производные всего, что попадается под руку. Казалось бы, в чём проблема: ведь дифференцирование - простая и понятная штука (чего не скажешь, например, об интегрировании
(
Read more... )