Функция у нас скаляр - обычно, это потери в обучении нейросети. Имеет вид Φ(x,w), где x это входы, w - параметры, оба-два векторы. Градиент берётся по параметрам. Какое-либо расстояние между параметрами редко бывает определённым, однако "длину вектора" используют довольно часто, её вводят в функцию потерь.
Матрица Фишера это сумма внешних произведений градиентов для всех элементов входного множества:
Comments 8
Reply
Reply
Reply
Матрица Фишера это сумма внешних произведений градиентов для всех элементов входного множества:
F=Σx(∇wF(x,w))T(∇wF(x,w))
Reply
Leave a comment