Градиент функции — это вектор всех частных производных: .
Геометрическая интерпретация: в любой точке указывает в направлении наискорейшего возрастания, а его модуль равен скорости изменения в этом направлении.
Чтобы найти локальные максимумы/минимумы, полагают и проверяют условия второго порядка. Чтобы минимизировать (например, функцию потерь в машинном обучении), движутся в направлении — это градиентный спуск, становой хребет современного машинного обучения. Все его варианты (моментум, Adam, RMSprop) строятся на этой идее.
Градиент перпендикулярен линиям уровня функции. Производная по направлению (единичный вектор) равна .