Der Gradient von ist der Vektor aller partiellen Ableitungen: .
Geometrische Deutung: An jedem Punkt zeigt in die Richtung des steilsten Anstiegs, wobei sein Betrag der Änderungsrate in dieser Richtung entspricht.
Um lokale Maxima/Minima zu finden, setzt man und prüft die Bedingungen zweiter Ordnung. Zum Minimieren (z. B. einer ML-Verlustfunktion) bewegt man sich in Richtung — das ist der Gradientenabstieg, das Rückgrat des modernen maschinellen Lernens. Varianten (Momentum, Adam, RMSprop) bauen alle auf dieser Idee auf.
Der Gradient steht senkrecht auf den Niveaulinien der Funktion. Die Richtungsableitung in Richtung (Einheitsvektor) ist .