calculus

Gradient (vectơ građien)

Gradient của một hàm nhiều biến f(x,y,...) là vectơ các đạo hàm riêng. Nó chỉ theo hướng tăng nhanh nhất và là nền tảng của hạ gradient.

Gradient của f(x1,,xn)f(x_1, \ldots, x_n) là vectơ gồm tất cả các đạo hàm riêng: f=(f/x1,,f/xn)\nabla f = (\partial f/\partial x_1, \ldots, \partial f/\partial x_n).

Diễn giải hình học: tại điểm bất kỳ, f\nabla f chỉ theo hướng tăng nhanh nhất, với độ lớn bằng tốc độ biến thiên theo hướng đó.

Để tìm cực đại/cực tiểu địa phương, đặt f=0\nabla f = \vec{0} và kiểm tra các điều kiện bậc hai. Để cực tiểu hóa (ví dụ hàm mất mát trong ML), đi theo hướng f-\nabla f — đây là hạ gradient, xương sống của học máy hiện đại. Các biến thể (momentum, Adam, RMSprop) đều xây dựng trên ý tưởng này.

Gradient vuông góc với các đường mức của hàm. Đạo hàm theo hướng u\vec{u} (vectơ đơn vị) là fu\nabla f \cdot \vec{u}.