편미분(Partial Derivative)

편미분은 미분의 한 종류로, 여러 개의 변수를 가진 함수에서 특정 하나의 변수에 대해서만 미분하는 것을 말한다.

앞에서 다룬 일반적인 미분은 변수 하나만 있는 함수, 예를 들어 f(x)처럼 x에 대해서만 정의된 함수에 적용된다. 그런데 실제 문제에서는 두 개 이상의 변수를 가지는 함수가 자주 등장한다. 예를 들어, 다음과 같은 함수가 있을 수 있다:

f(x,y) = 2x2 +3y + 4

이 함수는 변수 x y의 값을 입력으로 받아서 결과를 계산하는 함수이다. 이처럼 두 개 이상의 변수를 가진 함수에서 한 변수만 변화시킬 때의 변화율을 구하는 것, 이것이 바로 편미분이다.

편미분

예를 들어, 위 함수에서 x에 대해 편미분하고 싶다면, y는 그냥 상수처럼 취급하고 x에 대해서만 미분하면 된다. 마찬가지로 y에 대해 편미분할 때는 x를 상수로 간주한다.

이때 쓰는 기호는 일반 미분과 다르게 ∂(파샬) 기호를 사용한다. 함수 전체와 미분 대상인 변수 앞에를 붙이는 것이 특징이다. 예를 들어,

이렇게 각각 x y에 대해 편미분한 결과를 구할 수 있다.

편미분은 신경망 학습에서 아주 중요한 개념이다. 왜냐하면 대부분의 신경망은 수많은 가중치(weight)와 편향(bias)이라는 여러 개의 변수로 구성되어 있고, 이 변수들 각각에 대해 하나씩 편미분을 해야 학습이 가능하기 때문이다.

다시 말해, 편미분은 여러 입력 중 어떤 하나가 결과에 얼마나 영향을 주는지를 계산하는 도구다. 이 개념을 이해하면 강화학습이나 딥러닝에서 파라미터를 조정하는 방식이 더욱 명확하게 보일 것이다. 어렵게 느껴질 수 있지만, “하나만 바꾸고 나머지는 고정한다는 원칙만 기억하면 생각보다 간단하다.

편미분 활용

함수 f(x,y)= x2 + xy + y2는 변수 x y로 이루어진 2변수 함수로, 이를 그래프로 표현하면 마치 부드럽게 솟은 3차원 곡면(surface)의 형태를 가지게 된다. 이처럼 두 변수로 구성된 함수는 x, y, 그리고 높이를 나타내는 z(= 함수값)으로 구성되어 입체적인 모습을 그린다.

이제 이 함수를 x에 대해 편미분해 보자. 이때 중요한 점은, y는 상수로 간주한다는 것이다. , y는 변하지 않는 값이라 보고 x에 대해서만 미분하는 것이다.

이 결과는 "x가 변할 때, y가 고정되어 있다면 함수값이 얼마나 변하는가"를 나타낸다. 예를 들어, (x,y)=(1,1)일 때 이 편미분 함수의 값은 다음과 같다:

이 값 3, 지점 (1,1)에서 x 방향으로의 순간 변화율을 의미한다. 다시 말해, 3이라는 수는 x값이 아주 조금 변할 때, 함수값이 얼마나 민감하게 반응하는지를 보여준다. 그리고 이때 y값은 고정된 1이라는 전제 하에 이루어진 결과다.

직관적으로 생각해 보면, 우리는 이 편미분을 통해 "y 1일 때, x값이 조금씩 변하면 곡면의 기울기가 어떻게 바뀌는가?"를 알 수 있는 것이다. , 편미분 결과인 2x+y는 이 지점에서의 x 방향 접선의 기울기를 알려주는 역할을 한다.

이처럼 편미분은 한 방향의 영향만을 따로 떼어내서 관찰할 수 있게 해주는 도구, 곡면 위의 특정 위치에서 어떤 방향으로의 변화율이 얼마나 되는지를 이해하는 데 핵심적인 역할을 한다. 이러한 개념은 머신러닝과 강화학습의 최적화 과정에서 각 변수들이 결과에 얼마나 영향을 주는지를 파악할 때 매우 유용하게 쓰인다.

댓글 쓰기

Please Select Embedded Mode To Show The Comment System.*

다음 이전