편미분은 미분의 한 종류로, 여러 개의 변수를 가진 함수에서 특정 하나의 변수에 대해서만 미분하는 것을 말한다.
앞에서 다룬 일반적인 미분은 변수 하나만 있는 함수, 예를 들어 f(x)처럼 x에 대해서만 정의된 함수에 적용된다. 그런데 실제 문제에서는 두 개 이상의 변수를 가지는 함수가 자주 등장한다. 예를
들어, 다음과 같은 함수가 있을 수 있다:
f(x,y)
= 2x2 +3y + 4
이 함수는 변수 x와 y의 값을 입력으로 받아서 결과를 계산하는 함수이다. 이처럼 두 개 이상의 변수를 가진 함수에서 한 변수만 변화시킬 때의 변화율을 구하는 것, 이것이 바로 편미분이다.
편미분
예를 들어, 위 함수에서 x에
대해 편미분하고 싶다면, y는 그냥 상수처럼 취급하고 x에 대해서만 미분하면 된다. 마찬가지로 y에 대해 편미분할 때는 x를 상수로 간주한다.
이때 쓰는 기호는 일반 미분과 다르게 ∂(파샬) 기호를 사용한다. 함수
전체와 미분 대상인 변수 앞에 ∂를 붙이는 것이 특징이다. 예를
들어,
이렇게 각각 x와 y에
대해 편미분한 결과를 구할 수 있다.
편미분은 신경망 학습에서 아주 중요한 개념이다. 왜냐하면 대부분의
신경망은 수많은 가중치(weight)와 편향(bias)이라는
여러 개의 변수로 구성되어 있고, 이 변수들 각각에 대해 하나씩 편미분을 해야 학습이 가능하기
때문이다.
다시 말해, 편미분은 여러 입력 중 어떤 하나가 결과에 얼마나 영향을 주는지를 계산하는 도구다. 이 개념을 이해하면 강화학습이나 딥러닝에서 파라미터를 조정하는 방식이 더욱 명확하게 보일 것이다. 어렵게 느껴질 수 있지만, “하나만 바꾸고 나머지는 고정한다”는 원칙만 기억하면 생각보다 간단하다.
편미분 활용
함수 f(x,y)= x2 + xy + y2는
변수 x와 y로 이루어진
2변수 함수로, 이를 그래프로 표현하면 마치 부드럽게 솟은 3차원 곡면(surface)의 형태를 가지게 된다. 이처럼 두 변수로 구성된 함수는 x축, y축, 그리고 높이를 나타내는 z축(= 함수값)으로 구성되어 입체적인 모습을 그린다.
이제 이 함수를 x에 대해 편미분해 보자. 이때 중요한 점은, y는 상수로 간주한다는
것이다. 즉, y는 변하지 않는 값이라 보고 x에 대해서만 미분하는 것이다.
이 결과는 "x가 변할 때,
y가 고정되어 있다면 함수값이 얼마나 변하는가"를 나타낸다. 예를 들어, (x,y)=(1,1)일 때 이 편미분 함수의 값은 다음과
같다:
이 값 3은, 지점 (1,1)에서 x 방향으로의 순간 변화율을 의미한다. 다시 말해, 이 3이라는
수는 x값이 아주 조금 변할 때, 함수값이 얼마나 민감하게
반응하는지를 보여준다. 그리고 이때 y값은 고정된 1이라는 전제 하에 이루어진 결과다.
직관적으로 생각해 보면, 우리는 이 편미분을 통해 "y가 1일 때, x값이
조금씩 변하면 곡면의 기울기가 어떻게 바뀌는가?"를 알 수 있는 것이다. 즉, 편미분 결과인 2x+y는
이 지점에서의 x 방향 접선의 기울기를 알려주는 역할을 한다.
이처럼 편미분은 한 방향의 영향만을 따로 떼어내서 관찰할 수 있게 해주는 도구로, 곡면 위의 특정 위치에서 어떤 방향으로의 변화율이 얼마나 되는지를 이해하는 데 핵심적인 역할을 한다. 이러한 개념은 머신러닝과 강화학습의 최적화 과정에서 각 변수들이 결과에 얼마나 영향을 주는지를 파악할 때 매우
유용하게 쓰인다.