Machine Learning

가중치를 0으로 초기화 하지 않는 이유

SKaSha 2020. 1. 18. 18:43

가중치를 0으로 초기화하지 않는 이유는 가중치가 0이 아니어야 분류 결과에 영향을 주기 때문입니다.
가중치가 0으로 초기화 되어 있다면 학습률(learning rate: r)은 가중치 벡터의 방향이 아니라 크기에만 영향을 미칩니다.

가중치 w가 업데이트 되는 공식은 다음과 같이 정의할 수 있습니다.

$$ \Delta w_i = r(y - y')x $$

퍼셉트론 학습 규칙에서 초기 가중치를 0으로 놓으면

$$ w_1 = w_0 + \Delta w_1 $$

$$ = w_0 + r(y_1 - y_1')x_1 $$

$$ = w_0 + r(y_1 - \Phi(w_0x_1))x_1 $$

$$ = r(y_1 - \Phi(0))x_1 $$

$$ = r(y_1 - 1)x_1 $$

위와 같이 정리가 됩니다.

그러면 학습률 r은 가중치 벡터의 크기에만 영향을 미치게 됩니다.
w0 값이 0이 아니라면 학습률에 따라 w1 방향이 바뀝니다.