인공신경망

연구실

by myeongjaechoi 2024. 1. 24. 19:49

이번 장에서는 행렬의 곱셈과 덧셈이 중요하다. 행렬의 곱셈과 덧셈을 공부하지 않았다면, 공부하고 보길 추천한다.

이 문제를 예제 코드로 구현을 하면

이것을 처음 그림에 대입을 해서 보면 조금 더 이해하기가 쉽다.

이것의 최종출력을 하기위하여 softmax를 사용할 것이다.

하지만, 이렇게만 사용하게 된다면 값이 너무 커져, overflow가 발생할 가능성이 높다.

(a1,a2,...,an)과 (a1+C,a2+C,...,an+C) 가 같다는 것을 사용하면 overflow가 발생하는 것을 방지할 수 있다.

이것을 코드로 나타내면,

교재 : 밑바닥부터 시작하는 딥러닝 (저자 : 사이토 고키 / 번역 : 이복연 / 출판사 : 한빛미디어)

MJK