이번 장에서는 행렬의 곱셈과 덧셈이 중요하다. 행렬의 곱셈과 덧셈을 공부하지 않았다면, 공부하고 보길 추천한다.
이 문제를 예제 코드로 구현을 하면
이것을 처음 그림에 대입을 해서 보면 조금 더 이해하기가 쉽다.
이것의 최종출력을 하기위하여 softmax를 사용할 것이다.
하지만, 이렇게만 사용하게 된다면 값이 너무 커져, overflow가 발생할 가능성이 높다.
(a1,a2,...,an)과 (a1+C,a2+C,...,an+C) 가 같다는 것을 사용하면 overflow가 발생하는 것을 방지할 수 있다.
이것을 코드로 나타내면,
교재 : 밑바닥부터 시작하는 딥러닝 (저자 : 사이토 고키 / 번역 : 이복연 / 출판사 : 한빛미디어)
https://www.hanbit.co.kr/store/books/...
코드 : https://github.com/WegraLee/deep-lear...
강좌 홈페이지 : https://sites.google.com/site/kyungho...