MNIST
이번 장에서는, 고등학생과 미국 인구조사국 직원들이 손으로 쓴 70,000개의 작은 숫자 이미지를 모은 MNIST 데이터셋을 사용하여, 공부해보겠다. MNIST의 데이터셋은 0부터 9까지 손글씨 이미지로 구성되어있다. 개개인의 필기체가 다름으로, 필체 변형이 너무 많은 문제가 있어서, 규칙을 임의로 정해서 해결하기 어려운 문제가 있다. 스팸으로 예를 들면, 대출 이라는 단어를 스팸으로 분류하고 싶다. 하지만 대출, 대%출, 대&&출 등 우리가 임의로 규칙을 정해도 피해갈 방법은 많다. 이를 해결하기 위해, 해당 레이블(정답)을 학습시키는 것을 택하였다. 코드에 들어가기 앞서, 컴퓨터는 사람 처럼 직관적으로 보는 게 아닌, 이미지 행렬로 바꿔서 본다. 흑백 이미지는 행렬로 나타내고, 컬러 이미지는 3차원 ..
연구실
2024. 1. 25. 19:31