분류는 이진분류 아니면 다중분류다.
3개 이상의 클래스로 분류하는 경우
최종 layer의 activation은 ‘무조건’ softmax를 사용한다.
부드러운 최대값이라는 은어로 각 클래스에 확률을 부여해 출력한다.
가장 높은 확률값을 정답이라고 생각하는것.
softmax를 사용할때에는 출력되는 y의 컬런값을 클래스의 수 만큼 맞춰줄 필요가 있다.
이 때 사용하는 함수가 one hot encoder.
텐서플로, 판다스, 사이킷런에서 제공하는 세가지 함수가 있으며
원 핫 인코더는 데이터를 수치가 아닌 ‘위치’로 표현함으로써
분류에서는 0이라는 데이터와 1이라는 데이터가 합쳐진다고 해서 1이라는 데이터가 아니게 해준다.
keras19_softmax4_fetch_covtype_1