분류 문제 출력하는 타깃 클래스가 두 개뿐인 학습 작업을 이진 분류(binary classification)라고 한다. {예, 아니요}, {빨강, 검정}, {진실, 거짓} 같은 타깃을 가진 문제들은 수학적으로 {-1, +1} 혹은 {0, 1}로 표현된다. 세 가지 이상의 타깃 클래스가 있는 문제를 다중 범주(multiclass) 문제라고 한다. 분류 모델 생성 과정 1. 데이터셋 준비 sklearn에 내장된 iris(붓꽃) 데이터셋은 대표적인 간단한 분류 데이터셋이다. 20세기 중반 통계학자인 로널드 피셔 경(Sir Ronald Fisher)이 우리가 현재 '분류'라고 하는 내용을 다룬 초기 학술 논문에 등장하여 가끔 피셔의 iris 데이터셋이라고도 한다. 데이터의 각 행은 붓꽃 하나를 꽃받침과 꽃잎의 ..