사이킷런 2

[Python] 딥 러닝 프레임워크:: Tensorflow, Keras, Scikit-learn, Gensim, NLTK

파이썬을 설치하고 나서 딥 러닝에 바로 도입하고자 한다. 그렇다면 제일 먼저 해야 할 것은 딥 러닝 프레임워크를 구축하는 것이다. 아나콘다를 설치했다면 기본적으로 Numpy, Pandas, Jupyter notebook, scikit-learn, matplotlib, seaborn, nltk 등이 깔려 있을 것이다. 만약 아나콘다를 사용하지 않는다면, 파이썬 가상 환경 설치 포스팅을 참고하여 가상 환경을 만들고 그 위에 패키지들을 pip로 설치하면 된다. 텐서플로우(Tensor flow) 텐서플로우는 구글이 2015년에 공개한 머신 러닝 오픈소스 라이브러리이다. 머신 러닝과 딥 러닝을 직관적이고 손쉽게 할 수 있도록 설계되었다. 텐서플로우를 사용하면 손쉽게 모델 빌드가 가능하고, 사용하는 언어에 상관없이..

CS 2021.01.21

[Machine Learning] 범주 예측: 분류 모델 생성 과정

분류 문제 출력하는 타깃 클래스가 두 개뿐인 학습 작업을 이진 분류(binary classification)라고 한다. {예, 아니요}, {빨강, 검정}, {진실, 거짓} 같은 타깃을 가진 문제들은 수학적으로 {-1, +1} 혹은 {0, 1}로 표현된다. 세 가지 이상의 타깃 클래스가 있는 문제를 다중 범주(multiclass) 문제라고 한다. 분류 모델 생성 과정 1. 데이터셋 준비 sklearn에 내장된 iris(붓꽃) 데이터셋은 대표적인 간단한 분류 데이터셋이다. 20세기 중반 통계학자인 로널드 피셔 경(Sir Ronald Fisher)이 우리가 현재 '분류'라고 하는 내용을 다룬 초기 학술 논문에 등장하여 가끔 피셔의 iris 데이터셋이라고도 한다. 데이터의 각 행은 붓꽃 하나를 꽃받침과 꽃잎의 ..

AI 2020.10.21