AI

AI/Machine Learning

[ML] 머신러닝 모델의 오차행렬, 정확도, 정밀도, 재현율 구하기

목차 1. 오차 행렬 2. 정확도 3. 정밀도 4. 재현율 (1) 오차 행렬 : 이진 분류에서 성능 지표로 활용되며, 학습된 분류 모델이 예측을 수행하면서 얼마나 헷갈리고 있는지도 함께 보여주는 지표이다. * TN는 예측값을 Negative 값 0으로 예측했고 실제 값 역시 Negative 값 0 * FP는 예측값을 Positive 값 1로 예측했는데 실제 값은 Negative 값 0 * FN은 예측값을 Negative 값 0으로 예측했는데 실제 값은 Positive 값 1 * TP는 예측값을 Positive 값 1로 예측했는데 실제 값 Positive 값 1 # 오차 행렬 구해보기 from sklearn.metrics import confusion_matrix print(confusion_matrix(..

AI/Machine Learning

[ML] 머신러닝 교차 검증- KFold, Stratified KFold, cross_val_score()

파이썬 머신러닝 가이드 책을 참고하였습니다. 목차 1. KFold 2. Stratified KFold 3. cross_val_score() ○ 데이터 불러오기 from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score from sklearn.model_selection import KFold from sklearn.datasets import load_iris import numpy as np iris = load_iris() features = iris.data label = iris.target dt_clf = DecisionClassifier(random_state=156) (1) 교차검증 (KF..

AI/Machine Learning

[ML] 머신러닝 기초 다지기 / fit, predict, train_test_split, accuracy_score

파이썬 머신러닝 가이드 책을 참고하였습니다. ● 붓꽃 데이터 로딩하기 import pandas as pd from sklearn.datasets import load_iris # 붓꽃 데이터 불러오기 iris = load_iris() # iris.data는 데이터 세트에서 피처만으로 된 데이터를 NUMPY로 가지고 있음 iris_data = iris.data # iris.target은 데이터 세트에서 레이블 데이터를 NUMPY로 가지고 있음 iris_label = iris.label iris_df = pd.DataFrame(data=iris_data, columns=iris.feature_names) iris_df['label'] = iris.target 추가적으로 * iris.target_names는 ..

AI/Machine Learning

[ML] 머신러닝 분류 알고리즘 - SVM

SVM (support vector machine) 각 피처(열) 벡터들이 고유의 축을 갖는 벡터 공간을 이룬다고 가정한다. 모든 데이터를 벡터 공간 내의 좌표에 점으로 표시하고, 각 데이터가 속하는 목표 클래스별로 군집을 이룬다고 생각한다. (1) 모델 학습 # 모델 학습 from sklearn.svm import svc svc = SVC(kernel='rbf') svc.fit(x_train, y_train) * SVM 알고리즘이 구현된 사이킷런 svm 모듈을 이용한다. * 분류 모델일 SVC 객체를 생성하여 모델을 학습시킨다. 커널(kernel)은 데이터를 벡터 공간으로 매핑하는 함수를 말한다. (2) 예측 y_svc_pred = svc.predict(x_test) * KNN 알고리즘과 똑같이 pre..

kylo
'AI' 카테고리의 글 목록 (4 Page)