분류 전체보기

Python/Pandas

[pandas] 레이블인코딩 / 원핫 인코딩 / 문자열을 범주형 데이터로 바꾸기

컴퓨터가 읽을 수 있게 문자열 데이터를 숫자형 데이터로 바꿔주어야 한다. 여기서 우리는 각 문자열 데이터를 표현할 수 있게 범주형 데이터로 변환시킨다 1) 레이블 인코딩 from sklearn.preprocessing import LabelEncoder for col in ['Title','AgeBin']: encoder = LabelEncoder() data[col] = encoder.fit_transform(data[col]) data.loc[:,['Title','AgeBin']].head() * sklearn LabelEncoder를 불러와 LabelEncoder 객체를 만든다. * fit_transform 함수를 사용하여 각 열의 데이터(문자열)에 적용한다. * 각 열의 속하는 범주의 개수만큼 숫..

AI/Machine Learning

[ML] 머신러닝 분류 알고리즘 - SVM

SVM (support vector machine) 각 피처(열) 벡터들이 고유의 축을 갖는 벡터 공간을 이룬다고 가정한다. 모든 데이터를 벡터 공간 내의 좌표에 점으로 표시하고, 각 데이터가 속하는 목표 클래스별로 군집을 이룬다고 생각한다. (1) 모델 학습 # 모델 학습 from sklearn.svm import svc svc = SVC(kernel='rbf') svc.fit(x_train, y_train) * SVM 알고리즘이 구현된 사이킷런 svm 모듈을 이용한다. * 분류 모델일 SVC 객체를 생성하여 모델을 학습시킨다. 커널(kernel)은 데이터를 벡터 공간으로 매핑하는 함수를 말한다. (2) 예측 y_svc_pred = svc.predict(x_test) * KNN 알고리즘과 똑같이 pre..

AI/Machine Learning

KNN 분류 알고리즘 개념과 구현: 머신러닝에서 K-최근접 이웃 활용법

KNN ( K-Nearest-Neighbors)예측하려는 데이터 X가 주어지면, 기존 데이터 중 속성이 비슷한 K개의 이웃을 먼저 찾는다. 다시 말해 데이터 X를 둘러싼 K개의 가장 가까운 이웃을 찾고, 이웃 데이터가 가장 많이 속해 있는 목표 클래스를 예측값으로 결정한다.(1) 모델학습# sklearn 라이브러리에서 KNN 분류 모형 가져오기from sklearn.neighbors import KNeighborsClassifierknn = KNeighborsClassifier(n_neighbors=7)knn.fit(x_train, y_train)* n_neighbors 옵션으로  k값을 지정한다. * KNeighborsClassifier() 함수로 KNN모형 객체를 생성한다.* fit()  메소드에 훈..

Python/Pandas

[Pandas] 데이터 살펴보기 / head,tail,info,describe,shape,count,value_counts

데이터 살펴보기¶ head(n) : 처음 n개의 행을 보여줌 / tail(n) : 마지막 n개의 행을 보여줌¶ In [1]: import pandas as pd df = pd.read_csv('C:\\Users\\rladl\\Jupyter.study\\05000266\\part3\\auto-mpg.csv', header=None) df.columns = ['mpg','cylinders','displacement','horsepower','weight','acceleration','model year','origin','name'] print(df.head()) print('\n') print(df.tail()) mpg cylinders displacement horsepower weight acceler..

kylo
'분류 전체보기' 카테고리의 글 목록 (59 Page)