Python

Python/Python

파이썬 문자열 메소드 / split(), join(), strip()

[1]. split() : 문자열을 분리해주는 함수 split은 문장을 특정 규칙에 의해 쪼개주는 기능을 한다. 분리한 결과는 list 형식으로 값을 리턴 받는다. default 값으로 공백이 지정되어 있다. ( 즉, 공백을 기준으로 분리하여 리스트로 반환한다.) a = 'hi my name is' print(a.split()) a = 'hi@my@name@is' print(a.split('@')) 위 코드를 실행해보면 똑같은 결과를 얻을 것입니다. [2] 문자.join() 결합하고자 하는 문자를 .join() 안에 있는 리스트의 원소들을 결합할 수 있다. a = '-'.join(['010', '1234','5678']) print(a) [3] strip() : 양쪽 공백 제거 ( lstrip : 왼쪽 ..

Python/Pandas

[pandas] 레이블인코딩 / 원핫 인코딩 / 문자열을 범주형 데이터로 바꾸기

컴퓨터가 읽을 수 있게 문자열 데이터를 숫자형 데이터로 바꿔주어야 한다. 여기서 우리는 각 문자열 데이터를 표현할 수 있게 범주형 데이터로 변환시킨다 1) 레이블 인코딩 from sklearn.preprocessing import LabelEncoder for col in ['Title','AgeBin']: encoder = LabelEncoder() data[col] = encoder.fit_transform(data[col]) data.loc[:,['Title','AgeBin']].head() * sklearn LabelEncoder를 불러와 LabelEncoder 객체를 만든다. * fit_transform 함수를 사용하여 각 열의 데이터(문자열)에 적용한다. * 각 열의 속하는 범주의 개수만큼 숫..

Python/Pandas

[Pandas] 데이터 살펴보기 / head,tail,info,describe,shape,count,value_counts

데이터 살펴보기¶ head(n) : 처음 n개의 행을 보여줌 / tail(n) : 마지막 n개의 행을 보여줌¶ In [1]: import pandas as pd df = pd.read_csv('C:\\Users\\rladl\\Jupyter.study\\05000266\\part3\\auto-mpg.csv', header=None) df.columns = ['mpg','cylinders','displacement','horsepower','weight','acceleration','model year','origin','name'] print(df.head()) print('\n') print(df.tail()) mpg cylinders displacement horsepower weight acceler..

Python/Pandas

[Pandas] series / dataframe / 데이터구조 다루기

Series¶ 시리즈 만들기 (딕셔너리, 리스트)¶ In [2]: # 판다스 불러오기 import pandas as pd # key:value 쌍으로 딕셔너리 만들고, 변수 dict_data에 저장 dict_data = {'a':1,'b':2,'c':3} # series()함수로 dictionary를 series로 변환 sr = pd.Series(dict_data) print(type(sr)) print('\n') print(sr) a 1 b 2 c 3 dtype: int64 In [4]: list_data = ['2019-01-02', 3.14,'abc',100,True] sr = pd.Series(list_data) print(sr) 0 2019-01-02 1 3.14 2 abc 3 100 4 Tru..

kylo
'Python' 카테고리의 글 목록 (5 Page)