Python

Python/Pandas

[pandas] rename, reset_index

(1) Pandas DataFrame 이름 변경하기 (1-1) column명 변경하기 population.rename(columns = {'항목':'구분'}, inplace=True) rename(columns = {'항목' : '구분'}) 를 통해서 컬러명을 '항목' -> '구분'으로 변경해준다. ( 여러 개를 한꺼번에 바꿀 수 있으며 디렉터리 형식으로 여러개를 나열하면 된다. ) 추가로 inplace=True를 통해서 변경된 내용을 본 DataFrame에 바로 변경을 저장하는 것을 의미한다. (1-2) columns명 변경하기 컬럼명이 보다시피 'ID', 'name', 'class' 입니다. df.columns 는 간단하게 DataFrame의 모든 컬럼명을 조회할 수 있는 코드입니다. 하지만 위와 같..

Python/PYTHON

[python] 컴프리헨션(comprehension)이란,

[1] Comprehension (컴프리헨션) 반복문과 조건문 그리고 변수에 대한 연산까지 모두 갖춘 편리한 문법이다. comprehension의 종류로는 list, set, dict 등이 존재한다. list 변수에서 짝수만 따로 빼와 list를 만들 때 기본 코드 mylist = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # 짝수를 만들이 위한 빈 리스트 생성 even = [] for i in mylist: if i % 2 == 0: # even 리스트에 값 추가 even.append(i) print(even) comprehension 을 이용한 코드 even = [ i for i in range(1, 11) if i % 2 == 0 ] 반복문 for문과 range() 함수를 통해 i에 ..

Python/PYTHON

파이썬 문자열 메소드 / split(), join(), strip()

[1]. split() : 문자열을 분리해주는 함수 split은 문장을 특정 규칙에 의해 쪼개주는 기능을 한다. 분리한 결과는 list 형식으로 값을 리턴 받는다. default 값으로 공백이 지정되어 있다. ( 즉, 공백을 기준으로 분리하여 리스트로 반환한다.) a = 'hi my name is' print(a.split()) a = 'hi@my@name@is' print(a.split('@')) 위 코드를 실행해보면 똑같은 결과를 얻을 것입니다. [2] 문자.join() 결합하고자 하는 문자를 .join() 안에 있는 리스트의 원소들을 결합할 수 있다. a = '-'.join(['010', '1234','5678']) print(a) [3] strip() : 양쪽 공백 제거 ( lstrip : 왼쪽 ..

Python/Pandas

[pandas] 레이블인코딩 / 원핫 인코딩 / 문자열을 범주형 데이터로 바꾸기

컴퓨터가 읽을 수 있게 문자열 데이터를 숫자형 데이터로 바꿔주어야 한다. 여기서 우리는 각 문자열 데이터를 표현할 수 있게 범주형 데이터로 변환시킨다 1) 레이블 인코딩 from sklearn.preprocessing import LabelEncoder for col in ['Title','AgeBin']: encoder = LabelEncoder() data[col] = encoder.fit_transform(data[col]) data.loc[:,['Title','AgeBin']].head() * sklearn LabelEncoder를 불러와 LabelEncoder 객체를 만든다. * fit_transform 함수를 사용하여 각 열의 데이터(문자열)에 적용한다. * 각 열의 속하는 범주의 개수만큼 숫..

kylo
'Python' 카테고리의 글 목록 (4 Page)