반응형
DataFrame.select_dtypes(include=None, exclude=None)
[1] select_dtypes 함수는 열에 포함된 데이터들을 type 기준으로 인덱싱 할 수 있도록 합니다.
- select_dtypes(include=None, exclude=None) 형태를 가지며, include에 넣은 값은 포함하고, exclude에 넣은 값을 제외한 열을 데이터 프레임 형태로 반환합니다.
[2] 사용법
기본 사용법
* include 및 exclude는 비어있거나 겹치면 안 되며(에러 발생), 스칼라나 list형태의 입력값이 가능합니다.
자료형
1. 숫자형(numeric)은 np.number 또는 'number'
2. 문자형(str)은 'object'
3. 날짜,시간(datetimes)을 선택하려면 np.datetime64, 'datetime' 또는 'datetime64'
4. timedeltas는 np.timedelta64, 'timedelta' or 'timedelta64'
5. Pandas의 categorical 타입은 'category'
[3] 예시
col1 = [1, 2, 3, 4, 5]
col2 = ['one', 'two', 'three', 'four', 'five']
col3 = [1.5, 2.5, 3.5, 4.5, 5.5]
col4 = [True, False, False, True, True]
df = pd.DataFrame({"col1": col1, "col2": col2, "col3": col3, "col4": col4})
print(df)
print('----------------------------')
print(df.dtypes)
[3-2] 숫자형만 추출하겠습니다.
result = df.select_dtypes(include=[int, float])
print(result)
or
numerics = [int, float]
result = df.select_dtypes(include=numerics)
리스트로 두 개이상의 자료형을 추출하거나 여러 자료형을 추출하기 전에 변수 하나를 만들어서 전달해줄 수도 있다.
[3-3] 숫자형을 제외하고 추출하겠습니다.
result = df.select_dtypes(exclude=[int, float])
print(result)
위와 같이 exclude는 제외할 타입을 입력해주면, 해당 타입을 제외한 열을 반환해준다.
반응형
'Python > Pandas' 카테고리의 다른 글
[Pandas] 데이터 프레임 재구조화 (stack, unstack) (0) | 2022.06.09 |
---|---|
[pandas] pivot_table 원하는 대로 테이블 만들기 (0) | 2022.05.18 |
[pandas] rename, reset_index (0) | 2022.05.17 |
[pandas] 레이블인코딩 / 원핫 인코딩 / 문자열을 범주형 데이터로 바꾸기 (0) | 2022.03.05 |
[Pandas] 데이터 살펴보기 / head,tail,info,describe,shape,count,value_counts (0) | 2022.02.24 |