Python

Python/Pandas

[Pandas] 데이터 프레임 재구조화 (stack, unstack)

pandas의 stack() 함수와 unstack() 함수로 데이터 프레임을 재구조화할 수 있습니다. 간단하게 설명하자면, stack은 컬럼을 인덱스로 가져오는 것이며, unstack은 (지정한 level)의 인덱스를 컬럼으로 보내는 역할을 합니다. import pandas as pd df = pd.DataFrame({'col_1':[1,2,3],'col_2':[4,5,6]}, index=['a','b','c']) df Stack stack은 컬럼을 인덱스로 보내는 역할을 합니다. 아래를 보시면 인덱스에 해당하는 각 컬럼을 차례대로 쌓는 다고 생각하시면 됩니다. stack = df.stack() stack df 데이터프레임의 인덱스 level 0인 a,b,c에 해당하는 컬럼을 차례대로 쌓아 올린다. st..

Python/Pandas

[Pandas] dtype 기반 열 선택 / select_dtypes

DataFrame.select_dtypes(include=None, exclude=None) [1] select_dtypes 함수는 열에 포함된 데이터들을 type 기준으로 인덱싱 할 수 있도록 합니다. select_dtypes(include=None, exclude=None) 형태를 가지며, include에 넣은 값은 포함하고, exclude에 넣은 값을 제외한 열을 데이터 프레임 형태로 반환합니다. [2] 사용법 기본 사용법 * include 및 exclude는 비어있거나 겹치면 안 되며(에러 발생), 스칼라나 list형태의 입력값이 가능합니다. 자료형 1. 숫자형(numeric)은 np.number 또는 'number' 2. 문자형(str)은 'object' 3. 날짜,시간(datetimes)을 선..

Python/Python

[Python] 파이썬 웹 크롤링 - BeautifulSoup 사용 방법 및 활용하기

BeautifulSoup란 무엇인가, HTML, XML, JSON 등 파일의 구문을 분석하는 모듈. 웹 페이지를 표현하는 HTML을 분석하기 위해 사용되며, 원하는 데이터를 가져오기 쉽게 비슷한 분류의 데이터별로 나누어 주는 파이썬 라이브러리이다. ( 보통 html정보를 가져오는 urllib.request.urlopen() 모듈과 함께 사용되곤 합니다 ) BeautifulSoup 설치 pip install bs4 [1] BeautifulSoup 시작하기 from bs4 import BeautifulSoup from urllib.request import urlopen # 크롤링할 페이지를 page 변수에 저장 page = "https://movie.naver.com/movie/sdb/rank/rmovie..

Python/Python

[Python] 파이썬 sum 함수로 리스트 합치기 (숫자형, 리스트)

파이썬 내장 함수인 sum 함수에 대해 알아보고자 합니다. sum 함수는 리스트,튜플과 같은 iterable 자료형을 받아 숫자형 요소의 합을 구해줍니다. 또한 sum 함수를 통해서 숫자형의 합이 아닌 리스트의 합도 가능합니다. 1. sum으로 정수, 실수가 저장된 iterable 자료형 총 합 구하기 2. sum을 이용해 리스트 합치기 1. Python sum함수 설명 sum(iterable, start=0) 파이썬의 sum 함수로 간단히 iterable 한 자료형을 받아 저장된 숫자 요소들의 합을 구해줍니다. sum 함수를 좀 더 자세히 알아보면, sum(iterable, start=0) 모양입니다. 첫 번째 인자 : iterable 한 자료형 두 번째 인자 : 처음으로 또 더해줄 숫자 두 번째 인자..

kylo
'Python' 카테고리의 글 목록 (3 Page)