pandas의 stack() 함수와 unstack() 함수로 데이터 프레임을 재구조화할 수 있습니다. 간단하게 설명하자면, stack은 컬럼을 인덱스로 가져오는 것이며, unstack은 (지정한 level)의 인덱스를 컬럼으로 보내는 역할을 합니다. import pandas as pd df = pd.DataFrame({'col_1':[1,2,3],'col_2':[4,5,6]}, index=['a','b','c']) df Stack stack은 컬럼을 인덱스로 보내는 역할을 합니다. 아래를 보시면 인덱스에 해당하는 각 컬럼을 차례대로 쌓는 다고 생각하시면 됩니다. stack = df.stack() stack df 데이터프레임의 인덱스 level 0인 a,b,c에 해당하는 컬럼을 차례대로 쌓아 올린다. st..
DataFrame.select_dtypes(include=None, exclude=None) [1] select_dtypes 함수는 열에 포함된 데이터들을 type 기준으로 인덱싱 할 수 있도록 합니다. select_dtypes(include=None, exclude=None) 형태를 가지며, include에 넣은 값은 포함하고, exclude에 넣은 값을 제외한 열을 데이터 프레임 형태로 반환합니다. [2] 사용법 기본 사용법 * include 및 exclude는 비어있거나 겹치면 안 되며(에러 발생), 스칼라나 list형태의 입력값이 가능합니다. 자료형 1. 숫자형(numeric)은 np.number 또는 'number' 2. 문자형(str)은 'object' 3. 날짜,시간(datetimes)을 선..
BeautifulSoup란 무엇인가, HTML, XML, JSON 등 파일의 구문을 분석하는 모듈. 웹 페이지를 표현하는 HTML을 분석하기 위해 사용되며, 원하는 데이터를 가져오기 쉽게 비슷한 분류의 데이터별로 나누어 주는 파이썬 라이브러리이다. ( 보통 html정보를 가져오는 urllib.request.urlopen() 모듈과 함께 사용되곤 합니다 ) BeautifulSoup 설치 pip install bs4 [1] BeautifulSoup 시작하기 from bs4 import BeautifulSoup from urllib.request import urlopen # 크롤링할 페이지를 page 변수에 저장 page = "https://movie.naver.com/movie/sdb/rank/rmovie..
파이썬 내장 함수인 sum 함수에 대해 알아보고자 합니다. sum 함수는 리스트,튜플과 같은 iterable 자료형을 받아 숫자형 요소의 합을 구해줍니다. 또한 sum 함수를 통해서 숫자형의 합이 아닌 리스트의 합도 가능합니다. 1. sum으로 정수, 실수가 저장된 iterable 자료형 총 합 구하기 2. sum을 이용해 리스트 합치기 1. Python sum함수 설명 sum(iterable, start=0) 파이썬의 sum 함수로 간단히 iterable 한 자료형을 받아 저장된 숫자 요소들의 합을 구해줍니다. sum 함수를 좀 더 자세히 알아보면, sum(iterable, start=0) 모양입니다. 첫 번째 인자 : iterable 한 자료형 두 번째 인자 : 처음으로 또 더해줄 숫자 두 번째 인자..
파이썬에 자료형으로 자주 사용하는 리스트가 있습니다. 리스트를 사용할 때 필요한 요소를 추가 및 삭제를 주로 하는데 삭제하는 방법(3)에 대해 정리해보겠습니다. del 리스트명[index] del 키워드를 통해 리스트[인덱스] 를 넣어주면 해당 인덱스에 위치한 요소를 제거하게 된다. del 키워드를 통한 제거는 슬라이싱을 통해 여러 요소들을 한꺼번에 제거할 수 있습니다. 리스트명.pop(index) 파이썬 함수인 pop 함수를 통해서도 제거할 수 있습니다. pop 함수의 매개변수로 인덱스를 넘겨주면 해당 인덱스의 원소가 리스트에서 지워지게 됩니다. 만약 매개 변수가 없을 때는 자동으로 -1 값이 들어가, 리스트의 맨 마지막 요소를 제거합니다. 리스트.remove(value) remove함수를 통해서는 리..
1. 피벗 테이블 함수 : pivot_table() pivot_table() 함수의 기본 구성요소 행 인덱스 (index) 열 인덱스 (columns) 데이터 값 (values) 데이터 집계 함수 (aggfunc) 각 구성요소에 적용할 데이터 프레임의 열을 각각 함수의 인자로 전달한다. 4가지 구성요소를 적절히 입력하고 피벗테이블을 생성해보자. 위 데이터프레임에서 인덱스는 '광역시도', '시도'로 하고 칼럼은 '구분' ( 남, 여 , 합계 )으로 입력 값은 '인구수', '20-39세', '65세이상'으로 하여 테이블을 만들어보겠습니다. 집계 함수를 넣어주지 않고 index, columns, values를 넣어주면 기본적으로 누적 값인 sum으로 계산되어 테이블을 보여준다. 함수는 aggfunc = 'me..
(1) Pandas DataFrame 이름 변경하기 (1-1) column명 변경하기 population.rename(columns = {'항목':'구분'}, inplace=True) rename(columns = {'항목' : '구분'}) 를 통해서 컬러명을 '항목' -> '구분'으로 변경해준다. ( 여러 개를 한꺼번에 바꿀 수 있으며 디렉터리 형식으로 여러개를 나열하면 된다. ) 추가로 inplace=True를 통해서 변경된 내용을 본 DataFrame에 바로 변경을 저장하는 것을 의미한다. (1-2) columns명 변경하기 컬럼명이 보다시피 'ID', 'name', 'class' 입니다. df.columns 는 간단하게 DataFrame의 모든 컬럼명을 조회할 수 있는 코드입니다. 하지만 위와 같..
[1] 문제 [2] 코드 N, M = map(int, input().split()) num_list = list(map(int, input().split())) num_list.sort(reverse=True) prev_sum = num_list[0] + num_list[1] + num_list[2] sum = 0 flag = False if prev_sum == M : print(prev_sum) else : for i in range(N): for j in range(i+1, N): for k in range(j+1, N): sum = num_list[i] + num_list[j] + num_list[k] if (M - sum) < 0: continue if (M - prev_sum) < 0: if ..