본문 바로가기

코드잇/Python4

[dataframe] 중앙값 구하기 median() median메서드는 행/열의 값들의 중앙값을 계산DataFrame.median( axis=None, skipna=None, level=None, numeric_only=None, **kwargs) median의 매개변수1. axis : 행(axis=0) 또는 열(axis=1) 기준으로 계산2. skipna : NaN 값(skipna=True)을 제외하거나 NaN 값(skipna=False)을 포함3. numeric_only : numeric_only=True의 경우float, int 및 boolean 열만 포함\import pandas as pd# 데이터프레임 전체(컬럼별) 중앙값 구하기da.. 2024. 7. 10.
[Pandas] 판다스로 그래프 그리기! 라이브러리 임포트import pandas as pdimport matplotlib.pyplot as pltplt.plot[sales_df['quarter'], sales_df['revenue'])plt.show()sales_df.plot()plt.show()데이터 프레임의 정보를 가지고 판다스가 유추해서 그림을 그림파란 선 : 매출주황 선 : 비용  #x 축과 y축에 들어갈 내용을 따로 정할 수도 있음 . #선 그래프 sales_df.plot(x='quarter', y = 'revenue') #x 축에 분기, y축에 매출plt.show()#x 축과 y축에 들어갈 내용을 따로 정할 수도 있음 . #막대 그래프sales_df.plot(x='quarter', y = 'revenue', kind = 'bar').. 2024. 7. 5.
[판다스] 특정 조건에 맞는 데이터 필터링하기 # 버거 데이터를 예시로 !  1. 모든 햄버거들(전체 행) 칼로리만(특정 열만) 보기burger_df['calories'] 2. 칼로리가 500 미만인 햄버거만 가져오기 = 특정 조건에 해당하는 행만 가져오기burger_df['calories'] True = 500 미만False = 500 이상  type 불린  =  판다스 시리즈가 만들어짐시리즈 안에는 True, False 값들이 들어감기존 인덱스(상품명)은 유지            4. masking _ 필터링하기 burger_df.loc[burger_df['calories'] True 에 해당하는 값(ROW)들만 필터링 되어서 출력  즉 모든 컬럼에 대해 특정 컬럼의 조건에 해당하는 값들(로우)만 보임.   5. 행 ROW를 필터링했는데 모든 컬.. 2024. 7. 5.
[📁파일 경로] 상대 경로와 절대 경로 절대 경로 파일의 루트(최상위 디렉토리)부터 해당 파일까지의 전체 경로를 모두 기입하는 방식파일의 위치를 시스템의 어느 위치에서든 일관되게 지정할 수 있음 . C:/Users/봉그리봉봉/Downloads/data/burger.csv: C 드라이브의 Users 폴더 내의 봉그리봉봉 폴더 내의 Downloads 폴더 내의 data 폴더에 있는 burger.csv 파일을 가리킵니다.예시 : 파일 위치 : C:/Users/봉그리봉봉/Downloads/data/burger.csv# 절대 경로를 사용하여 파일 읽기df = pd.read_csv("C:/Users/봉그리봉봉/Downloads/data/burger.csv")상대 경로 현재 파일이 존재하는 디렉토리 (작업을 하고 있는 디렉토리) 를 기준으로 연결하려는 파.. 2024. 7. 4.