본문 바로가기

코드잇7

[dataframe] 중앙값 구하기 median() median메서드는 행/열의 값들의 중앙값을 계산DataFrame.median( axis=None, skipna=None, level=None, numeric_only=None, **kwargs) median의 매개변수1. axis : 행(axis=0) 또는 열(axis=1) 기준으로 계산2. skipna : NaN 값(skipna=True)을 제외하거나 NaN 값(skipna=False)을 포함3. numeric_only : numeric_only=True의 경우float, int 및 boolean 열만 포함\import pandas as pd# 데이터프레임 전체(컬럼별) 중앙값 구하기da.. 2024. 7. 10.
[SQL] 공부 시작이야~~~~ 🥕1일차 : 2024-07-05 ✅  ✅ 조건을 나타내는 다양한 방법  조건1 :  30세 이상부터 39세 이하까지 포함 ➡️ BETWEEN A AND B : A에서 B까지 SELECT * FROM copang_main.member WHERE age BETWEEN 30 AND 39; 조건2 : 30대만 제외하고 확인하기  ➡️ + NOTSELECT * FROM copang_main.member WHERE age NOT BETWEEN 30 AND 39;조건 3 : 2019년 1월 1일 이후로 가입한 회원들만 ➡️ 부등호 '>' 크다 DATE 값끼리 부등호를 사용해서 조건 만들기 SELECT * FROM copang_main.member WHERE sign_up_day > '2019-01-01'; 조건 .. 2024. 7. 7.
[기초 통계와 시각화] 📊 통계 어떤 상황을 쉽게 이해할 수 있도록 숫자로 정리하는 것기술 통계 : 기술하다에 집중 describe : 기술하다descriptive statistics: 기술 통계ex _ 배달 별점, 타율, 백분율에 따른 등급      앞으로 사용할  Seaborn : statistical Data Visualization: 통계 기반 데이터 시각화 툴 01. 통계 기본 상식수치형 데이터 : Numerical data 계산과 크고 작음을 비교 가능 평균 : average중간값 : median 정렬 후 중간에 있는 값 median을 기준으로 양 옆을 또 다시 median그러면1사분위 수(25%) , 3사분위수(75%/)4수분위 수 = 최댓값 100 %2사분위 수는 중간값이 됨.  50 %    짝수 개의 경우 .. 2024. 7. 5.
[Pandas] 판다스로 그래프 그리기! 라이브러리 임포트import pandas as pdimport matplotlib.pyplot as pltplt.plot[sales_df['quarter'], sales_df['revenue'])plt.show()sales_df.plot()plt.show()데이터 프레임의 정보를 가지고 판다스가 유추해서 그림을 그림파란 선 : 매출주황 선 : 비용  #x 축과 y축에 들어갈 내용을 따로 정할 수도 있음 . #선 그래프 sales_df.plot(x='quarter', y = 'revenue') #x 축에 분기, y축에 매출plt.show()#x 축과 y축에 들어갈 내용을 따로 정할 수도 있음 . #막대 그래프sales_df.plot(x='quarter', y = 'revenue', kind = 'bar').. 2024. 7. 5.
[판다스] 특정 조건에 맞는 데이터 필터링하기 # 버거 데이터를 예시로 !  1. 모든 햄버거들(전체 행) 칼로리만(특정 열만) 보기burger_df['calories'] 2. 칼로리가 500 미만인 햄버거만 가져오기 = 특정 조건에 해당하는 행만 가져오기burger_df['calories'] True = 500 미만False = 500 이상  type 불린  =  판다스 시리즈가 만들어짐시리즈 안에는 True, False 값들이 들어감기존 인덱스(상품명)은 유지            4. masking _ 필터링하기 burger_df.loc[burger_df['calories'] True 에 해당하는 값(ROW)들만 필터링 되어서 출력  즉 모든 컬럼에 대해 특정 컬럼의 조건에 해당하는 값들(로우)만 보임.   5. 행 ROW를 필터링했는데 모든 컬.. 2024. 7. 5.
[📁파일 경로] 상대 경로와 절대 경로 절대 경로 파일의 루트(최상위 디렉토리)부터 해당 파일까지의 전체 경로를 모두 기입하는 방식파일의 위치를 시스템의 어느 위치에서든 일관되게 지정할 수 있음 . C:/Users/봉그리봉봉/Downloads/data/burger.csv: C 드라이브의 Users 폴더 내의 봉그리봉봉 폴더 내의 Downloads 폴더 내의 data 폴더에 있는 burger.csv 파일을 가리킵니다.예시 : 파일 위치 : C:/Users/봉그리봉봉/Downloads/data/burger.csv# 절대 경로를 사용하여 파일 읽기df = pd.read_csv("C:/Users/봉그리봉봉/Downloads/data/burger.csv")상대 경로 현재 파일이 존재하는 디렉토리 (작업을 하고 있는 디렉토리) 를 기준으로 연결하려는 파.. 2024. 7. 4.
[Data science toolkit] - ing 🔨주피터 노트북 - 데이터 사이언스는 주피터 노트북 사용 - > 데이터를 다양한 각도에서 살피고 분석하는 과정을 하나의 노트로 남겨두기- 지금까지 쓴 코드와 각각의 실행 결과를 누적해서 볼 수 있음 - 마치 공책에 정리 하듯 왜? 여러 방향으로 데이터를 살펴보고, 여러 방법을 사용해보 -> 인사이트를 찾아내는 과정을 결과물로 봄.✂️ 넘파이( NUMPY) - 1.26.4 데이터 관련 연산들을 효과적으로 ! 🔧 판다스 (PANDAS)  - 2.1.4 표 형식 데이터를 다루기 위해 ! 🪛맷플롭립(MATPLOTLIB) - 3.8.0 효과적인 인사이트 전달, 시각화   ----🔨주피터 노트북 - esc 누르면 코드를 못  치는 상태가 됨, 엔터 a 위에 셀 추가, b 아래에 셀 추가. dd - 삭제- 주.. 2024. 7. 4.