[코드잇] 데이터 사이언스 어떤 걸 할 것인가?
'리터러시' = 글을 읽고 쓸 줄 아는 능력
각 단어가 무슨 의미인지 아는 것이 아니라
문학적인 표현이나 이야기의 숨은 의도를 파악할 줄 아는 것
글의 논리를 파악하고 내가 이 근거로 활용될 수 있을지 타당성을 판단할 수 있는 것
단순히 데이터를 읽는 것을 넘어서
데이터가 어떻게 수집되고 변형되는지,
최종적으로는 어떤 결과물로 표현되었는지 종합적으로 이해하는 게 필요하다.
이를 통해 데이터에서 의미 있는 인사이트를 얻을 수 있고
또 분석 결과가 조작되거나 편향되지는 않았는지 파악할 수 있기도 하다.
그대로 받아들이는 것이 아니라,
다각도로 파악하고 활용하고 해석하는 것 = 데이터리터러시
데이터드리븐 : 직관이나 주관적 판단이 아니라 데이터에서 기반한 객관적 증거를 바탕으로 의사 결정을 내리는 것
복잡한 문제를 데이터 사이언스적인 , 데이터 드리븐 사고로 바라보고
데이터를 기반으로 소통하고 협업하는 종합적 역량을 기르자!
더 나은 의사결정자가 되고, 더 가치 있는 통찰력을 얻을 수 있다!
---
데이터 사이언스 분야의 직무들 중 내가 관심있는
데이터 애널리스트
데이터를 활용해서 필요한 분석을 하는
SQL 을 통해 필요한 데이터를 추출하고, 이를 파이썬을 통해 다양한 각도로 분석
필요한 사람들에게 리포트를 만들거나 서비스를 기획하는 이들, 사업의 의사결정자에게 도움이 되도록
좀 더 직관적
데이터 사이언티스트
수학적 통계법을 사용해서 머신러닝을 해서 미래 예측
미지의 세계 탐험
파이썬
서비스에 도입시킬 방법도 고민
개인 맞춤형, 실험,
머신러닝 : 컴퓨터가 데이터 기반으로 스스로 학습 -> 방법을 찾아냄
딥러닝 : 뇌 구조 모방한 알고리즘을 통해 학습. 수백억개의 뉴런이 서로 연결되어 전기 신호를 주고 받음.
뉴런과 비슷한 역할을 하는 구조를 여러층으로 깊게 쌓아 올려서 학습 진행
R : 통계와 시각화 -> 연구에 유리
파이썬: 다양한 분야에서 사용
---
하라면 해 임마 까라면 까 임마 ~
데이터를 올바르게 읽고 이해할 수 있는 데이터 리터러시 능력을 쌓고
⬇️
원하는 주제와 스킬을 선택하여 쌓아가기.
데이터 분석 역량을 더 갖추고 싶다 : 통계 분야를 더 공부
여러 분석 방법에 대해서
인터넷이나 데이터 베이스에서 원하는 데이터를 구할 수 있도록 웹크롤링
SQL 스킬 배우기
⬇️
인공지능 (머신러닝/ 딥러닝) 쪽이면 수학이나 알고리즘 실제 코드 구현 방법 배우기
---
내가 해야할 것을 정리해보자면
기초 쌓기
데이터를 읽고 이해하는 데이터 리터러시 능력 쌓기
다양한 접근 방법과 분석 결과 이해.
파이썬 공부하기 -> 언어 자체
데이터 시각화 집중하기
- 기본 차트와 그래프: 바 차트, 라인 차트, 히스토그램, 파이 차트 등의 기본 시각화 방법 이해.
- 시각화 도구 사용: Tableau Public, Google Data Studio 등을 사용하여 데이터 시각화 연습.
웹 크롤링
SQL 스킬
엑셀
1. 통계 기초 이해, 공부
- 기본 통계 개념 학습: 평균, 중앙값, 최빈값, 분산, 표준편차 등의 기본 개념 이해.
- 확률 이론: 확률의 기본 개념과 확률 분포 이해.
- 기초 통계 도서: "The Elements of Statistical Learning"이나 "Naked Statistics" 같은 책을 읽어 기본 개념을 학습.