데이터사이언스

[코드잇] 데이터 사이언스 어떤 걸 할 것인가?

봉그리봉봉 2024. 7. 3. 10:03

'리터러시' = 글을 읽고 쓸 줄 아는 능력 

 

각 단어가 무슨 의미인지 아는 것이 아니라 

문학적인 표현이나 이야기의 숨은 의도를 파악할 줄 아는 것

글의 논리를 파악하고 내가 이 근거로 활용될 수 있을지 타당성을 판단할 수 있는 것

 

단순히 데이터를 읽는 것을 넘어서

데이터가 어떻게 수집되고 변형되는지, 

최종적으로는 어떤 결과물로 표현되었는지 종합적으로 이해하는 게 필요하다.

이를 통해 데이터에서 의미 있는 인사이트를 얻을 수 있고

또 분석 결과가 조작되거나 편향되지는 않았는지 파악할 수 있기도 하다.

 

그대로 받아들이는 것이 아니라,

다각도로 파악하고 활용하고 해석하는 것 = 데이터리터러시

 

데이터드리븐 : 직관이나 주관적 판단이 아니라 데이터에서 기반한 객관적 증거를 바탕으로 의사 결정을 내리는 것

 

복잡한 문제를 데이터 사이언스적인 , 데이터 드리븐 사고로 바라보고

데이터를 기반으로 소통하고 협업하는 종합적 역량을 기르자!

 

 

더 나은 의사결정자가 되고, 더 가치 있는 통찰력을 얻을 수 있다! 

 

---

데이터 사이언스 분야의 직무들 중 내가 관심있는

 

데이터 애널리스트 

데이터를 활용해서 필요한 분석을 하는 

SQL 을 통해 필요한 데이터를 추출하고, 이를 파이썬을 통해 다양한 각도로 분석 

필요한 사람들에게 리포트를 만들거나 서비스를 기획하는 이들, 사업의 의사결정자에게 도움이 되도록

좀 더 직관적

 

데이터 사이언티스트 

수학적 통계법을 사용해서 머신러닝을 해서 미래 예측

미지의 세계 탐험

파이썬

서비스에 도입시킬 방법도 고민

개인 맞춤형, 실험, 

 

머신러닝 : 컴퓨터가 데이터 기반으로 스스로 학습 -> 방법을 찾아냄

딥러닝 : 뇌 구조 모방한 알고리즘을 통해 학습. 수백억개의 뉴런이 서로 연결되어 전기 신호를 주고 받음.

뉴런과 비슷한 역할을 하는 구조를 여러층으로 깊게 쌓아 올려서 학습 진행

 

 

R : 통계와 시각화 -> 연구에 유리

파이썬: 다양한 분야에서 사용

 

 

 

---

하라면 해 임마 까라면 까 임마 ~

 

데이터를 올바르게 읽고 이해할 수 있는 데이터 리터러시 능력을 쌓고

⬇️

원하는 주제와 스킬을 선택하여 쌓아가기.

데이터 분석 역량을 더 갖추고 싶다 : 통계 분야를 더 공부

여러 분석 방법에 대해서

인터넷이나 데이터 베이스에서 원하는 데이터를 구할 수 있도록 웹크롤링

SQL 스킬 배우기

⬇️

인공지능 (머신러닝/ 딥러닝) 쪽이면 수학이나 알고리즘 실제 코드 구현 방법 배우기 

--- 

 

내가 해야할 것을 정리해보자면 

 

 

기초 쌓기

데이터를 읽고 이해하는 데이터 리터러시 능력 쌓기

다양한 접근 방법과 분석 결과 이해.

 

파이썬 공부하기 -> 언어 자체

 

데이터 시각화 집중하기

  • 기본 차트와 그래프: 바 차트, 라인 차트, 히스토그램, 파이 차트 등의 기본 시각화 방법 이해.
  • 시각화 도구 사용: Tableau Public, Google Data Studio 등을 사용하여 데이터 시각화 연습.

웹 크롤링

SQL 스킬

엑셀

 

1. 통계 기초 이해, 공부 

  • 기본 통계 개념 학습: 평균, 중앙값, 최빈값, 분산, 표준편차 등의 기본 개념 이해.
  • 확률 이론: 확률의 기본 개념과 확률 분포 이해.
  • 기초 통계 도서: "The Elements of Statistical Learning"이나 "Naked Statistics" 같은 책을 읽어 기본 개념을 학습.