본문 바로가기

IT 정보

나는 어떤 데이터 분석 방법을 택해야 할까?

 

데이터 분석 목적을 상세하게 나누면 무엇을 해야 하는지 명백해집니다. 데이터 분석에 직결된 목적이 보이기 때문이죠. 예를 들면 아래와 같습니다.

 

•전체적인 이미지를 보고 싶다. 
•변화를 보고 싶다.
•위치를 알고 싶다. 
•관계를 알고 싶다.
•비율을 알고 싶다. 
•예측하고 싶다.
•비교하고 싶다.

 

이처럼 목적이 보이기 시작하면 거기에 맞는 데이터 가공 방법을 선택하면 됩니다. 그 방법들을 간략하게 살펴봅시다.

 

 

 

 

  • 전체적인 이미지를 보려할 때 -> 도수분포표, 히스토그램

히스토그램의 예

방침 결정, 전략 수립한다. ▶ 《엑셀로 시작하는 데이터과학 실무》 51p

불규칙한 데이터 발견한다. ▶ 《엑셀로 시작하는 데이터과학 실무》 51p

 

 

  • 데이터를 요약할 때 -> 평균값, 중앙값 표준편차 등의 통계치

각종 통계치의 예

집단의 특징을 안다.

① 평균값 ▶ 《엑셀로 시작하는 데이터과학 실무》 56p

② 분포의 형태 ▶ 《엑셀로 시작하는 데이터과학 실무》 73p

③ 표준편차 ▶ 《엑셀로 시작하는 데이터과학 실무》 82p

위치를 안다. 비교하는 등의 분석 기초 데이터로 사용한다. 

▶ 《엑셀로 시작하는 데이터과학 실무》 56p

 

 

  • 규모를 가시화하여 비교할 때 -> 막대그래프

막대그래프 비교의 예

객관적으로 평가한다. ▶ 《엑셀로 시작하는 데이터과학 실무》 66p

타사와 비교한다. ▶ 《엑셀로 시작하는 데이터과학 실무》 68p

 

 

  • 위치나 범위를 알고 싶을 때 -> 편차치, 사분위수, 백분위수 값, 상자 그림

상자 그림의 예

전체 중의 위치를 안다. ▶ 《엑셀로 시작하는 데이터과학 실무》 98p, 110p

다른 집단에서의 위치를 비교한다. ▶ 《엑셀로 시작하는 데이터과학 실무》 106p

불규칙한 데이터 발견했다. ▶ 《엑셀로 시작하는 데이터과학 실무》 121p

 

 

  • 전체에서 차지하는 비율을 알고 싶을 때 -> 원그래프, 파레토 차트

파레토 차트의 예

중점 항목을 밝힌다. ▶ 《엑셀로 시작하는 데이터과학 실무》 125p

항목의 순위를 매긴다. ▶ 《엑셀로 시작하는 데이터과학 실무》 128p

 

 

  • 관계를 알고 싶을 때 -> 분산형 차트, 상관계수

분산형 차트의 예

증가/감소 경향을 안다. ▶ 《엑셀로 시작하는 데이터과학 실무》 134p

관계의 강도를 안다. ▶ 《엑셀로 시작하는 데이터과학 실무》 137p

 

 

 

※ 참고  

더보기

이외에도 목적에 따라 '어떤 분석 방법을 택할 것인지'에 대한 추가적인 설명은 

《엑셀로 시작하는 데이터과학 실무》 책에서 살펴보실 수 있습니다. 여기 없다면 책을 통해 살펴보세요! 

 

※ 위의 표와 그래프는 Excel로 작성한 것입니다. 

《엑셀로 시작하는 데이터과학 실무》 실습 파일에 전부 포함되어 있습니다.

관련된 내용이나 고도의 분석 방법을 해설한 문서도 포함되어 있으므로 꼭 참고해보세요!

《엑셀로 시작하는 데이터과학 실무》

 

예스24  /  교보문고  /  알라딘  /  인터파크

 

반응형