본문 바로가기

IT 정보

[인공지능 ②] AI에서의 데이터 과학 및 통계

* 본포스팅은 <그림으로 배우는 AI>에서 발췌한 내용으로 작성되었습니다.

 

 

✔ 데이터 이해에 필수적인 통계

 

데이터나 지식을 다룰 수 있게 된다고 해서 그것만으로 AI의 가치가 높아지지는 않습니다. 데이터를 어떻게 사용하고 무엇을 얻을 것인가와 같이 데이터의 효과적인 이용은 컴퓨터나 인터넷의 보급 이래, 정보 사회에 있어서의 큰 테마가 되고 있습니다. 

그래서 여러 가지 중에서 특별히 선택된 것이 통계학입니다. 통계는 데이터를 다루는 학문입니다. 단지, 통계학은 어디까지나 「데이터를 보는 방법」을 생각하는 학문입니다. 말하자면 「데이터에는 이런 측면이 있다」 「이렇게 하면 데이터를 보기 쉬워진다」 「정확한 데이터를 모으려면 이렇게 하면 좋다」라는 부분에 대해 수학적인 견지에서 조언을 해 주지만 데이터 사용법까지 생각해 주지는 않습니다.

 

 

 

✔ 데이터의 활용까지 생각하는 데이터 과학

 

반면 데이터 사용법을 생각하기 위해 등장한 것이 데이터 과학(Data Science)입니다. 통계학과의 차이점은 데이터를 어떻게 보느냐 하는 부분뿐만 아니라 통계학에 정보 이론이나 경제 이론과 같은 다양한 이론을 접목시켜 데이터의 해석이나 활용까지 범위를 넓히고 있다는 점입니다. 즉, 그 「데이터를 어떠한 의미를 가지고 무엇에 사용할 수 있는가」, 「어떤 가치를 가지고 있고 어떻게 하면 효과적으로 활용할 수 있는가」라고 하는 데이터의 활용법에 이르기까지 깊이 파고들고 있는 것이 데이터 과학입니다(그림 3-7).

 

AI는 그야말로 「유용한 데이터 활용법 그 자체」이며, 데이터 과학과의 궁합은 매우 좋습니다. 비즈니스에 있어서는 매출 예측 등 이익에 직접적으로 관련된 분석에도관여하고 있어 데이터 사이언티스트(Data Scientist)의 수요가 비약적으로 높아져 항상 인재가 부족한 상황이 되고 있습니다(그림 3-8). 또한 기계학습에 있어서는 데이터 과학이 기계학습의 성능을 좌우하는 중요한 요소이며, AI 기술자와 데이터 사이언티스트의 모호한 경계가 존재합니다. 모든 AI가 데이터 과학을 이용하고 있는것은 아니지만, 당연히 연관되어 있는 분야라고 할 수 있을 것입니다.

 

 

 

 

 

- 통계학은 데이터를 이해하기 위한 학문
- 데이터 과학은 데이터를 이용하기 위한 학문
- AI와는 밀접한 관계가 있으며, 경계는 모호

 


 

 

《그림으로 배우는 AI》

예스24 / 교보문고 / 알라딘

 

 

반응형