데이터 과학(데이터 사이언스)의 정의와 프로세스, 사용도구
이번 글에서는 데이터 사이언스의 용어와 과정에 대한 정리를 해 볼 예정이다. 빅데이터라는 말은 많이 들어봤지만 정확히 데이터사이언스가 뜻하는 바는 무엇인지 모르니, 용어정리와 개념을 먼저 확실하게 넣고 시작하자! 데이터 과학(데이터 사이언스)란? 데이터 과학은 대량의 데이터를 분석하고 접근하는 종합적인 연구 방식으로, 빅데이터, 자료분석, 자료연구, 자료가공, 시각화 등이 모두 데이터 사이언스에 속한다. 데이터 과학 프로세스 1. 문제의 발견 및 데이터 획득(Obtain Data) 문제를 정의하고 인식하는 단계로, 문제 해결을 위한 데이터를 수집 2. 데이터 정리(Scrub Data) 데이터를 조건에 맞도록 수정하는 과정으로 누락된 데이터 처리, 오류 수정, 이상값 제거 등이 포함됨. 즉, 데이터를 사용..
2022. 11. 3.