태그: Data Scientist Skil-Set
이 태그가 포함된 글들입니다. (총 1개)
데이터과학자 스킬셋
데이터과학자 스킬셋 (Data scientist skill-set) #
데이터과학자가 되려면 데이터과학자에게 필요한 스킬셋을 갖춰야 한다. 간단하게 정리하기는 어렵지만 크게 3개의 분류로 나눌 수 있다.
- 컴퓨터 엔지니어링: 코딩, 프로그래밍
- 데이터 분석: 통계, 수학, 알고리즘, 확률, 논리
- 설득 및 설명: 프리젠테이션, 글쓰기, 데이터시각화
각각을 자세히 알아보자.
컴퓨터 엔지니어링 #
컴퓨터 엔지니어링은 코딩만을 뜻하는 것이 아니다. 컴퓨터를 활용할 수 있는 전반적인 능력을 말한다. 소프트웨어 사용법 같은 것도 포함된다. 마이크로소프트 엑셀에서는 코딩을 하지 않아도 되지만, 데이터 분석을 할 때 엑셀도 빈번하게 사용한다. 활용 능력 중에서 가장 중요한 것은 프로그래밍 능력이다. 과거에는 수학이나 통계학을 하기 위해서 프로그래밍 능력이 꼭 필요하지는 않았다. 하지만 지금은 데이터를 처리하기 위해서는 프로그래밍 기술 활용이 필수이다. Excel과 다른 통계분석툴로도 데이터과학을 할 수 있지만, 변화가 많은 상황에 유연하게 대처하면서도 빠른 작업 진행이 필요하기 때문에 결국 자동화가 필요하다. 자동화를 위해서는 프로그래밍 능력이 반드시 필요하고, 데이터과학자는 자동화 기술을 잘 활용할 수 있어야 한다. 능숙한 컴퓨터 언어가 최소 1개 이상은 있어야 한다. 그리고 활용 범위가 넓은 범용 언어인 것이 좋다. Python과 R이 데이터과학을 위한 언어로 많이 쓰이는 것은 프로그래밍을 하면서 데이터과학의 근본에 더 집중할 수 있기 때문이다.