데이터사이언티스트 스킬셋 - Data scientist skil-set

데이터사이언티스트가 되기 위해서 필요한 것들

여러분은 데이터사이언티스트가 되기 위해서 또는 데이터사이언스 기술을 향상시키기 위해서 필요한 기술들이 어떤 것인지 궁금할 것이고 필요한 것을 정복하려고 하는 욕심이 있을 것이다. 원래 데이터사이언티스트가 필요한 기술은 매우 광범위하고 현재에도 데이터사이언스에 발을 담그기 위해서 여기저기에서 서로 필요한 기술이라고 주장하며 붙여 넣는 것이 많기 때문에 계속해서 늘어나고 정리가 되어 있지 않아 매우 혼란스러운 상황이다.

간단하게 정리하면 3가지로 나눌 수 있다.

  • IT 활용능력
  • 데이터 분석 관련 학술 지식
  • 설득 및 설명 능력

IT 활용능력

프로그래밍 기술을 말한다. 데이터를 처리하기 위해서는 프로그래밍 기술이 필수인 시대가 되었다. Excel과 통계분석툴로 데이터과학을 할 수 없는 것은 아니지만 모든 상황에 유연하게 대처하고 빠른 작업과 자동화가 필수이므로 프로그래밍 능력이 필요하며 주력으로 사용하는 컴퓨터 랭귀지가 최소 1개이상은 있어야 한다.

데이터 분석 관련 학술 지식

데이터 분석과 관련된 학술 분야는 사실 꽤 많다. 하지만 이중에 특별히 어떤 학문을 전공한다고 해서 특별히 데이터사이언스에 유리하다고 할 수는 없다.

  • 수학
  • 컴퓨터공학
  • 통계학
  • 경영과학
  • 계량경제학
  • 금융공학
  • 물리학
  • 각종 엔지니어링

사실상 공과는 대부분 데이터를 다루게 되어있고 인문학에서는 숫자와 돈을 다루는 것은 모두 데이터를 다루는 학문이라고 볼 수 있다. 순수 인문학이나 예술과 관련된 학문이 아니라면 현대에는 대부분 수학과 컴퓨터공학은 다른 학문에서도 적극 활용할 수 밖에 없는 도구라고 보면 수학과 컴퓨터공학은 데이터사이언스의 필수이며 다른 학문들은 관련이 매우 깊은 학문이라고 할 수 있다.

설득 및 설명 능력

설득 및 설명은 인문학적 소양이다. 데이터를 해석하고 가치를 찾아내고 가설을 검증한 뒤에 할 일은 누군가에게 설명을 하는 일이다. 설명을 하기 위해서는 조리있게 설명을 하고 전달하려는 바를 명확히 전달할 필요가 있다.

  • 시각화
  • 프리젠테이션

시각화는 기술과 예술의 중간쯤에 해당한다. 미적감각도 필요하며 연습도 필요하고 프로그래밍이나 컴퓨터 소프트웨어 활용능력이 필요하다. 연습을 통해 예술 작품을 만드는 것까지는 아니더라도 왜곡없이 사실을 표현해서 주목도를 높이고 이해를 쉽게 할 수 있는 능력이 필요하다.

프리젠테이션은 설명의 능력이다. 여기서 말하는 프리젠테이션 능력은 청중에게 잘 설명해서 현혹시키는 그런 것을 말하는 것이 아닌 잘 정돈된 스토리라인에 따라 전달하려는 바를 잘 전달하는 것을 말한다. 파워포인트와 같은 발표 문서를 잘 작성하는 것도 여기에 포함되며 표현문구를 쓸 때도 고심해서 작성해야하며 그런 능력도 필요하다.