데이터시각화 - Data Visualization

데이터시각화 개요 Overview of Data Visualization

데이터를 시각적으로 표현하는 것을 데이터 시각화(Data Visualization)이라고 한다.

데이터시각화라는 차트(Chart), 플롯(Plot)을 그리는 것이라고 생각하기 쉽다. 데이터시각화는 단순하게 차트를 그리는 것을 말하는 것은 아니다. 데이터를 잘 이해하고 인사이트를 잘 찾아낼 수 있게 데이터를 적절하고 효과적으로 표현하는 행위, 기술을 말한다.

즉, 엑셀에서 막대그래프를 그리고 표현하는 것도 데이터시각화의 일부이지만 데이터시각화는 그 보다는 더 범위가 넓다.

데이터시각화에서 그리는 도표는 흔히 차트라고 불리는 것 보다는 플롯이라고 불리는 복잡한 것들이 많다.

  • 차트는 1개 또는 2개 정도의 차원의 데이터를 표현해서 쉽게 설명하기 위한 것이다.
  • 플롯은 2개 이상의 데이터를 서로 연관관계나 관련성을 표현하기 위한 것이다.
  • 그 외에 인터랙티브 액션이나 애니메이션 유형, 그리고 커스텀하게 만들어낸 독특한 데이터시각화가 있다.

좁은 의미에서의 데이터시각화라고 하면 위에서 세번째를 말한다.

데이터시각화를 위해서 배워야 할 것

데이터시각화를 위한 도구는 상당히 많다.
현재 대표적인 것으로는

  • 엑셀 (Excel)
  • 태블로 (Tableau)
  • Python Matplotlib
  • Python Seaborn
  • R ggplot2
  • R lattice
  • R 기본 플롯
  • Javascript D3

물론 이 외에도 상당히 많다.
이 중에서 가장 빠르고 편한 것은 R ggplot2이고 전통적인 프로그래밍 방식에 가장 가까운 것은 Python의 플로팅 패키지들이다.
프로그래밍을 하지 않고 가장 편한 것은 Excel과 Tableu이다.
데이터시각화라는 이름이 가장 어울리면서도 독특하고 매력적인 것을 할 수 있는 것은 D3이다.

선택은 하는 사람이 결정해야 한다.

최종 수정일: {{ .Lastmod.Format “2006-01-02 03:04” }}


최종수정일: 2021-08-22 11:24
Copyright by IntoTheData all rights reserverd.