데이터 분석 또는 데이터 해석은 데이터를 보고 어떤 인사이트를 얻거나 밝혀내고자 하는 사실을 알아내는 행위를 말한다.
주로 원인이 무엇인가를 밝혀내는 것에 집중한다.
데이터 분석은 일반적으로 통계 분석을 의미하거나 시각적인 도구를 이용해 데이터를 탐색하고 새로운 사실, 특이한 알아내는 경우가 많다.
더 일반적으로 설명하자면 어떤 데이터를 보고 경험지식과 상식을 기반으로 어떤 중요한 결정을 해야할 때 판단에 도움이 되는 근거를 찾는 것을 말한다.
기술적으로 설명하면 데이터에 대한 특성을 파악하고 숨겨진 사실을 찾아내며 원인을 밝혀 내고 어떤 모형(model)을 만들어 내는 것까지 말하기도 한다.
데이터 분석은 데이터마이닝(data mining)을 포함하고 있다고 할 수 있지만 데이터마이닝이 컴퓨팅 기술을 더 적극저으로 사용하고 더 많은 양의 데이터를 다룬다는 차이가 있다. 하지만 이것이 데이터마이닝이 데이터분석보다 더 고급이라고 말할 수 있다는 것이 아니다. 데이터마이닝은 데이터분석의 하위의 개념이라고 볼 수 있다.
기계학습은 원인을 찾기 보다는 분석의 결과를 자동화된 방법으로 반복 적용하게 만드는 것이다.