데이터 플랫폼은 데이터를 저장, 처리, 수정, 삭제하는데 사용하는 소프트웨어 또는 소프트웨어를 기반으로 한 서비스를 말한다. 데이터 분석을 하기 위해서는 수집 또는 입력한 데이터를 저장하는 것부터 시작해서 쌓인 데이터를 스트리밍 또는 일괄 작업으로 처리해서 요약 또는 변형해서 또 다른 데이터 플랫폼에 넣거나 통계를 추출해서 분석을 하거나 기계학습의 학습 데이터로 사용해서 모델을 만드는데 사용한다.
빅데이터, 데이터과학에서 데이터 플랫폼은 필수라고 볼 수 있다. 데이터 플랫폼이 없이 데이터과학을 하지 못하는 것은 아니지만 그런 일은 매우 힘든 일이 될 것이다.