원소(element)는 자료의 수집대상이 되는 것을 말한다. 변수(variable)는 원소에서 관심의 대상이 되는 구체적인 특성을 말한다. 기계학습에서는 자질(feature)이라고 한다. 모든 원소들에 대해서 각각의 변수들을 측정한 것을 관측치(observation)이라고 한다.
이름이나 기호를 이용해 표기한 변수값은 명목척도(nominal scale)가 측정단위이며 명목자료라고 한다. 자료가 명목자료이고 순서도 있다면 측정단위를 순서측도(ordinal scale)이라고 하며 순서자료라고 한다. 자료가 순서자료의 특성을 가지고 값들의 차이가 고정된 측정단위로 표현된다면 구간척도(interval scale)이라고 한다. 자료가 순서특성을 가지고 있으며 두 값의 비율이 의미가 있다면 측정단위는 비율척도(ratio scale)이라고 한다.
정성적(qualitative data)는 원소의 특징을 나타내기 위해 이름이나 기호를 사용한다. 정량적(quantitative data)는 얼마나 많은가 또는 얼마나 큰가를 표현하기 위해 숫자를 사용한다.
관측조사(observational study)와 실험조사(experimental study)로 구분할 수 있다.