TFIDF - Term Frequency Inverse Document Frequency

TF-IDF는 문서를 벡터화 할 때 문서내의 텀(term)들에 수치를 가중치가 적용된 형태로 부여하는 방법 중의 하나이다.

TF-IDF는 정확한 용어로 TF-IDF weighting scheme이라고 부르는데 이중에 weighting은 가중치를 고려한다는 뜻이고 scheme의 뜻이 방법 또는 방안이라는 뜻이다.