태그: 의사결정나무
이 태그가 포함된 글들입니다. (총 2개)
랜덤포레스트
랜덤포레스트 (Random Forest) #
랜덤포레스트(Random Forest)는 여러 개의 의사결정나무를 조합하여 예측 성능을 향상시키는 앙상블(Ensemble) 학습 기법이다. 배깅(Bagging)과 무작위 특성 선택을 결합하여 개별 의사결정나무의 단점을 보완하고, 더 안정적이고 정확한 예측을 제공한다.
랜덤포레스트 이름의 의미 #
“랜덤포레스트"라는 이름은 두 가지 핵심 개념에서 유래되었다:
-
포레스트(Forest, 숲): 여러 개의 의사결정나무(Decision Tree)들이 모여 하나의 “숲"을 이룬다는 의미이다. 하나의 나무가 아닌 많은 나무들이 함께 작동하여 더 강력한 예측력을 만들어낸다.
-
랜덤(Random, 무작위): 각 나무를 학습할 때 두 가지 무작위성을 도입한다:
의사결정나무
의사결정나무 (Decision Tree) #
의사결정나무(Decision Tree)는 데이터의 특성을 기준으로 트리 구조를 만들어 분류나 회귀를 수행하는 지도학습 알고리즘이다. 트리의 각 노드에서 특정 조건을 만족하는지에 따라 데이터를 분할하며, 최종적으로 잎 노드(leaf node)에서 예측값을 결정한다.
한국어로 번역하면 조금 어색해서 실무에서는 “디씨션트리”라고 그냥 읽는다.
의사결정나무의 기본 개념 #
의사결정나무는 사람의 의사결정 과정과 유사한 방식으로 작동한다. 예를 들어, “날씨가 맑은가?”, “온도가 25도 이상인가?“와 같은 질문들을 순차적으로 하면서 최종 결정에 도달하는 과정과 같다.