Anomaly Detection Isolation Forest 오늘은 Anomaly Detection의 한 방법인 Isolation Forest 알고리즘에 대해 설명해보려고 한다. Forest는 이미 우리에게 익숙한 앙상블의 한 기법이다. 기존의 트리는 entropy나 gini impurity를 사용해 information gain 구해 트리를 분기하는 방식이지만 isolation forest는 조금 다른 트리 분기 방식을 사용하고 있다. Isolation Forest는 알고리즘 이름 그대로 아주 직관적인 방법이다. 각 데이터 포인트들이 몇번만에 데이터가 고립되는지에 따라 이상치를 판별한다. 위의 그림을 보면 \(x_i\)는 비교적 normal 데이터이고 \(x_o\)는 abnormal 데이터로 보여진다..