[3-2] LOF

LOF : Local Outlier Factor

주변의 데이터 객체의 밀집도를 고려하여서 이상치를 정의할 수 있다.

k-distance of p

p 객체에서 가장 가까운 순으로 3번째 객체와의 거리는 1.5 입니다.

k-distance neighborhood of an object p

3번째 객체와의 거리 (1.5) 이하에 들어가있는 객체를 의미한다.

Reachability Distance

  • 반경위, 반경 밖 : 1.5 또는 그 이상으로 정의한다.

  • 반경 안 : 1.5 로 정의한다.

Local Reachability Density of an object p

가운데 점이 검정색이 p 이고 나머지 점이 o 일 때, 밀집된 Case 1 은 도달거리가 작아 분모가 작게 되므로 lrd 값은 크게 된다. Case 2 의 경우 도달거리가 커서 분모가 크게 되므로 lrd 값은 큰 값을 갖는다.

Local outlier Factor

Local outlier Factor 란 이상치 점수로 사용하며, 주변의 밀집도를 고려하여 이상치 점수를 환산한다. Case2 와 같이 밀집도가 양쪽에 높은 곳에 어느곳도 속하지 못한 객체는 이상치 점수가 높으며, Case3 과 같이 주변 밀집도가 낮으면 정상으로 생각하게 된다.

Last updated