- k 근접 이웃 그래프 기반 매니폴드 학습에서의 k의 선택
- ㆍ 저자명
- 최현석,박혜영,Choi. Hyun-Soek,Park. Hye-Young
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2011년|38권 9호|pp.497-502 (6 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
최근 고차원 데이터에 내재된 저차원 매니폴드 구조를 찾고 이를 패턴인식에 활용하는 다양한 연구가 수행되었다. 이 중 ISOMAP, LLE, LPP, GNMF 등의 방법은 k 근접 이웃 그래프(k-Nearest Neighbor Graph)를 기반으로 고차원 입력 데이터에서 저차원 매니폴더 구조를 효과적으로 찾을 수 있음을 보여주었다. k 근접 이웃 그래프를 이용한 매니폴드 구조 탐색 방법은 구성된 그래프에 따라 획득된 저차원 매니폴드 구조가 달라질 수 있으며, 따라서 적합한 k의 값을 선택하는 것은 추후 패턴인식기의 성능에 직접적인 영향을 미친다. 본 연구에서는 k 근접 이웃 그래프에서 각 샘플이 k 번째 이웃과 가지는 거리의 변화를 관찰함으로써 데이터 별로 적합한 k를 탐색하는 방법의 제안을 목적으로 한다. 특히 패턴인식 문제에 적합한 매니폴드 학습방법인 LPP를 중심으로 각 데이터에 대해 k 근접 이웃 그래프를 구성하고 이웃 간의 거리합에 기반하는 k의 평가함수를 제안하였다. 또한 실제 패턴인식 응용 데이터를 이용한 분석 실험을 통해 제안하는 평가함수의 적절성을 확인하였다.
Recently, there have been various studies on searching inherent low-dimensional manifold structure of high-dimensional data in order to utilize them for pattern recognition. ISOMAP, LLE, LPP, and GNMF, which are based on k-Nearest Neighbor Graph, have shown that they can find the inherent low-dimensional manifold structure. Since the discovered low-dimensional manifold structure depends on the k-Nearest Neighbor Graph, it is important to choose an optimal user parameter k for constructing k-Nearest Neighbor Graph. The purpose of this paper is to present an efficient method for searching an optimal user parameter k by observing the change of distance between each sample and its neighbor. Focusing especially on LPP method, which is appropriate for pattern recognition, we propose an evaluation function of k using the sum of distance among neighbor samples. Through computational experiments on several benchmark data sets, we confirm that the proposed measure can suggest a proper k for pattern recognition.