- 변형된 팩터 분석 모델을 이용한 생체데이타 분류 시스템
- ㆍ 저자명
- 조민국,박혜영,Cho. Min-Kook,Park. Hye-Young
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2007년|34권 7호|pp.667-680 (14 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
생체데이타 프로세싱이란 인간개체로부터 얻을 수 있는 고유의 생체 신호를 이용하여 다양한 목적으로 사용하는 것으로, 최근 이에 대한 요구가 높아지고 있다. 생체데이타는 도메인의 특성상, 클래스의 수는 많고 해당 클래스 내의 데이타는 상당히 제한적일 수 있어서 그만큼 데이타 내에 포함된 노이즈에 민감하게 된다. 따라서 기존의 패턴 인식과 분류 방법을 그대로 적용하여 개발된 시스템의 경우는 높은 일반화 성능을 기대하기 힘들다. 이를 해결하기 위해 본 논문에서는 생체데이타가 가지는 특성을 고려하여 각 클래스 고유의 특성에 영향을 미치는 클래스 요인과 노이즈와 같이 전체 데이타에 영향을 미치는 환경 요인으로 구성된 변형된 팩터 분석 모델로 생체데이타 생성 모델을 정의한다. 이를 바탕으로 분류에 필요한 데이타간 이격(inter-data discrepancy) 정보를 추출하고 새로운 유사도 함수를 정의하여 분류기에 적용한다. 제안하는 방법은 분류 대상이 되는 클래스의 정보 팔용을 극대화 하여 적은 수의 데이터로부터 노이즈에 강인한 결과를 얻을 수 있다. 실제 생체데이타를 적용한 실험에서 제안하는 방법이 기존의 방법 보다 우수한 분류 성능을 보임을 확인할 수 있었다.
The bio-data processing is used for a suitable purpose with bio-signals, which are obtained from human individuals. Recently, there is increasing demand that the bio-data has been widely applied to various applications. However, it is often that the number of data within each class is limited and the number of classes is large due to the property of problem domain. Therefore, the conventional pattern recognition systems and classification methods are suffering form low generalization performance because the system using the lack of data is influenced by noises of that. To solve this problem, we propose a modified additive factor model for bio-data generation, with two factors; the class factor which affects properties of each individuals and the environment factor such as noises which affects all classes. We then develop a classification system through defining a new similarity function using the proposed model. The proposed method maximizes to use an information of the class classification. So, we can expect to obtain good generalization performances with robust noises from small number of datas for bio-data. Experimental results show that proposed method outperforms significantly conventional method with real bio-data.