- k-gram의 근사 매칭을 이용한 이진 프로그램의 비교 방법
- ㆍ 저자명
- 임현일,Lim. Hyun-Il
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
- ㆍ 권/호정보
- 2012년|18권 4호|pp.288-299 (12 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
소프트웨어의 중요성이 커지면서 소프트웨어의 특성을 이해하고, 비교하는 방법에 대한 연구가 많이 진행되고 있다. 본 논문에서는 명령어의 시퀀스에 기반한 k-gram 방법을 향상시키기 위해 k-gram에 근사 매칭을 적용하는 방법을 제안한다. 이 방법은 프로그램으로부터 추출한 k-gram을 비교할 때 일정 수준 이상의 유사성을 보이는 쌍을 매칭에 반영함으로써 기존의 k-gram 방법에 비해 신뢰성을 높일 수 있다. k-gram의 근사 매칭 방법의 성능을 평가하기 위해서 실제 자바 용용 프로그램을 대상으로 신뢰도 실험 및 유사 프로그램의 검출 능력 실험을 수행하였다. 실험 결과에서 기존의 k-gram 방법에 비해 보다 효과적으로 유사 프로그램을 검출할 수 있었으며, 프로그램의 비교 결과에 대한 높은 신뢰성을 확인할 수 있었다. k-gram의 근사 매칭 방법은 k-gram 방법을 이용해서 프로그램을 비교할 때 기존의 방법을 향상시키고 보완할 수 있는 방법으로 활용될 수 있을 것이라 기대된다.
As the role of software increases, there have been several researches on understanding the characteristics of software and comparing such information. In this paper, to improve the performance of k-gram method for comparing two binary programs, we propose to apply approximate matching of k-grams. This method tries to improve the reliability of comparison results by considering partially matched k-grams in two programs. To evaluate the performance of the approximate matching of k-grams, we performed experiments on credibility and detection of similar programs in real world Java applications. In the experimental results, the proposed method can detect similar programs effectively compared to previous k-gram method. The results showed that the proposed method produced more reliable results for comparing programs. The approximate matching of k-grams is expected to be practically used to improve the previous k-gram method in analyzing similarity of programs.