- 고정적 차수의 관계형 테이블을 기반으로 한 온라인 고객리뷰의 분석 기법
- ㆍ 저자명
- 김근형,Kim. Keun-Hyung
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 데이타베이스
- ㆍ 권/호정보
- 2011년|38권 5호|pp.263-269 (7 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
온라인 고객리뷰들은 그 길이가 다르기 때문에 관계형 테이블로 변환하여 처리할 때 공값(null)들이 많이 발생하게 되며, 이는 처리시간과 저장공간을 낭비하게 되는 요인이 된다. 본 논문에서는 비정형 데이터인 온라인 고객리뷰를 관계형 테이블로 변환할 때 테이블의 차수를 고정하여 공값을 최소화시킴으로써, 처리시간을 단축시키고 저장공간을 절약할 수 있는 새로운 기법을 제안하였다. 본 논문의 아이디어를 기반으로 한 프로토타입 시스템을 구현하여 변환테이블 유형에 따른 명사출현 빈도수 생성시간을 비교한 결과, 고정적 변환테이블에 의한 계산시간이 더 짧음을 알 수 있다. 특히, 고정적 변환테이블의 차수를 작게 설정할수록 계산시간이 단축됨을 알 수 있었다.
In case of transforming online customer reviews into relational table, there exist many null values in the table because the lengths of each online customer reviews are different. The null values might bring both the delay of processing time and wastefulness of storage. In this paper, we proposed the novel techniques of decreasing the processing time and storage space for analyzing the online customer reviews. The basic idea of the technique is to fix the degree of relational table and reduce null values when transforming the online customer reviews to relational table. We implemented the prototype system for analyzing the reviews in order to evaluate how different the performances in calculating the frequencies of appearances of nouns are between types of the transformation tables. We confirmed that the transformation table with constant degree derived excellent performance. In particular, we recognized that the smaller the degree of the constant transformation table, the shorter the time in calculating the frequencies.