- SQL-like MapReduce 처리 플랫폼을 활용한 스마트 디바이스 UX 분석
- ㆍ 저자명
- 김성숙,김성규,Kim. Sungsook,Kim. Seonggyu
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 데이타베이스
- ㆍ 권/호정보
- 2014년|41권 2호|pp.90-99 (10 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
스마트 디바이스에 대한 UX(User eXperience) 분석을 위해서는 사용자와 디바이스간 제공된 정보 서비스에 대한 반응을 추적함으로써 개인의 사용자 경험을 보다 정확하게 확인할 수 있어야 한다. 하지만, 스마트 디바이스에서 발생한 로그데이터가 기존의 정형화된 방법으로는 처리 불가능할 정도로 급격하게 늘어나고 있어 대용량 데이터 처리를 위한 새로운 접근이 필요하며, 이에 본 논문에서는 UX 분석을 위한 대용량 데이터(Big Data)의 수집, 저장 및 처리의 유연성을 제공해 주는 하둡(Hadoop) MapReduce 프레임워크를 적용하였다. 현실적으로 하둡의 저비용 분산 병렬 시스템상에서 MapReduce 프로그래밍 작업의 코딩 및 Job 스케줄링을 UX 도메인 전문가가 직접 처리 하기에는 많은 어려움이 있으므로, 이를 해결하고자 SQL-like MapReduce 프로그래밍 도구로 SQL 스크립트를 제공하는 Hive와, 분석 결과의 시각화 도구로 오픈소스 데이터 분석 도구인 R을 연동시킨 스마트 디바이스 UX 분석 시스템을 설계하였다. 구현된 시스템에 실사용자 로그데이터를 적용한 실험을 통하여, 스마트 디바이스 웹 애플리케이션 메뉴들의 빈도 분석과 메뉴 간의 연관성 분석 결과 수치의 시각화 과정을 검증했으며, 이를 통해 제안된 시스템의 응용 가능성이 높음을 확인하였다.
To analyze UX(User eXperience) on a smart device, we need to track the reaction information of a user to the device. While tracking the reaction information, a personalized-UX for a device can be identified more clearly. However, since the amount of log data that are generated by a smart device is so big and growing rapidly, we have to find a new approach that can handle big data that are generated and saved by the device automatically. To solve this problem, in this paper we apply the MapReduce framework on Hadoop platform to acquire the flexibility in designing big data processing steps (i.e., log data acquisition/saving/analysis). In real situations, it is hard to expect that UX domain experts can code and schedule MapReduce jobs by themselves on distributed-parallel computing environments (i.e., hadoop). To cope with this fact, we design and implement an SQL-like MapReduce programming platform. In the environment, Hive which provides SQL-like interface to query the big data tables on HDFS is selected and R, an open source data analysis package, is adopted to visualize the analyzed data for the domain experts. In the experiments on the developed system, using real log data, we conduct a number of menu frequency and association analyses, and find that the applicability of the developed system is high.