- 다차원 스트림 데이터의 온라인 점진적 학습을 위한 순차적 예측 모델
- ㆍ 저자명
- 허민오,이상우,장병탁,Heo. Min-Oh,Lee. Sang-Woo,Zhang. Byoung-Tak
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
- ㆍ 권/호정보
- 2013년|19권 8호|pp.419-423 (5 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
실생활 속에서 존재하는 다양한 센서 데이터 스트림은 실시간으로 끊임없이 유입되면서도 장기적으로 분포가 변할 수 있는 특성을 지닌다. 이러한 데이터의 학습에는 점진적인 학습을 수행하면서도 동시에 순차적 예측이 가능한 모델을 필요로 한다. 이에 따라, 본 고에서는 다차원 스트림 데이터를 위한 시계열 예측을 다루는 새로운 모델을 제안한다. 이 모델은 순차적인 정보를 지닌 패턴들의 집합과 해당 패턴들이 나타난 빈도를 이용하여 표현되며, 이를 기반으로 시계열 예측을 수행한다. 본 모델의 타당성을 평가하기 위해, 분포를 아는 문자서열을 생성하여 조건부 확률분포가 학습됨을 보였다. 또한, 스마트폰 내 GPS 센서를 이용하여 수집한 실제 사용자의 이동 데이터를 이산화하여 이제까지 이동해온 도로를 통해 다음에 이동할 도로를 예측하는 문제를 해결하고, 그 분석 결과를 통해 본 모델의 특성을 실험적으로 확인하였다.
Data streams from real-world sensors inherently have features of open-ended inflow and of changeable distribution in the long term (e.g., concept drift). To learn these data, we need sequential prediction models learnable online incrementally. Here, we propose novel models for multidimensional time-series data stream. The models are represented with a set of sequential patterns and the corresponding frequencies, and perform probabilistic sequential prediction tasks based on them. As model regularization, the maximum number of patterns is able to be limited. To validate the learning methods, we show that they successfully learn conditional distributions with random generated strings. Moreover, next-position prediction task also performed using street sequences from GPS sensors embedded in smartphones. From them, we validate the characteristics of the model experimentally.