- 시계열 데이터베이스의 상관관계 보존 노이즈 생성
- ㆍ 저자명
- 홍선경,홍준호,문양세,Hong. Sun-Kyong,Hong. Junho,Moon. Yang-Sae
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 데이타베이스
- ㆍ 권/호정보
- 2013년|40권 5호|pp.319-327 (9 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
본 논문에서는 시계열 데이터에 대한 랜덤 노이즈 생성 시, 프라이버시뿐 아니라 상관관계를 보존하는 새로운 접근법을 제안한다. 민감한 시계열 데이터의 프라이버시 보호를 위해, 기존의 랜덤 노이즈 추가 기법은 균등(uniform) 혹은 가우시안(Gaussian) 분포를 기반으로 생성한 노이즈를 원본 데이터에 추가하여 제3자(데이터 마이너)에 공개한다. 그러나 이러한 랜덤 노이즈 추가 기법은 시계열 간 상관관계를 왜곡하거나 아예 없앨 수 있다는 문제점이 있다. 시계열 간 상관관계는 보다 정확한 마이닝 결과를 얻기 위해 매우 중요한 척도이다. 본 논문에서는 상관관계 보호를 위해 시계열의 원본 엔트리와 이에 대응하는 노이즈 엔트리의 부호를 일치시키는 간단하면서도 효율적인 전략을 제시하고, 이를 사용하는 상관관계 보존 노이즈 생성(correlation-aware noise generation)의 새로운 접근법을 제안한다. 엔트리들의 부호는 상관관계에 큰 영향을 미치기 때문에, 동일한 부호를 유지하는 것이 상관관계 보존에 매우 중요한 역할을 한다. 본 논문에서는 실제 데이터 대상의 실험을 통해, 시계열 상관관계를 보존하는 관점에서 제안한 기법의 우수성을 보인다.
This paper proposes a novel approach that preserves correlation as well as privacy in generating random noise to time-series data. To preserve privacy of sensitive time-series data, the existing techniques generate random noise data based on uniform or Gaussian distributions and add them to the original data. These additive random noise techniques, however, have a critical problem of destructing (i.e., not preserving) the correlation among time-series. Correlation among time-series is very important to acquire the more accurate mining results. To preserve the correlation, in this paper we propose a correlation-aware noise generation approach, which is a simple but effective approach that generates a noise value to have the same sign with its corresponding original entry. This is because the signs of entries make a large influence on the correlation measure, and thus, preserving the same signs is important to improve the correlation preservation. We empirically show the superiority of the proposed approach in the viewpoint of preserving the time-series correlation.