- 데이터 스트림과 산발적으로 변하는 디스크 기반 릴레이션 간의 연속 조인 질의 처리 기법
- ㆍ 저자명
- 이기용,최현진,이서연,Lee. Ki Yong,Choi. Hyunjean,Lee. Seoyeon
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 데이타베이스
- ㆍ 권/호정보
- 2012년|39권 6호|pp.333-345 (13 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
빠른 속도로 유입되는 데이터를 데이터 웨어하우스에 실시간으로 반영하고자 하는 능동 혹은 실시간 데이터 웨어하우스에 대한 연구가 최근 활발히 진행되고 있다. 능동 데이터 웨어하우스의 실현에 중요한 요소 중 하나는 빠른 속도로 유입되는 데이터 스트림 S와 데이터 웨어하우스에 저장된 디스크 기반의 대규모 릴레이션 R 간의 연속 조인 질의 S ? R를 효율적으로 처리하는 것이다. 최근 이러한 형태의 질의를 효율적으로 처리하기 위해 메쉬 조인이라는 방법이 제안되었다. 이 방법은 S에 새로운 튜플들이 도착했을 때, 이들과 조인되는 튜플들을 찾기 위해 R에 접근하는 비용을 크게 줄임으로써 효율적으로 S ? R을 처리한다. 하지만 이 방법은 R이 전혀 변하지 않는다고 가정하고 있으며, 질의 처리 중에 R이 변경되면 잘못된 결과를 내보낸다는 문제점이 있다. 본 논문에서는 연속 조인 질의 S ? R의 처리 중 R이 변경되는 경우에도, 그를 반영하여 항상 올바른 조인 질의 결과를 내보내는 방법을 제안한다. 본 논문은 제안방법이 항상 올바른 질의 결과를 내보냄을 증명하며, 실험을 통해 제안하는 방법의 실용성을 보인다.
Recently, active or real-time data warehouses have been increasingly investigated. where all updates to data sources are propagated immediately to the warehouse so that users can always access up-to-date information. One of the most important elements in building an active data warehouse is to efficiently process a continuous join query S ? R, where S is a fast data stream and R is a large disk-based relation stored in the warehouse. In order to process such queries efficiently, a new method called mesh join has been proposed recently, which improves performance by reducing the high I/O cost of accessing R as new tuples of S continuously arrives. However, it assumes that R remains fixed while the query is running, so it can produce the wrong results if R changes during query processing. To address this problem, we propose a new method for processing S ? R that always produces the correct results even when R changes during query processing. We also prove the correctness of the proposed method and show the practicability of the proposed method through experiments.