- 민감한 항목집합을 숨기기 위한 tFP-Tree기반 BHSFI 알고리즘
- ㆍ 저자명
- 이단영,안형근,Lee. Dan Young,An. Hyoung Keun
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 데이타베이스
- ㆍ 권/호정보
- 2012년|39권 6호|pp.361-371 (11 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
민감한 정보 숨기기 알고리즘을 민감한 정보를 보호하기 위하여 트랜잭션 데이터베이스를 변경한다. 데이터 변경은 삭제 접근 방법들 중 하나이다. 민감한 정보를 숨기는 이전 연구들은 결과 데이터베이스의 품질을 유지하기 위해 서로 다른 휴리스틱 알고리즘을 적용했다. 그러나 민감한 정보를 숨기는 과정에서 변경되는 항목집합에 대한 영향을 평가하거나 숨겨지는 항목을 최소화하는 연구들은 미흡하였다. 본 논문에서는 민감한 빈발 항목집합을 숨기기 위하여 BHSFI(Border-based Hiding Sensitive Frequent Itemsets) 알고리즘을 제안한다. 본 알고리즘에서 tFP-Tree의 노드 정보는 기존과는 다르게 빈발 항목집합 생성단계에서 트랜잭션 정보와 민감 정보, 경계 정보를 모두 구성하며, 숨기는 과정에서 비민감한 빈발 항목집합의 영향을 줄이기 위하여 경계를 사용하였다. 본 논문의 예시 트랜잭션 데이터베이스에 BHSFI를 적용한 결과, 손실 항목을 크게 감소시킴으로써 기존 방법들에 비해 효과적임을 증명하였고, 보다 개선된 데이터베이스의 품질을 유지할 수가 있었다.
Sensitive information hiding algorithms often modify transactional databases for protecting sensitive information. Data modification is one of the most important sanitation approaches. Previous research hiding sensitive information applied different heuristic algorithms to maintain quality of the database. But there have been few studies analyzing the effects on the items modified during the hiding process and trying to minimize the hidden items. This paper suggests the border based BHSFI algorithm to hide sensitive frequent itemsets. Node formation of the tFP-Tree which is different from the previous one uses the border to minimize the impacts of nonsensitive frequent itemsets in a hiding process, including the organization of sensitive and border information, and all transactions as well. By applying the BHSFI algorithm to an example transaction database, we show that the algorithm is more effective than the existing one in maintaining the high quality of a database owing to its significant reduction of the lost items.