기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
맵리듀스 기반의 암 특이적 단위 반복 변이 영역 추출
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 맵리듀스 기반의 암 특이적 단위 반복 변이 영역 추출
저자명
신재문,홍상균,공진화,이은주,윤지희,Shin. Jae-Moon,Hong. Sang-Kyoon,Kong. Jin-Hwa,Lee. Un-Joo,Yoon. Jee-Hee
간행물명
정보과학회논문지. Journal of KIISE. 데이타베이스
권/호정보
2013년|40권 5호|pp.305-318 (14 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

모든 암 세포는 체세포 변이를 동반한다. 암 유전체 변이 분석에 의하여 암을 발생시키는 유전자 및 진단/치료법을 찾아낼 수 있다. 본 연구에서는 차세대 시퀀싱 데이터를 이용하여 암 특이적 단위 반복 변이(copy number variation, CNV) 영역을 찾아내는 새로운 데이터 마이닝 알고리즘을 제안한다. 제안하는 방식에서는 암 환자의 암 유전체와 동일인의 정상 유전체에 존재하는 CNV 후보 영역을 각각 추출한 후, 이 들 결과를 상호 비교 분석하여 암 특이적 CNV 영역만을 선별해낸다. 본 연구에서 개발한 병렬 알고리즘은 암과 정상 유전체 데이터를 동시에 분석하여 암 특이적 CNV 영역을 추출/보고하며, 하둡(Hadoop) 환경의 맵리듀스(Map/Reduce) 함수에 의하여 이들 데이터를 분산, 병행 처리한다. 성능 평가를 위하여 악성 흑색종과 유방암 환자의 암/정상 유전체 데이터를 이용한 실험을 수행하였으며, 그 결과를 통해 제안된 방식이 대규모의 유전체 데이터로부터 암 특이적 CNV 영역의 타입 및 위치를 효율적으로 추출하고 있음을 보인다.

기타언어초록

The genomes of all cancer cells carry somatic mutations. Therefore, analyses of cancer genomes provide insight for understanding cancer-causing genes, diagnosis and therapy. In this work, we propose a data mining algorithm to detect cancer-specific copy number variation (CNV) regions by using next generation sequencing (NGS) data. The proposed method detects the candidate CNV regions from a cancer genome and the matched normal genome from the same individual, respectively, and identifies the cancer-specific CNVs by comparing the candidate CNV regions of a cancer genome with those of the matched normal genome. In this study, we also propose a novel parallel algorithm which simultaneously analyzes data from the cancer and patient-matched normal samples to identify cancer-specific CNV regions. This method is able to simultaneously perform tasks with large numbers of computing nodes using map and reduce functions in Hadoop project. The preliminary results conducted with the malignant melanoma and breast cancer data showed the prominent efficiency in identifying the types (gains or losses) and the exact locations of the cancer-specific CNVs.