기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
차세대 시퀀싱으로 생성된 페어드 엔드 리드를 이용한 CNV 발견 기법
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 차세대 시퀀싱으로 생성된 페어드 엔드 리드를 이용한 CNV 발견 기법
저자명
문명진,박치현,윤영미,안재균,박상현,Moon. Myung-Jin,Park. Chi-Hyun,Yoon. Young-Mi,Ahn. Jae-Gyoon,Park. Sang-Hyun
간행물명
데이타베이스 연구
권/호정보
2009년|25권 3호|pp.59-76 (18 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

유전체 단위 반복 변이(Copy Number Variation, 이하 CNV)는 유전체의 구조적 변이 중 하나로, 하나의 개체에서 1Kbps(Kilo base pairs) 이상의 염기 서열의 반복 횟수가 다른 개체에 비해 많거나 적은 것을 뜻한다. CNV는 갖가지 질병과 개체간의 특징 발현에 직접적으로 영향을 미치는 것으로 알려져 있기에 CNV를 발견하는 것은 유전자 연구분야에서 매우 중요하다. 기존에는 CNV를 찾기 위해 마이크로어레이(microarray)를 이용한 기법이 주로 사용되었는데, 이는 마이크로어레이가 갖는 해상도의 제약과 노이즈로 인하여 길이가 긴 CNV를 찾기 어려우며, 오류가 많다는 문제점이 있다. 본 논문에서는 차세대 시퀀싱(next-generation sequencing) 기법으로 생성된 짧은 페어드 엔드리드(Paired-end read)들을 이미 밝혀진 염기 서열에 매핑(mapping하고 분석하여 CNV를 찾아내는 새로운 기법을 제안한다. 본 논문이 제안하는 기법은 염기 서열의 베이스 페어(base pair) 단위로 CNV 여부를 판단하므로 마이크로 어레이 기법으로 찾기 힘든 짧은 길이의 CNV까지 찾아낼 수 있다. 실험은 가상 데이터와 실제 데이터를 가지고 수행하였으며, 가상 데이터를 대상으로 한 오류율은 기존의 기법에 비해 낮아졌음을 보였다. 또한, 추가적으로 짧은 리드를 BLAST 대신 Bowtie를 통해 정렬함으로써 속도의 향상을 가져왔다.

기타언어초록

Copy Number Variation(CNV) is one of the genomic variants, which is caused by either amplification or deletions of DNA segments whose size is greater than 1Kbps. As it is known that CNVs account for a significant proportion of phenotypic variation, including disease susceptibility, identifying and cataloging of CNVs are essential for the genetic analysis of human genome variation. CNVs detected by microarray based approaches are limited to medium or large sized ones because of low resolution and noise of microarray. Here we propose a novel approach to detect CNVs by mapping the short paired-end reads obtained by next-generation sequencing to the previously assembled human genome sequence and analyzing them. This method demonstrates the feasibility of detecting CNVs which include short ones that microarray based algorithms cannot detect, as this method decide whether a region is a CNV or not based on the score of each base pair. The experiment was performed with both synthetic and real data. In the experiment with the synthetic data, false positive and false negative rates of the results were relatively lower than existing method. In addition, application of Bowtie for read-mapping improved speed compared to the existing method, which mapped reads with BLAST.