기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
Hitting Set 문제를 이용한 차세대 염기서열 분석 리드의 처리속도 개선 방법
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • Hitting Set 문제를 이용한 차세대 염기서열 분석 리드의 처리속도 개선 방법
저자명
박태원,김소라,최석문,조환규,이도훈,Park. Tae-Won,Kim. So-Ra,Choi. Seok-Moon,Cho. Hwan-Gue,Lee. Do-Hoon
간행물명
정보과학회논문지. Journal of KIISE. 시스템 및 이론
권/호정보
2011년|38권 6호|pp.275-280 (6 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

최근에 등장한 Next Generation Sequencing(NGS)은 전통적인 방법에 비해 빠르고 저비용으로 대용량의 단편 서열 데이터를 얻을 수 있는 차세대 염기서열 분석 기술을 말한다. 이렇게 얻어진 NGS 데이터를 분석하는 단계 중에서 얼라인먼트(alignment) 단계는 시퀀서에서 얻은 대량의 리드(read)를 참조 염기서열에 맵핑하는 단계로 NGS 데이터 분석의 가장 기본이면서 핵심인 단계이다. 얼라인먼트 도구는 긴 참조 염기서열을 색인화해서 짧은 리드를 빠르게 맵핑하는 용도로 사용된다. 현재 많이 사용되고 있는 일반적인 얼라인먼트 도구들은 입력데이터에 대한 별도의 전처리 과정이 없으며 나열된 리드를 순차적으로 맵핑하는 단순한 구조를 가지고 있다. 본 논문은 NGS 데이터의 특징 중에 특히 리드간의 중복성을 이용한 리드의 효율적 공통 부분서열을 찾는 방법을 보여준다. 중복된 공통 부분서열과 그것이 포함된 리드의 관계를 그래프 이론의 Hitting Set 문제로 모델링하고 여러 리드가 포함하는 공통 부분서열을 사용해서 얼라인먼트 단계의 효율을 높일 수 방법을 제안한다.

기타언어초록

Next Generation Sequencing(NGS) is a faster and lower cost new sequencing technique getting huge-large scale fragment, called reads, sequence data than traditional sequencing. The next step to analyze the large-scale reads is to align to the reference genome sequence which is a fundamental and most important stage. Alignment tools in NGS are used for mapping short reads quickly using a indexed reference sequence. Most general alignment tools process listed reads sequentially without analyzing redundancy of inter-read of NGS data. In this paper, we explore efficient common subsequences using redundancy of inter-read in characteristics of NGS data. Relation between redundant common subsequences and reads containing them is modeled as hitting set problem in graph theory. Also we suggest a way to improve performance of alignment stage.