- 차세대 시퀀싱을 위한 짧은 서열 정렬에 대한 기술조사
- ㆍ 저자명
- 박민서,김판규,Park. Min-Seo,Kim. Pan-Gyu
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2011년|38권 10호|pp.503-511 (9 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
차세대 시퀀싱 기술은 전통적인 Sanger시퀀싱 방법보다 저렴한 비용과 빠른 데이터 생산 속도 등의 장점을 이용하여 빠르게 발전되었다. 현재 많이 사용되는 차세대 시퀀싱 기술 방식은 Roche의 GS-FLX, Illumina (Solexa)의 Genome Analyzer, Life Technologies의 SOLiD방식이다. 차세대 시퀀싱 기술 방식을 통해서 생산되는 단편서열들은 Sanger시퀀싱을 통해서 생산되는 서열에 비해서 그 길이가 짧고, 대량의 단편서열용 사용하기 때문에, 서열 재조합시 참조 서열을 이용한 맵핑이 활용된다. 다량의 짧은 서열의 빠른 처리를 위해 인덱싱 기반의 휴리스틱 알고리즘들이 개발되어 사용되고 있다. 이러한 방법으로는 해쉬 테이블에 기반한 방법, 접미사 트리에 기반한 방법, 접미사 배열의 변형된 형태인 Burrows-Wheeler transform에 기반한 방법이 있다. 이 논문에서는 현재 개발된 서열 정렬 알고리즘들을 살펴보고, 다양한 차세대 시퀀싱 맵핑 프로그램들을 소개한다.
Next-generation sequencing (NGS) technologies have been rapidly advanced. These new technologies are higher throughput with lower costs compared to the Sanger sequencing. Recently available next-generation sequencers are the GS-FLX (Roche), Genome Analyzer (Illumina), and SOLiD (Life Technologies). However, the NGS produces much shorter sequences (reads) and large volumes of reads compared to conventional sequencing, whereby huge amounts of short reads are aligned onto a reference. For fast mapping of the massive amounts of short reads, a lot of mapping algorithms/programs have been developed by indexing-based heuristic algorithms: Hash table-based, Suffix tree-based, and Burrows-Wheeler transform (BWT)-based algorithms. In this article, we review the current alignment algorithms, and introduce NGS mapping programs.