기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
NGS 데이터를 이용한 대용량 게놈의 디노버 어셈블리
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • NGS 데이터를 이용한 대용량 게놈의 디노버 어셈블리
저자명
원정임,홍상균,공진화,허선,윤지희,Won. JungIm,Hong. Sangkyoon,Kong. JinHwa,Huh. Sun,Yoon. JeeHee
간행물명
정보과학회논문지. Journal of KIISE. 데이타베이스
권/호정보
2013년|40권 1호|pp.26-35 (10 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

디노버 어셈블리는 레퍼런스 시퀀스 없이 리드의 염기 서열 정보를 이용하여 원래의 전체 시퀀스(original sequence)로 추정되는 시퀀스로 리드들을 재구성하는 방식이다. 최근의 NGS(Next Generation Sequencing) 기술은 대용량 리드를 훨씬 쉽게 저비용으로 생성할 수 있다는 장점이 있어, 이를 이용한 많은 연구가 이루어지고 있다. 그러나 NGS 리드 데이터를 이용한 디노버 어셈블리에 관한 연구는 국내외적으로 매우 미흡한 실정이다. 그 이유는 NGS 리드 데이터를 이용하여 디노버 어셈블리를 수행하는 경우 대용량 데이터, 복잡한 데이터 구조 및 처리 과정 등으로 인하여 매우 많은 시간과 공간이 소요될 뿐만 아니라 아직까지 다양한 분석 툴과 분석 노하우 등이 충분히 개발되어 있지 않기 때문이다. 본 연구에서는 NGS 리드 데이터를 이용한 대용량 게놈의 디노버 어셈블리를 위한 분석 방법론에 대하여 논하고, 다양한 실험과 분석을 통하여 디노버 어셈블리의 실효성과 정확성을 검증한다. 또한 디노버 어셈블리의 처리 시간 및 공간 오버헤드를 해결하기 위하여 유사 종과의 리드 정렬 결과를 활용하는 방안과 어셈블리 결과의 정확성과 효율성을 향상시키기 위하여 두 개의 서로 다른 디노버 어셈블리 알고리즘을 접목하는 하이브리드 디노버 어셈블리 기법을 제안한다.

기타언어초록

De novo assembly is a method which creates a putative original sequence by reconstructing reads without using reference sequence. Advanced studies in many areas use NGS data owing to the ultra high throughput and low cost. However, researches on de novo assembly using NGS data are not sufficient yet because de novo assembly requires a lot of execution time and memory space to process for large and complex structured NGS data. Furthermore analysis tools and know-hows to handle massive amount short reads such as NGS data have not been fully developed. This paper discusses a noble analysis method of de novo assembly in the use of large volume of NGS data and verify the effectiveness and the accuracy of the proposed method via various experiments. Then, we propose a method which aligns read data to sequences of similar species in order to overcome the resource overhead of de novo assembly. We also propose a hybrid method which combines two algorithms in order to increase the effectiveness and accuracy of de novo assembly.