기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
단백질의 세포내 위치 예측을 위한 강화된 접미사 배열 기반의 고속 서열탐색
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 단백질의 세포내 위치 예측을 위한 강화된 접미사 배열 기반의 고속 서열탐색
저자명
지상문,Chi. Sang-Mun
간행물명
정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
권/호정보
2013년|40권 9호|pp.483-490 (8 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

단백질의 세포내 위치를 예측하는 많은 방법들은 질의 단백질과 서열 유사성이 높은 단백질의 정보를 이용한다. 본 논문은 이러한 서열 유사성이 큰 단백질들을 고속으로 찾는 방법을 제안한다. 이를 위해, 유전체 데이터베이스에서 질의 DNA 서열의 위치를 찾는데 이용되는 강화된 접미사 배열을 단백질 데이터베이스 탐색에 적합하게 수정한다. 강화된 접미사배열의 하향식 순회 탐색과 이전 탐색결과의 재사용을 이용하여 데이터베이스내의 단백질 중에서 질의 서열의 부분 서열들과 자주 일치하는 서열들을 데이터베이스 크기와 무관하게 질의서열 길이의 선형 시간 복잡도로 찾는다. 찾아진 서열들에 대해서 스미스-워터만 알고리즘을 사용하여 최종 유사 단백질을 찾는다. 제안 방법은 서열탐색에 가장 널리 쓰이는 BLAST에 비해서 약 300배의 빠른 탐색 속도를 보였고, 단백질의 세포내 위치예측에 적용할 경우 BLAST를 사용하는 방법에 비하여 정확성이 향상되었다.

기타언어초록

For predicting subcellular localization of proteins, many methods exploit information of proteins having high sequence similarity to a query sequence. This paper proposes a fast sequence search method to find these highly similar proteins in database. For protein database search, we adopt enhanced suffix arrays which are used for finding the position of query DNA sequences in genome database. We use top-down traversal and reuse of previously searched results of enhanced suffix arrays for fast search. The time complexity for searching candidate proteins having many exact matches to the sub-sequences of a query protein is proportional only to the length of the query sequence, not dependent on database size. Smith-Waterman algorithm is applied to find the most similar protein in these candidate proteins. Comparing with most widely used search method BLAST, the proposed method shows 300 times faster search speed and gives higher prediction accuracies in protein subcellular localization prediction.