기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
Structural SVM을 이용한 한국어 띄어쓰기 및 품사 태깅 결합 모델
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • Structural SVM을 이용한 한국어 띄어쓰기 및 품사 태깅 결합 모델
저자명
이창기,Lee. Changki
간행물명
정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
권/호정보
2013년|40권 12호|pp.826-832 (7 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

한국어 띄어쓰기 모듈과 품사 태깅 모듈을 2단계로 연결하는 파이프라인(pipeline) 방식은 앞 단계인 띄어쓰기 모듈의 오류가 뒷단계에 누적이 되는 단점이 있다. 이러한 오류 누적을 없애고 앞 단계인 띄어쓰기 모듈에서 뒷단계의 품사 정보를 사용할 수 있게 하기 위해서, 본 논문에서는 structural SVM을 이용한 한국어 띄어쓰기 및 품사 태깅 결합 모델을 제안한다. 실험결과 띄어쓰기 단일 모델과 품사 태깅 단일 모델을 파이프라인 방식으로 연결할 경우 96.77%의 품사 태깅 성능을 보였으나, 띄어쓰기 및 품사 태깅 결합 모델은 96.99%의 품사 태깅 성능을 보였다.

기타언어초록

Typically, a Korean Part-of-speech (POS) tagger takes the inputs that are produced by a separate Korean word spacer. However this pipeline approach has an obvious flaw of error propagation, since the POS tagger cannot correct word spacing errors. In this paper, we describe a joint model for Korean word spacing and POS tagging using structural SVM to avoid error propagation and improve word spacing by utilizing POS information. In the case of a pipeline approach, we could achieve a 96.77% morpheme-based F-measure for POS tagging. Using the joint model, we could achieve a 96.99% morpheme-based F-measure for POS tagging. Experimental results show that the joint model outperforms the pipeline approach.