기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
인쇄된 한글 문서의 폰트 인식
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 인쇄된 한글 문서의 폰트 인식
  • The Font Recognition of Printed Hangul Documents
저자명
박문호,손영우,김석태,남궁재찬,Park. Moon-Ho,Shon. Young-Woo,Kim. Seok-Tae,Namkung. Jae-Chan
간행물명
정보처리논문지
권/호정보
1997년|4권 8호|pp.2017-2024 (8 pages)
발행정보
한국정보처리학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

본 논문은 새로운 형태의 문서 통신 방식인 지적 커뮤니케이션 시스템(IICS : Intelligent Image Communication System)의 구현을 위하여 한글 문서를 대상으로 문서를 구성하는 문자의 서체와 문자의 크기 및 기울기를 인식하고 방법을 제안한다. 서체를 인식하기 위하여 문서에서 일정한 크기의 블럭을 추출하여 주파수 분석을 하였고, 단어의 외접 사각형의 수직 거리를 이용하여 문자의 크기를 인식하였다. 문자의 기울기를 인식하기 위하여 수직 방향의 투영 프로파일을 이용하였다. 서체 인식을 위한 인식기의 가변적인 히든 노드를 이용하여 오류 역전파 알고리즘으로 학습된 MLP(Multi-layer Perceptron)를 사용하였으며, 문자의 크기와 기울기를 분류하기 위하여 Mahalanobis distance를 이용하였다. 실험을 통하여 서체 분류는 10개의 서체에 대하여 평균 95.19%의 인식률을 얻었고, 문자의 크기 분류는 5가지의 문자 크기에 대하여 평균 97.34%의 인식률을 얻었으며, 문자의 기울기는 평균 89.09%의 인식률을 얻음으로써 제안된 방법의 유용성을 입증하였다.

기타언어초록

The main focus of this paper is the recognition of printed Hangul documents in terms of typeface, character size and character slope for IICS(Intelligent Image Communication System). The fixed-size blocks extracted from documents are analyzed in frequency domain for the typeface classification. The vertical pixel counts and projection profile of bounding box are used for the character size classification and the character slope classification, respectively. The MLP with variable hidden nodes and error back-propagation algorithm is used as typeface classifier, and Mahalanobis distance is used to classify the character size and slope. The experimental results demonstrated the usefulness of proposed system with the mean rate of 95.19% in typeface classification. 97.34% in character size classification, and 89.09% in character slope classification.