- n-gram 파티클을 이용한 베이지안 필터링 기법
- ㆍ 저자명
- 장하영,장병탁,Jang. Ha-Young,Zhang. Byoung-Tak
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2013년|40권 5호|pp.241-247 (7 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
베이지안 필터링을 관측데이터와 연관된 확률을 이용하여 관찰된 데이터를 성명할 수 있는 은닉 변수를 설정하여 마코프 연쇄를 따르는 은닉 변수의 값을 추정하는 모델로 칼만 필터나 파티클 필터 등의 방법이 대표적이다. 본 논문에서는 대담 형식으로 구성된 데이터를 임의보행 확률과정을 따르는 시계열 데이터로 간주하고, 이야기 흐름의 전환이 마코프 연쇄에 의해 결정된다고 가정하여 베이지안 필터링 기법을 이용한 대화 분석 기법을 제시하였다. 제안한 방법론은 n-gram 언어모델과 베이지안 필터링 기법을 결합하여 말뭉치로부터 n-gram 언어모델을 구축하여 이를 초기 분포로 이용하고, 이를 파티클로 이용하여 이야기 흐름의 전환을 예측하게 된다. 일반적으로 언어 데이터는 그 특성상 베이지안 필터링 기법의 폭넓은 적용이 어려운데 본 논문에서 제시한 n-gram 언어모델과 베이지안 필터링 기법을 결합을 통해서 언어처리에 있어서 베이지안 필터링 기법의 보다 넓은 적용이 가능할 것으로 기대된다.
Bayesian filtering is a general probabilistic approach for estimating an unknown probability density function recursively over time using incoming measurements and a mathematical process model. Kalman filter and particle filters are the typical applications of it. We propose the n-gram filtering method to detect the conversational humor in spontaneous dialogue. This spontaneous dialogue is regarded as a kind of time series data which follows random walk process. The proposed method detects the conversational humor using the n-gram particle filter. The proposal distribution of n-gram particle filtering is selected by the n-gram language model. We expect that n-gram filtering methods provide very efficient way to use the sequential and temporal information in language data such as dialogue, storytelling and so on.