기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
다중 인스턴스 학습 기반 소셜 미디어 사용자 프로파일 식별
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 다중 인스턴스 학습 기반 소셜 미디어 사용자 프로파일 식별
저자명
송현제,김아영,박성배,Song. Hyun-Je,Kim. A-Yeong,Park. Seong-Bae
간행물명
정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
권/호정보
2013년|40권 4호|pp.233-240 (8 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

본 논문에서는 소설 네트워크 서비스에서 작성된 텍스트들로부터 사용자 프로파일을 식별하는 문제를 다룬다. 기존 연구에서는 텍스트 개별을 프로파일의 식별 단위로 간주한다. 각 텍스트마다 프로파일을 식별한 후, 식별된 결과들을 합쳐 최종적으로 프로파일을 식별한다. 하지만 소셜 네트워크 서비스 특성상 사용자가 작성한 텍스트 중에는 프로파일을 식별하는 데에 영향을 끼치지 않는 텍스트들이 다수 존재하여, 기존 연구들은 이들을 단순히 학습 및 텍스트에 사용함으로 인해 프로파일 식별 성능이 저하되는 문재점이 있다. 본 논문에서는 다중 인스턴스 학습을 기반으로 사용자 프로파일을 식별한다. 제안한 방법은 사용자가 작성한 텍스트 전체, 즉 텍스트 집합을 프로파일의 식별 단위로 간주한다. 다중 인스턴스 학습 알고리즘을 통해 프로파일 식별에 영향을 끼치지 않는 텍스트들이 자동으로 배재되므로 기존 연구에서 발생하는 성능 하락을 최소화할 수 있다. 총 5가지 속성(성별, 나이, 연애 유무 종교, 정치적 성향)에 대한 실험을 통해 제안한 방법이 텍스트 개별을 프로파일의 식별 단위로 삼는 기존 연구보다 더 좋은 성능을 보인다.

기타언어초록

This paper considers a user profile identification from social media text. Previous studies are based on the single-instance learning, that is, they regard a text as a instance which is a unit of user profile identification. Given a set of texts, user profile is identified by merging the results of texts. However, they are apt to achieve the low performance because some texts which are irrelevant to user profile affect the negative impact on the training and test. In order to solve this problem, the proposed method adopts a multi-instance learning which regards a set of texts as a unit of identification. With the multi-instance learning algorithm the proposed method automatically excludes some irrelevant texts. Our experiments on 5 attributes in gender, age, marital status, religion and political orientation show that the proposed method results in higher performance than the single-instance learning method.