기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
가상화 환경에서 리듀스 태스크 개수가 I/O 중심 맵리듀스 응용 프로그램의 성능에 미치는 영향
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 가상화 환경에서 리듀스 태스크 개수가 I/O 중심 맵리듀스 응용 프로그램의 성능에 미치는 영향
저자명
김윤호,정혜진,최원석,김준모,최종무,Kim. Yoon Ho,Chung. Hae Jin,Choi. Won Suk,Kim. Joon Mo,Choi. Jong Moo
간행물명
정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
권/호정보
2013년|19권 7호|pp.403-407 (5 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

고성능 하드웨어 컴퓨팅 자원의 가용성을 높이기 위한 소프트웨어 기술로 가상화 기술이 주목 받고 있다. 이와 함께 점차 심화되고 있는 대용량 데이터 처리에 대한 솔루션으로 하둡과 맵리듀스가 있다. 본 논문에서는 이러한 대용량 데이터 분산 처리 시스템을 가상화 클러스터 환경에 적용하고, 가상화 클러스터 환경에서의 대용량 데이터 분산 처리 성능을 향상시키기 위한 연구로 하둡에 존재하는 200여개의 환경 설정 변수에 주목하였다. 최적의 환경 설정 변수를 찾기 위해 다양한 실험이 수행되었으며 최적의 Reduce 태스크 수에 큰 영향을 주는 두 가지 요인에 대한 추가 실험과 결과에 대해 기술한다.

기타언어초록

Software technology to increase the availability of high-performance hardware computing resources for the virtualization technology is getting attention. Hadoop and MapReduce is the solution for increasingly large data processing. In this paper, we apply this large distributed data processing system to the virtualized cluster environment, and focus set of more than 200 configuration variables that exist in the Hadoop for research to improve the performance of distributed processing of large amounts of data in a virtualized cluster environment. Many experiments were performed to find the optimal configuration variables. We describe about the experiments and the results of the two factors that have a significant impact on the optimal number of Reduce tasks.