강좌
클라우드/리눅스에 관한 강좌입니다.
자격증 분류

NCE 자격증 이론정리 66편- Analytics 분야 -Impala 핵심요약

작성자 정보

  • 관리자 작성
  • 작성일

컨텐츠 정보

본문

Impala 핵심요약

 

 

-Hive의 실시간성 query 성능 문제를 해결하기위해 Cloudera에서 개발하여 opensource화함

 

-대규모 병렬 처리 엔진

 

-Datawarehouse 분야 뿐만 아니라 실시간 데이터 분석을 위한 구성에도 사용 가능

 

-Hadoop or Cloud Storage에 저장된 대용량 데이터셋에 대한 고속 대화형 SQL 쿼리를 통해 데이터 분석업무에서 원하는 데이터를 빠르고 쉽게 얻을 수 있다.

 

-보통 Data Mart에서 많이 활용

 

-속도와 효율에 초점을 맞추므로 자체 분산 Query Engine을 사용한다.

 

-Impala에서는 데이터가 분산 연산자 트리를 스트림으로 통과하면서 처리된다.

 

-Text File, HBase 테이블 , Avro 등 다양한 데이터 소스를 지원한다.

 

관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,037 명
  • 현재 강좌수 :  35,806 개
  • 현재 접속자 :  94 명