강좌
클라우드/리눅스에 관한 강좌입니다.
자격증 분류

NCE 자격증 이론정리 65편- Analytics 분야 -Presto 핵심요약

작성자 정보

  • 관리자 작성
  • 작성일

컨텐츠 정보

본문

Presto 핵심요약

 

-분산 SQL 쿼리 엔진을 사용하여 분석할 수 있는 툴


-SQL을 지원하며 데이터 분석가와 개발자가 매우 쉽게 사용할 수 있도록 개발


-PB급의 대규모 데이터를 처리하기 위해서는 Presto를 사용하는 것이 적합


-Pig, Hive와 달리 별도의 Presto 쿼리 실행엔진 구현되어 있음 -> 단계별 DISK write하지 않고 메모리서 메모리로 데이터를 전달하는 구조여서 Hive보다 빠름


-ETL없이 바로 스토리지에 접근할 수 있는 장점도 있다.


-다만 HDFS에 대한 지원은 Impala에 비해 부족하다.


-HDFS, Hive, Cassandra, RDBMS, S3 다양한 소스로부터 데이터를 읽어올 수 있다.


-Presto를 넘어 Trino도 많이 활용되고있다.


-인터렉티브한 분석에 사용됨


-Tableau와 같은 BI Tool에 연동하기 적합함

 

 

관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,037 명
  • 현재 강좌수 :  35,806 개
  • 현재 접속자 :  116 명