输入“/”快速插入内容

Presto

1.Presto简介
1.1Presto概念
Presto是一个开源的分布式SQL查询引擎,数据量支持GB到PB字节,主要用来处理秒级查询的场景
注:虽然Presto可以解析SQL,但它不是一个标准的数据库。不是MySQL、Oracle的代替品,也不能用来处理在线事务(OLTP)
1.2Presto架构
Presto由一个Coordinator和多个Worker组成
1.3Presto优缺点
代码块
优点:
(1)Presto基于内存运算,减少硬盘IO,计算更快
(2)能够连接多个数据源,跨数据源连表查看,如从Hive查询大量网站访问记录,然后从Mysql中匹配出设备信息
缺点:
Pressto能够处理PB级别的海量数据分析,但Presto并不是把PB级数据都存放在内存中计算的,而是根据场景。
Count,AVG等聚合运算,是边读数据边计算,再清内存,再读数据,再计算,这种耗的内存并不高。
连表查询,可能产生大量的临时数据,速度会变慢
2.Presto安装
2.1Presto Server安装
1)官网地址
2)下载地址
3)解压到/opt/module
代码块
tar -zxvf presto-server-0.208.tar.gz -C /opt/module/
4)将文件更名为presto 并在presto目录下创建data,etc等文件夹
代码块
mv presto-server-0.208/ presto
...
cd presto
mkdir data
mkdir etc