Impala在处理结果集较大的查询的优势

来源：网络整理时间:2016-03-04 关键词:

本篇文章主要介绍了"Impala在处理结果集较大的查询的优势"，主要涉及到方面的内容，对于其他数据库感兴趣的同学可以参考一下：近期运营出报表，查询的数据量为15年的数据量，涉及的表及表中记录数如下图所示：刚开始的时候在MySQL中进行查询汇总，选择第一个数据量最...

近期运营出报表，查询的数据量为15年的数据量，涉及的表及表中记录数如下图所示：

刚开始的时候在MySQL中进行查询汇总，选择第一个数据量最小的表，发现MySQL 出现内存溢出，数据库使用的是腾讯云上的一台CDB，内存大小为24GB。后来将数据上传到hdfs上使用impala（数据格式为PARQUET）来查询，发现效果要好于MySQL，我们的impala是一个3节点集群，内存8GB，存储500GB SSD。查询耗时如下：

Impala在处理结果集较大的查询的优势

从查询的过程可以看出，impala在处理较大的数据集时有着MySQL所不具备的高性能。如果在MySQL中对5亿条记录做汇总，可能需要很高的配置了，而且运行时间不见得比impala短。

以上就介绍了Impala在处理结果集较大的查询的优势，包括了方面的内容，希望对其他数据库有兴趣的朋友有所帮助。

本文网址链接：http://www.codes51.com/article/detail_362215.html

上一篇：mysql 支持的存储引擎（极简版） 下一篇：基于sysbench-05的MySQL自动化压测及分析方案

Impala在处理结果集较大的查询的优势

相关图片

相关文章