欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

一个典型的impala查询实际应用例子

时间:2023-06-20

使用的三个表如下:

items:商品详细信息表,即商品维度表,记录数100W左右。
item_orders:每日增加的订单记录,事实表,每日新增记录大约为100W。
orders:订单维度表,包含每一个订单实时的信息,记录数为1亿。
该查询实现这样的需求:查询2021年五一三天假期中满足一定条件购买次数TOP 100的商品,条件为:商品的类目属于指定四类,商品的订单状态是1、2两种并且这三天购买的人数大于1000。
SQL:

select * from bigdata_report_dev.bigdata_db_table_test,zhoucx_test.check1_mysql_batchselect t1.goods_id, t1.title, count(1) as ba from items t1join item_orders t2on t1.goods_id = t2.goods_idwhere t2.day >= '2021-04-29' and t2.day <= '2021-05-01' and t1.cat1_id in ('438', '437', '440', '381') and t2.order_id in (select order_id from orders where order_status in ('1','2'))group by t1.goods_id, t1.title having count(distinct t2.buy_account) > 1000order by ba desc limit 100

这个查询是一个典型的OLAP分析查询,从SQL结构上看,包括了多个join,子查询,过滤信息和聚合操作。

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。