2022-2023赛季高职大数据竞赛(样题解析)-离线数据处理-任务三:指标计算

任务描述

使用Scala编写spark工程代码,并计算相关指标。

注:与订单金额计算相关使用order_money字段,同一个订单无需多次重复计算,需要考虑退款或者取消的订单。

本任务中的子任务较多(共10个子任务),请点击以下链接直接查看相关子任务:

启动Hive Metastore服务

如果想要Spark能读写Hive中的数据表,需要访问Metastore服务。在终端中执行如下命令: < ......

......

抱歉,只有登录会员才可浏览!会员登录


《PySpark原理深入与编程实战》