logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

2025年江苏省高职-大数据应用开发赛项_样题解析_任务A:离线数据处理-子任务三:指标计算

任务描述

编写Scala代码,使用Spark计算相关指标。

注:在指标计算中,不考虑订单信息表中order_status字段的值,将所有订单视为有效订单。计算订单金额或订单总金额时只使用final_total_amount字段。需注意dwd_ds_hudi所有的维表取最新的分区。

单击以下链接,快速查看相关内容:


子任务1

子任务1描述

1、请根据dwd_ds_hudi层的相关表,计算2020年销售量前10的商品,销售额前10的商品,存入ClickHouse数据库shtd_result的topten表中(表结构如下),然后在Linux的ClickHouse命令行中根据排名升序排序,查询出前5条,将SQL语句复制粘贴至客户端桌面【Release\任务A提交结果.docx】中对应的任务序号下,将执行结果截图粘贴至客户端桌面【Release\任务A提交结果.docx】中对应的任务序号下;

......

抱歉,只有登录会员才可浏览!会员登录