抱歉,只有登录会员才可浏览!<a href='/member/login'>会员登录</a>

赛题模拟实现-离线数据统计

本系列共分五篇,内容分别为:

具体内容

使用Scala语言编写程序获取ODS层指定分区表中的数据进行清洗,并完成销量前5的商品统计、某月的总销售额统计、指定月份的销售额统计、各用户在线总时长统计,并将统计后的数据存入MySQL数据库中。

实现原理

数据仓库概念图:

实现过程

1) 数据清洗任务。

< ......

......

抱歉,只有登录会员才可浏览!会员登录


《PySpark原理深入与编程实战》