2022高职大数据竞赛模拟练习-模拟数据说明

为了更好地备战2022高职大数据竞赛,小白学苑组织大数据领域专家开发了本系列模拟练习案例教程。为了支持本案例,我们设计了一个样本数据库,用来模拟某商家商品零部件在线销售系统的数据库模式和数据。此数据库已嵌入在了小白学苑的PBCP(个人大数据竞赛平台)中。

模拟数据集数据量说明

下表列出了这个模拟数据集中的表数据条数。

表名 数据条数
customer 150000
lineitem 6001215
nation 25
orders 1500000
part 200000
partsupp 800000
region 5
supplier 10000
......

......

抱歉,只有登录会员才可浏览!会员登录


《PySpark原理深入与编程实战》