用户消费行为分析:复购率和回购率计算

下面我们演示一个使用Hive来统计某电商用户消费行为的案例。主要包括内容:

    创建Hive表结构,并加载数据;
  • 统计不同月份的下单人数;
  • 统计每个月的复购率;
  • 统计每个月的回购率。

数据集说明

在PBLP平台的~/data/hive/user_order/目录下,我们提供了两个数据文件。一个是订单数据文件order_info_utf.csv,一个是用户数据文件user_info_utf.csv。其中:

order_info_utf.csv数据格式如下:

订单id,用户id,支付状态,支付价格,日期
1,11211,已支付,833,2016/3/1 0:04
2,11211,已支付,487,2016/3/1 0:03
3,11211,未支付,794,
4,74553,已支付,737,2016/3/1 0:02
5,37799,已支付,647,2016/3/1 0:01
...

user_info_utf.csv数据格式如下:

用户id,性别,出生日期
1,女,1969/1/21
2,女,1978/9/6
3,男,1973/9/3
4,女,1982/4/27
5,男,1970/7/30
...

创建Hive表结构,并加载数据

首先创建订单信息表orderinfo:

......

......

抱歉,只有登录会员才可浏览!会员登录


《Spark原理深入与编程实战》