用户消费行为分析:复购率和回购率计算
下面我们演示一个使用Hive来统计某电商用户消费行为的案例。主要包括内容:
- 创建Hive表结构,并加载数据;
- 统计不同月份的下单人数;
- 统计每个月的复购率;
- 统计每个月的回购率。
数据集说明
在PBLP平台的~/data/hive/user_order/目录下,我们提供了两个数据文件。一个是订单数据文件order_info_utf.csv,一个是用户数据文件user_info_utf.csv。其中:
order_info_utf.csv数据格式如下:
订单id,用户id,支付状态,支付价格,日期 1,11211,已支付,833,2016/3/1 0:04 2,11211,已支付,487,2016/3/1 0:03 3,11211,未支付,794, 4,74553,已支付,737,2016/3/1 0:02 5,37799,已支付,647,2016/3/1 0:01 ...
user_info_utf.csv数据格式如下:
用户id,性别,出生日期 1,女,1969/1/21 2,女,1978/9/6 3,男,1973/9/3 4,女,1982/4/27 5,男,1970/7/30 ...
创建Hive表结构,并加载数据
首先创建订单信息表orderinfo:
............
抱歉,只有登录会员才可浏览!会员登录