2023广东省赛样题解析-实时数据处理:实时指标计算_子任务2
任务描述
2、 使用Flink消费kafka中的数据,统计商城每分钟的GMV,将结果存入redis中(value为字符串格式,仅存GMV),key为store_gmv,使用redis cli以get key方式获取store_gmv值,将每次截图粘贴至对应报告中(每分钟查询一次,查询3次)。
任务分析
术语GMV
GMV(全称Gross Merchandise Volume),即商品交易总额 ,是成交总额(一定时间段内)的意思。
请注意GMV和实际交易额的区别。
GMV:那些只要下单付款的订单金额,就会被计入到GMV当中,管你取消不取消订单、拒不拒收货物、退不退货呢;
实际交易额:只有买家收到货并确认收货,事后也不退款的订单金额,才能被计入到实际交易额中。
GMV在电商中是一个非常重要的指标,但不同的电商对于GMV的算法完全不一样;算法不同,计算出的数据也千差万别。
根据题意,我们可以得出以下几点:
(1) 使用订单表order_master进行统计:只取payment_money字段即可。
(2) 只统计订单状态(order_status)为“已付款”的订单的支付金额。
(3) 统计“每分钟”的GMV,意味着使用1分钟大小的滚动窗口。
实现代码
Flink流处理程序实现代码如下:
会员登录