logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

2023浙江省赛样题解析-实时数据处理:实时指标计算_子任务2

任务描述

2、 使用Flink消费kafka中的数据,统计商城每分钟的GMV,将结果存入redis中(value为字符串格式,仅存GMV),key为store_gmv,使用redis cli以get key方式获取store_gmv值,将每次截图粘贴至对应报告中(每分钟查询一次,查询3次)。

任务分析

术语GMV

GMV(全称Gross Merchandise Volume),即商品交易总额 ,是成交总额(一定时间段内)的意思。

请注意GMV和实际交易额的区别。

GMV:那些只要下单付款的订单金额,就会被计入到GMV当中,管你取消不取消订单、拒不拒收货物、退不退货呢;

实际交易额:只有买家收到货并确认收货,事后也不退款的订单金额,才能被计入到实际交易额中。

GMV在电商中是一个非常重要的指标,但不同的电商对于GMV的算法完全不一样;算法不同,计算出的数据也千差万别。

根据题意,我们可以得出以下几点:

(1) 使用订单表order_master进行统计:只取payment_money字段即可。

(2) 只统计订单状态(order_status)为“已付款”的订单的支付金额。

(3) 统计“每分钟”的GMV,意味着使用1分钟大小的滚动窗口。

实现代码

Flink流处理程序实现代码如下:

会员登录