案例:使用Spark统计连续三周登录的用户数

假设有如下一个用户登录日志表:

+------+-------+-------------------+
|log_id|user_id|           log_time|
+------+-------+-------------------+
|     1|   1000|2022-03-10 10:08:13|
|     2|   1000|2022-03-18 10:33:22|
|     3|   1000|2022-03-26 18:59:19|
|     4|   1001|2022-03-03 20:59:13|
|     5|   1001|2022-03-10 05:53:49|
|     6|   1001|2022-02-26 02:27:51|
|     7|   1002|2022-03-01 20:59:13|
|     8|   1002|2022-03-07 05:53:49|
|     9|   1002|2022-02-28 02:27:51|
|    10|   1003|2022-02-27 20:59:13|
|    11|   1003|2022-03-05 05:53:49|
|    12|   1003|2022-03-12 02:27:51|
|    13|   1004|2022-02-28 20:59:13|
|    14|   1004|2022-03-05 05:53:49|
|    15|   1004|2022-03-18 02:27:51|
|    16|   1005|2022-02-25 20:59:13|
|    17|   1005|2022-03-04 05:53:49|
|    18|   1005|2022-03-11 02:27:51|
+------+-------+---------------- ......
          

......

抱歉,只有登录会员才可浏览!会员登录


《Spark原理深入与编程实战》