logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

2022-2023赛季高职大数据竞赛(样题解析)-数据挖掘-任务四:推荐系统(二)

任务描述

1、根据上述任务的结果,对其进行SVD分解,对数据进行降维保留至少保留前95%的信息量,根据该用户customer_id为5811的用户已购买的商品分别与未购买的商品计算余弦相似度再进行累加求均值,将均值最大的5件商品id进行输出作为推荐使用。将结果输出。

结果格式如下:

------------------------推荐Top5结果如下------------------------
相似度top1(商品id:1,平均相似度:0.983456)
相似度top2(商品id:71,平均相似度:0.782672)
相似度top3(商品id:22,平均相似度:0.7635246)
相似度top4(商品id:351,平均相似度:0.7335748)
相似度top5(商品id:14,平均相似度:0.522356)

实现原理

降维是减少考虑的变量数量的过程。它可以用来从原始的和有噪声的特征中提取潜在的特征或压缩数据,同时保持结构。

SVD(奇异值分解)的重点是提出一组低秩矩阵(通常是三个),它近似于原始矩阵,但数据少得多,而不是选择使用大型M × N矩阵。

SVD降维算法实现原理,如下图所示:

SVD是一种简单的线性代数技术,它将 ......

......

抱歉,只有登录会员才可浏览!会员登录