一、引言 在推荐系统中,一个重要的任务不仅是预测用户是否会喜欢某个物品,还包括 找到与该物品相关的其他物品。 例如: 在电商网站上,用户正在浏览一双运动鞋,系统可能会推荐“相关商品”,如运动袜或同品牌的运动衣。 在视频网站上,用户看完一部爱情片,系统会推荐更多类似题材的影片。 这种“查找相关项目”的
一、均值归一化简介 均值归一化(Mean Normalization) 是一种常见的数据预处理方法。它的核心思想是:将原始数据减去其均值,使得数据的中心值变为 0,从而消除不同数据之间的整体偏移。 在推荐系统中,用户的打分习惯差异很大:有些用户习惯给高分,有些用户则普遍打低分。如果不做处理,模型可能
一、二元标签简介 在推荐系统中,并不是所有场景都会有用户的明确评分(比如 1 到 5 星)。更多时候,我们只能观察到用户是否产生了某种行为,例如是否点击、是否购买、是否点赞。这类数据往往用 二元标签(Binary labels) 来表示。 所谓二元标签,就是把用户的行为转化为 0/1 的结果: 1
一、协同过滤算法简介 协同过滤算法是一种常见的推荐系统方法,它的核心思想是“物以类聚,人以群分”。也就是说,如果两个用户在过去对某些物品的兴趣相似,那么他们对其他物品的兴趣也很可能相似。换句话说,用户的行为和偏好可以相互参考。 通俗理解: 就像你会向朋友请教电影推荐:如果你和朋友过去喜欢的电影很接近
一、用户—电影评分矩阵 在推荐系统中,最常见的任务就是预测用户对物品(这里是电影)的
一、概括 这篇文章主要围绕如何根据数据分布选择合适的特征展开。通过直方图和分布曲线对比,展示了非高斯分布的数据在经过对数、平方根、幂次等数学变换后,能够更接近高斯分布,从而提升模型的表现。文章强调了理解数据特征分布的重要性,并介绍了常见的特征变换方法,为构建更稳健的机器学习模型提供思路。 二、非高斯
一、异常检测与监督学习的核心区别
一、带标签数据在异常检测中的评估作用