一、强化学习定义 强化学习(Reinforcement Learning, RL)是一种机器学习方法,它强调智能体(Agent)通过与环境(Environment)的交互来学习。智能体在每个时刻会根据当前的状态(State, s)选择一个动作(Action, a),环境则会反馈一个奖励(Reward
一、引言 基于内容的过滤(Content-based Filtering)直接利用用户特征与物品特征来完成个性化推荐:把它们编码成向量,在同一空间里做匹配。相比只看行为的协同过滤,这种方法能在冷启动或侧信息丰富
一、引言 推荐系统(Recommender Systems)如今已经成为现代互联网平台的核心组成部分。无论是 电影平台 根据用户的观看记录推荐下一部影片,还是 电商平台 根据浏览与购买行为推送合适的商品,抑或是 社交媒体 自动推荐帖子与视频,这些系统都在深刻地影响着人们的日常生活。 推荐系统的目标往
一、引言 在现代推荐系统中,应用场景的规模往往非常庞大。比如: 电影平台可能拥有上千部以上的电影; 广告推荐系统需要从上百万广告中挑选; 音乐平台的歌曲数量轻松超过一千万;
一、引言 推荐系统在现代互联网应用中扮演着至关重要的角色,它们能够帮助用户从海量信息中快速找到感兴趣的内容。传统的推荐方法主要包括两类:协同过滤(Collaborative Filtering) 和 基于内容的过滤(Content-based Filtering)。其中,基于内容的过滤方法通过分析用
一、引言 在推荐系统中,一个重要的任务不仅是预测用户是否会喜欢某个物品,还包括 找到与该物品相关的其他物品。 例如: 在电商网站上,用户正在浏览一双运动鞋,系统可能会推荐“相关商品”,如运动袜或同品牌的运动衣。 在视频网站上,用户看完一部爱情片,系统会推荐更多类似题材的影片。 这种“查找相关项目”的
一、均值归一化简介 均值归一化(Mean Normalization) 是一种常见的数据预处理方法。它的核心思想是:将原始数据减去其均值,使得数据的中心值变为 0,从而消除不同数据之间的整体偏移。 在推荐系统中,用户的打分习惯差异很大:有些用户习惯给高分,有些用户则普遍打低分。如果不做处理,模型可能
一、二元标签简介 在推荐系统中,并不是所有场景都会有用户的明确评分(比如 1 到 5 星)。更多时候,我们只能观察到用户是否产生了某种行为,例如是否点击、是否购买、是否点赞。这类数据往往用 二元标签(Binary labels) 来表示。 所谓二元标签,就是把用户的行为转化为 0/1 的结果: 1